Способны ли Radeon RX 7900 конкурировать с NVIDIA в ИИ-вычислениях и зачем ИИ в настольных играх?

Тестирование связки из четырех видеокарт AMD Radeon RX 7900 XTX показало их пригодность для инференса языковых моделей, особенно в сценариях с большим объемом видеопамяти. Хотя по скорости они в среднем на 20% уступают NVIDIA RTX 4090, но стоимость решения с несколькими картами AMD может быть более выгодной. Поддержка FP16 и квантованных моделей работает хорошо, а вот FP8 пока не поддерживается на Radeon, но это критично в основном для графики и vision-моделей.
Способны ли Radeon RX 7900 конкурировать с NVIDIA в ИИ-вычислениях и зачем ИИ в настольных играх?
Изображение носит иллюстративный характер

Эксперименты с разными языковыми моделями, включая Gemma, T-Pro и Llama, выявили, что для корректной работы на нескольких GPU требуется настройка параметров ядра Linux (IOMMU). Разные модели показали разную скорость и качество ответов, причем российские модели лучше справлялись с русским языком. Однако, все модели, включая GigaChat Max от Сбера, продемонстрировали ошибки при использовании в роли игрового бота в настольной игре.

Интеграция ИИ в настольные игры продемонстрировала, что даже базовые модели способны генерировать непредсказуемое поведение, что может сделать игру интереснее и сложнее по сравнению с традиционными ботами, работающими по заданным программам. Выявлены проблемы с пониманием промтов, требующие дальнейшей доработки, возможно, с использованием отдельных промтов для каждой модели, что, в частности, позволит избавиться от путаницы с правой и левой сторонами игрового поля.

ROCm, программная платформа для работы с GPU от AMD, значительно улучшилась, и теперь делает возможным использование этих карт для работы с нейросетями в многопроцессорной конфигурации. Применение ИИ в настольных играх открывает возможности для создания чат-ботов и мобильных помощников, которые могут управлять игровыми персонажами и создавать более сложные и динамичные игровые сценарии.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка