Как рост ресурсов повлиял на развитие ИИ?

Современный прогресс в области искусственного интеллекта обусловлен в большей степени увеличением масштаба систем, чем фундаментальными научными открытиями. Масштабирование предполагает увеличение объема обучающих данных, размера моделей (параметров) и вычислительных ресурсов, необходимых для обучения. Увеличение всех трех параметров приводит к более эффективным и многофункциональным ИИ.
Как рост ресурсов повлиял на развитие ИИ?
Изображение носит иллюстративный характер

ИИ модели работают как сложные системы распознавания закономерностей. Чем больше данных они получают, тем больше они узнают о нюансах и сложностях предметной области. Объем данных, используемый для обучения ИИ, вырос с 40 точек данных в 1950 году до триллионов в современных системах. Для примера, набор данных для обучения GPT-4 эквивалентен в 2000 раз больше всего текста английской Википедии.

Для эффективного обучения на данных ИИ моделям нужны параметры. Параметры модели можно рассматривать как «ручки», которые можно настраивать для улучшения обработки и прогнозирования информации. Ранние нейронные сети имели сотни или тысячи параметров, а современные крупные модели, такие как GPT-3, имеют 175 миллиардов параметров. С 2010 года количество параметров в моделях ИИ удваивалось ежегодно.

Рост данных и параметров также увеличивает вычислительные потребности. Ранние модели могли тренироваться часами, а современные модели требуют сотен дней непрерывных вычислений даже с десятками тысяч специализированных компьютеров. Вычисления, данные и параметры взаимосвязаны, и увеличение одного параметра должно сопровождаться увеличением других.


Новое на сайте

19181Как критическая уязвимость в телефонах Grandstream открывает хакерам доступ к... 19180Почему операционная непрерывность становится единственным ответом на перманентную... 19179Критические уязвимости в популярных расширениях VS Code угрожают миллионам разработчиков 19178Как внедрить интеллектуальные рабочие процессы и почему 88% проектов ИИ терпят неудачу? 19177Критическая уязвимость нулевого дня в Dell RecoverPoint открывает злоумышленникам полный... 19176Notepad++ внедряет механизм двойной блокировки для защиты от атак группировки Lotus Panda 19175Новые угрозы в каталоге CISA: от критических дыр в Chrome и Zimbra до возвращения червя... 19174Использование чат-ботов Copilot и Grok в качестве скрытых прокси-серверов для управления... 19173Троянизированный сервер Oura MCP атакует разработчиков через поддельные репозитории GitHub 19172Способен ли искусственный интеллект заменить интуицию Уоррена Баффета в биологической... 19171Вредоносное по VoidLink: созданная с помощью ИИ угроза для облачных систем и финансового... 19170Палеонтологические поиски и научные убеждения Томаса Джефферсона 19169Спасут ли обновленные протоколы безопасности npm от атак на цепочки поставок? 19168Почему критическая уязвимость BeyondTrust и новые записи в каталоге CISA требуют... 19167Севернокорейская хакерская группировка Lazarus маскирует вредоносный код под тестовые...
Ссылка