Новая эра искусственного интеллекта: победа алгоритмов над мощностью

Китайская нейросеть DeepSeek вызвала обвал акций NVIDIA, продемонстрировав, что прогресс в ИИ может быть достигнут за счет более эффективных алгоритмов, а не только увеличения вычислительных мощностей. DeepSeek, обученная всего за 6 миллионов долларов, превзошла западные аналоги, что стало возможным благодаря использованию улучшенного алгоритма обучения с подкреплением (GRPO) и архитектуры Mixture of Experts (MoE). Это показывает, что стоимость обучения и работы ИИ может быть значительно снижена.
Новая эра искусственного интеллекта: победа алгоритмов над мощностью
Изображение носит иллюстративный характер

DeepSeek использует лишь 37 миллиардов параметров из 671 миллиардов, активируя только необходимые части модели для выполнения задачи, что позволило снизить стоимость обработки токена в 27 раз по сравнению с OpenAI. Такой подход ставит под сомнение "Bitter Lesson" – принцип, согласно которому, рост ИИ возможен только за счет увеличения вычислительных ресурсов. DeepSeek доказывает, что оптимизация методов обучения может кардинально уменьшить затраты.

Успех DeepSeek – это сигнал о том, что технологическое лидерство в области ИИ перестает быть исключительной привилегией западных компаний. Если ранее рост NVIDIA был основан на постоянном спросе на GPU для обучения моделей, то теперь, инвесторам и игрокам рынка необходимо пересмотреть прогнозы и сфокусироваться на разработке более эффективных алгоритмов. Это открывает новые возможности для конкурентов и ставит под сомнение долгосрочную монополию NVIDIA.

Несмотря на кратковременный обвал акций NVIDIA, компания по-прежнему лидирует на рынке GPU, благодаря стандарту CUDA, который используется практически во всех ML-проектах. При этом, новые разработки, такие как DeepSeek, ставят под сомнение текущую парадигму. Будущее технологий в ИИ будет зависеть как от железа, так и от алгоритмов, а компании, способные оптимизировать свои ресурсы, получат значительное конкурентное преимущество.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка