Новая эра искусственного интеллекта: победа алгоритмов над мощностью

Китайская нейросеть DeepSeek вызвала обвал акций NVIDIA, продемонстрировав, что прогресс в ИИ может быть достигнут за счет более эффективных алгоритмов, а не только увеличения вычислительных мощностей. DeepSeek, обученная всего за 6 миллионов долларов, превзошла западные аналоги, что стало возможным благодаря использованию улучшенного алгоритма обучения с подкреплением (GRPO) и архитектуры Mixture of Experts (MoE). Это показывает, что стоимость обучения и работы ИИ может быть значительно снижена.
Новая эра искусственного интеллекта: победа алгоритмов над мощностью
Изображение носит иллюстративный характер

DeepSeek использует лишь 37 миллиардов параметров из 671 миллиардов, активируя только необходимые части модели для выполнения задачи, что позволило снизить стоимость обработки токена в 27 раз по сравнению с OpenAI. Такой подход ставит под сомнение "Bitter Lesson" – принцип, согласно которому, рост ИИ возможен только за счет увеличения вычислительных ресурсов. DeepSeek доказывает, что оптимизация методов обучения может кардинально уменьшить затраты.

Успех DeepSeek – это сигнал о том, что технологическое лидерство в области ИИ перестает быть исключительной привилегией западных компаний. Если ранее рост NVIDIA был основан на постоянном спросе на GPU для обучения моделей, то теперь, инвесторам и игрокам рынка необходимо пересмотреть прогнозы и сфокусироваться на разработке более эффективных алгоритмов. Это открывает новые возможности для конкурентов и ставит под сомнение долгосрочную монополию NVIDIA.

Несмотря на кратковременный обвал акций NVIDIA, компания по-прежнему лидирует на рынке GPU, благодаря стандарту CUDA, который используется практически во всех ML-проектах. При этом, новые разработки, такие как DeepSeek, ставят под сомнение текущую парадигму. Будущее технологий в ИИ будет зависеть как от железа, так и от алгоритмов, а компании, способные оптимизировать свои ресурсы, получат значительное конкурентное преимущество.


Новое на сайте

19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса 19197Скрытые бэкдоры в цепочках поставок по: атаки через вредоносные пакеты NuGet и npm 19196Как абсолютная самоотдача, отказ от эго и физиологическое переосмысление тревоги помогают... 19195Отказ от стратегии гладиаторов как главный драйвер экспоненциального роста корпораций
Ссылка