Ssylka

Нужен ли OpenAI повод для беспокойства из-за DeepSeek?

DeepSeek-r1, новая open-source LLM, вызвала ажиотаж благодаря впечатляющим результатам, достигнутым с относительно небольшими затратами. В основе успеха DeepSeek лежит техника дистилляции, позволяющая обучать компактные модели на данных, сгенерированных более крупными моделями, такими как ChatGPT. Это позволило значительно сократить расходы на разметку данных, традиционно являющиеся одним из самых затратных этапов обучения LLM.
Нужен ли OpenAI повод для беспокойства из-за DeepSeek?
Изображение носит иллюстративный характер

Однако паника на рынке, вызванная появлением DeepSeek, представляется преувеличенной. Несмотря на впечатляющий прогресс, DeepSeek не демонстрирует превосходства над GPT-4o и Gemini-2 во всех задачах. Более того, заявленные затраты в 6 миллионов долларов отражают лишь финальный этап дообучения, не учитывая стоимость существующей инфраструктуры, предварительных разработок и команды.

Главное достижение DeepSeek заключается не в создании «дешевого AI", а в демонстрации новых, более эффективных подходов к разработке LLM. Компания открыла исходный код модели и механику обучения, позволяя другим командам по всему миру вносить улучшения и находить новые подходы. Этот open-source подход может стать переломным моментом в развитии AI.

Китайская компания DeepSeek, созданная выходцами из квантового хедж-фонда, воспользовалась накопленной инфраструктурой и отсутствием бюрократии для быстрого развития. Успех DeepSeek показывает, что даже при ограниченных ресурсах можно создавать конкурентоспособные LLM, если использовать инновационные подходы и активно делиться своими знаниями с сообществом.


Новое на сайте

18763Зачем черепахам панцирь: для защиты или рытья нор, и все ли умеют в нем прятаться? 18762Почему критическая уязвимость шестилетней давности в роутерах Sierra Wireless угрожает... 18761Как подросток пережил атаку льва 6200 лет назад и почему его похоронили как опасного... 18760Почему случайные травмы превращаются в вечные рисунки на теле? 18759Почему Apple экстренно закрывает уязвимости, используемые для атак на конкретных людей? 18758Какие открытия от Марса до темной материи меняют научную картину мира? 18757Как ультрагорячая супер-Земля TOI-561 b сумела сохранить плотную атмосферу в... 18756Третий межзвездный странник 3I/ATLAS меняет цвет и проявляет аномальную активность 18754Раскопки виселицы XVI века и массовых захоронений казненных мятежников в Гренобле 18753Почему скрытая инфекция убила гигантского крокодила Кассиуса после 40 лет жизни в неволе? 18752Первая церемония Global Space Awards в Лондоне определила лидеров космической индустрии 18751Как новые фишинговые инструменты BlackForce, GhostFrame и гибридные атаки 2025 года... 18750Колоссальная «зеленая стена» Китая: полувековая битва с наступлением пустынь 18749Как превратить браузер в надежный центр управления безопасностью GenAI и предотвратить...