Меню

Нужен ли OpenAI повод для беспокойства из-за DeepSeek?

Корнэль

DeepSeek-r1, новая open-source LLM, вызвала ажиотаж благодаря впечатляющим результатам, достигнутым с относительно небольшими затратами. В основе успеха DeepSeek лежит техника дистилляции, позволяющая обучать компактные модели на данных, сгенерированных более крупными моделями, такими как ChatGPT. Это позволило значительно сократить расходы на разметку данных, традиционно являющиеся одним из самых затратных этапов обучения LLM.
Нужен ли OpenAI повод для беспокойства из-за DeepSeek?

Нужен ли OpenAI повод для беспокойства из-за DeepSeek?

Изображение носит иллюстративный характер

Однако паника на рынке, вызванная появлением DeepSeek, представляется преувеличенной. Несмотря на впечатляющий прогресс, DeepSeek не демонстрирует превосходства над GPT-4o и Gemini-2 во всех задачах. Более того, заявленные затраты в 6 миллионов долларов отражают лишь финальный этап дообучения, не учитывая стоимость существующей инфраструктуры, предварительных разработок и команды.

Главное достижение DeepSeek заключается не в создании «дешевого AI", а в демонстрации новых, более эффективных подходов к разработке LLM. Компания открыла исходный код модели и механику обучения, позволяя другим командам по всему миру вносить улучшения и находить новые подходы. Этот open-source подход может стать переломным моментом в развитии AI.

Китайская компания DeepSeek, созданная выходцами из квантового хедж-фонда, воспользовалась накопленной инфраструктурой и отсутствием бюрократии для быстрого развития. Успех DeepSeek показывает, что даже при ограниченных ресурсах можно создавать конкурентоспособные LLM, если использовать инновационные подходы и активно делиться своими знаниями с сообществом.

Источник: ZergsLaw

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Зачем черепахам панцирь: для защиты или рытья нор, и все ли умеют в нем прятаться?

Почему критическая уязвимость шестилетней давности в роутерах Sierra Wireless угрожает...

Как подросток пережил атаку льва 6200 лет назад и почему его похоронили как опасного...

Почему случайные травмы превращаются в вечные рисунки на теле?

Почему Apple экстренно закрывает уязвимости, используемые для атак на конкретных людей?

Какие открытия от Марса до темной материи меняют научную картину мира?

Как ультрагорячая супер-Земля TOI-561 b сумела сохранить плотную атмосферу в...

Третий межзвездный странник 3I/ATLAS меняет цвет и проявляет аномальную активность

Раскопки виселицы XVI века и массовых захоронений казненных мятежников в Гренобле

Почему скрытая инфекция убила гигантского крокодила Кассиуса после 40 лет жизни в неволе?

Первая церемония Global Space Awards в Лондоне определила лидеров космической индустрии

Как новые фишинговые инструменты BlackForce, GhostFrame и гибридные атаки 2025 года...

Колоссальная «зеленая стена» Китая: полувековая битва с наступлением пустынь

Как превратить браузер в надежный центр управления безопасностью GenAI и предотвратить...

Меню

МенюЗакрыть