Ssylka

Нужен ли OpenAI повод для беспокойства из-за DeepSeek?

DeepSeek-r1, новая open-source LLM, вызвала ажиотаж благодаря впечатляющим результатам, достигнутым с относительно небольшими затратами. В основе успеха DeepSeek лежит техника дистилляции, позволяющая обучать компактные модели на данных, сгенерированных более крупными моделями, такими как ChatGPT. Это позволило значительно сократить расходы на разметку данных, традиционно являющиеся одним из самых затратных этапов обучения LLM.
Нужен ли OpenAI повод для беспокойства из-за DeepSeek?
Изображение носит иллюстративный характер

Однако паника на рынке, вызванная появлением DeepSeek, представляется преувеличенной. Несмотря на впечатляющий прогресс, DeepSeek не демонстрирует превосходства над GPT-4o и Gemini-2 во всех задачах. Более того, заявленные затраты в 6 миллионов долларов отражают лишь финальный этап дообучения, не учитывая стоимость существующей инфраструктуры, предварительных разработок и команды.

Главное достижение DeepSeek заключается не в создании «дешевого AI", а в демонстрации новых, более эффективных подходов к разработке LLM. Компания открыла исходный код модели и механику обучения, позволяя другим командам по всему миру вносить улучшения и находить новые подходы. Этот open-source подход может стать переломным моментом в развитии AI.

Китайская компания DeepSeek, созданная выходцами из квантового хедж-фонда, воспользовалась накопленной инфраструктурой и отсутствием бюрократии для быстрого развития. Успех DeepSeek показывает, что даже при ограниченных ресурсах можно создавать конкурентоспособные LLM, если использовать инновационные подходы и активно делиться своими знаниями с сообществом.


Новое на сайте

16943От сада чудес до протеина из атмосферы 16942Кратковременный сон наяву: научное объяснение пустоты в мыслях 16941Спутники Starlink создают непреднамеренную угрозу для радиоастрономии 16940Аутентификационная чума: бэкдор Plague год оставался невидимым 16939Фиолетовый страж тайских лесов: редкий краб-принцесса явился миру 16938Хроники мангровых лесов: победители фотоконкурса 2025 года 16937Танцевали ли планеты солнечной системы идеальный вальс? 16936Ай-ай: причудливый лемур, проклятый своим пальцем 16935Как рентгеновское зрение раскрывает самые бурные процессы во вселенной? 16934Уязвимость нулевого дня в SonicWall VPN стала оружием группировки Akira 16933Может ли государственный фонд единолично решать судьбу американской науки? 16932Способна ли филантропия блогеров решить мировой водный кризис? 16931Взлом через промпт: как AI-редактор Cursor превращали в оружие 16930Мог ли древний кризис заставить людей хоронить мертвых в печах с собаками? 16929Какие наушники Bose выбрать на распродаже: для полной изоляции или контроля над...