Ssylka

Нужен ли OpenAI повод для беспокойства из-за DeepSeek?

DeepSeek-r1, новая open-source LLM, вызвала ажиотаж благодаря впечатляющим результатам, достигнутым с относительно небольшими затратами. В основе успеха DeepSeek лежит техника дистилляции, позволяющая обучать компактные модели на данных, сгенерированных более крупными моделями, такими как ChatGPT. Это позволило значительно сократить расходы на разметку данных, традиционно являющиеся одним из самых затратных этапов обучения LLM.
Нужен ли OpenAI повод для беспокойства из-за DeepSeek?
Изображение носит иллюстративный характер

Однако паника на рынке, вызванная появлением DeepSeek, представляется преувеличенной. Несмотря на впечатляющий прогресс, DeepSeek не демонстрирует превосходства над GPT-4o и Gemini-2 во всех задачах. Более того, заявленные затраты в 6 миллионов долларов отражают лишь финальный этап дообучения, не учитывая стоимость существующей инфраструктуры, предварительных разработок и команды.

Главное достижение DeepSeek заключается не в создании «дешевого AI", а в демонстрации новых, более эффективных подходов к разработке LLM. Компания открыла исходный код модели и механику обучения, позволяя другим командам по всему миру вносить улучшения и находить новые подходы. Этот open-source подход может стать переломным моментом в развитии AI.

Китайская компания DeepSeek, созданная выходцами из квантового хедж-фонда, воспользовалась накопленной инфраструктурой и отсутствием бюрократии для быстрого развития. Успех DeepSeek показывает, что даже при ограниченных ресурсах можно создавать конкурентоспособные LLM, если использовать инновационные подходы и активно делиться своими знаниями с сообществом.


Новое на сайте

18666Почему мы отрицаем реальность, когда искусственный интеллект уже лишил нас когнитивного... 18665Химический след Тейи раскрыл тайну происхождения луны в ранней солнечной системе 18664Раскрывает ли извергающаяся межзвездная комета 3I/ATLAS химические тайны древней... 18663Масштабная кампания ShadyPanda заразила миллионы браузеров через официальные обновления 18662Как помидорные бои и персонажи Pixar помогают лидерам превратить корпоративную культуру 18661Как астероид 2024 YR4 стал первой исторической проверкой системы планетарной защиты и... 18660Агентные ИИ-браузеры как троянский конь новой эры кибербезопасности 18659Многовековая история изучения приливов от античных гипотез до синтеза Исаака Ньютона 18658Как выглядела защита от солнца римских легионеров в Египте 1600 лет назад? 18657Хакеры ToddyCat обновили арсенал для тотального взлома Outlook и Microsoft 365 18656Асимметрия безопасности: почему многомиллионные вложения в инструменты детекции не... 18655Как безопасно использовать репозитории Chocolatey и Winget, не подвергая инфраструктуру... 18654Масштабная утечка конфиденциальных данных через популярные онлайн-форматеры кода 18653Как расширение списка жертв взлома Gainsight связано с запуском вымогателя ShinySp1d3r 18652Как расширение Crypto Copilot незаметно похищает средства пользователей Solana на...