Ssylka

Нужен ли OpenAI повод для беспокойства из-за DeepSeek?

DeepSeek-r1, новая open-source LLM, вызвала ажиотаж благодаря впечатляющим результатам, достигнутым с относительно небольшими затратами. В основе успеха DeepSeek лежит техника дистилляции, позволяющая обучать компактные модели на данных, сгенерированных более крупными моделями, такими как ChatGPT. Это позволило значительно сократить расходы на разметку данных, традиционно являющиеся одним из самых затратных этапов обучения LLM.
Нужен ли OpenAI повод для беспокойства из-за DeepSeek?
Изображение носит иллюстративный характер

Однако паника на рынке, вызванная появлением DeepSeek, представляется преувеличенной. Несмотря на впечатляющий прогресс, DeepSeek не демонстрирует превосходства над GPT-4o и Gemini-2 во всех задачах. Более того, заявленные затраты в 6 миллионов долларов отражают лишь финальный этап дообучения, не учитывая стоимость существующей инфраструктуры, предварительных разработок и команды.

Главное достижение DeepSeek заключается не в создании «дешевого AI", а в демонстрации новых, более эффективных подходов к разработке LLM. Компания открыла исходный код модели и механику обучения, позволяя другим командам по всему миру вносить улучшения и находить новые подходы. Этот open-source подход может стать переломным моментом в развитии AI.

Китайская компания DeepSeek, созданная выходцами из квантового хедж-фонда, воспользовалась накопленной инфраструктурой и отсутствием бюрократии для быстрого развития. Успех DeepSeek показывает, что даже при ограниченных ресурсах можно создавать конкурентоспособные LLM, если использовать инновационные подходы и активно делиться своими знаниями с сообществом.


Новое на сайте

8767Криптовалютные кошельки под прицелом: как хакеры из Lazarus Group вербуют жертв через... 8766Динамические Sheet-ы в SwiftUI с автоматическим определением высоты для iOS 15+ 8765Сколько чудес скрывает мир животных? Проверьте свои знания! 8764Стоит ли рискнуть ради обновленных Bose Ultra Open Earbuds: спасение для ушей или... 8763Топливные аппетиты Америки: почему США не экономят бензин? 8762Solar Quest: графовая платформа для киберучений и развития навыков иб 8761Ледяной армагеддон надвигается на средний Запад и Северо-Восток США: города готовятся к... 8760Параллельная реализация A на Rust для поиска оптимального пути 8759Как языческие ритуалы повлияли на раннее средневековье в Нидерландах? 8758Обманчивая безопасность: как муляжи камер видеонаблюдения защищают ваш дом 8757Неужели тайные реки Антарктиды предрекают судьбу мирового океана? 8756Workday делает ставку на искусственный интеллект, сокращая 1750 рабочих мест 8755Новый вид Paranthropus capensis меняет представление об эволюции человека 8754Оптимизация ИТ-инфраструктуры цод: кейс "Датахаты" и решения ISPsystem 8753Загадка Антарктиды: череп Vegavis iaai переписывает историю птиц