Соперничество AI-гигантов: DeepSeek R1 против OpenAI o1

Китайский стартап DeepSeek бросил вызов OpenAI, представив модель R1, которая, по их утверждениям, не уступает o1 по производительности в решении сложных задач, но при этом обходится значительно дешевле. DeepSeek R1 использует метод «Смеси экспертов» и «Цепочки рассуждений», что позволяет ей снизить затраты на обучение и обработку запросов, а также демонстрировать логику своих рассуждений пользователям. При этом компания не скрывает факт использования адаптированных наработок других китайских AI-компаний.
Соперничество AI-гигантов: DeepSeek R1 против OpenAI o1
Изображение носит иллюстративный характер

В то время как OpenAI o1 также использует «Цепочки рассуждений», DeepSeek R1 не только показывает ход своих рассуждений, но и может использовать эту информацию для обучения более компактных моделей. В тестах, включая разработанные OpenAI, R1 показала сопоставимую производительность с o1 и превзошла более раннюю версию o1-mini, даже доработанная сторонними энтузиастами до мобильной версии. Хотя некоторые пользователи отмечают, что R1 уступает o1 в отдельных задачах, ее стоимость существенно ниже. DeepSeek заявляет о стоимости обучения в $5 млн, по сравнению со 100 млн и более для OpenAI.

DeepSeek R1 доступна для скачивания и модификации, что позволяет пользователям размещать ее на собственных серверах и адаптировать под свои нужды, что делает ее привлекательной для компаний, желающих кастомизировать AI-решения. OpenAI же, напротив, предлагает проприетарную модель o1, доступ к которой предоставляется на платной основе и предусматривает встроенные механизмы кибербезопасности. При этом DeepSeek V3 отказывается отвечать на политически острые вопросы о Китае, что вызывает критику в сравнении с более нейтральными ответами ChatGPT.

Несмотря на то, что DeepSeek не опубликовала датасет, использованный для обучения R1, сообщество активно использует ее веса, загрузив их более 3 миллионов раз с платформы Hugging Face. OpenAI проводит расследование о возможных запросах DeepSeek к своим моделям для обучения, но Сэм Альтман признает DeepSeek R1 впечатляющей разработкой, особенно с учетом ее стоимости, и считает ее стимулом для OpenAI ускорить разработку своих продуктов.


Новое на сайте

19521Банковский троян VENON на Rust атакует Бразилию с помощью девяти техник обхода защиты 19520Бонобо агрессивны не меньше шимпанзе, но всё решают самки 19519Почему 600-килограммовый зонд NASA падает на Землю из-за солнечной активности? 19518«Липовый календарь»: как расписание превращает работников в расходный материал 19517Вредоносные Rust-пакеты и ИИ-бот крадут секреты разработчиков через CI/CD-пайплайны 19516Как хакеры за 72 часа превратили npm-пакет в ключ от целого облака AWS 19515Как WebDAV-диск и поддельная капча помогают обойти антивирус? 19514Могут ли простые числа скрываться внутри чёрных дыр? 19513Метеорит пробил крышу дома в Германии — откуда взялся огненный шар над Европой? 19512Уязвимости LeakyLooker в Google Looker Studio открывали доступ к чужим базам данных 19511Почему тысячи серверов оказываются открытой дверью для хакеров, хотя могли бы ею не быть? 19510Как исследователи за четыре минуты заставили ИИ-браузер Perplexity Comet попасться на... 19509Может ли женщина без влагалища и шейки матки зачать ребёнка естественным путём? 19508Зачем учёные из Вены создали QR-код, который невозможно увидеть без электронного... 19507Девять уязвимостей CrackArmor позволяют получить root-доступ через модуль безопасности...
Ссылка