Соперничество AI-гигантов: DeepSeek R1 против OpenAI o1

Китайский стартап DeepSeek бросил вызов OpenAI, представив модель R1, которая, по их утверждениям, не уступает o1 по производительности в решении сложных задач, но при этом обходится значительно дешевле. DeepSeek R1 использует метод «Смеси экспертов» и «Цепочки рассуждений», что позволяет ей снизить затраты на обучение и обработку запросов, а также демонстрировать логику своих рассуждений пользователям. При этом компания не скрывает факт использования адаптированных наработок других китайских AI-компаний.
Соперничество AI-гигантов: DeepSeek R1 против OpenAI o1
Изображение носит иллюстративный характер

В то время как OpenAI o1 также использует «Цепочки рассуждений», DeepSeek R1 не только показывает ход своих рассуждений, но и может использовать эту информацию для обучения более компактных моделей. В тестах, включая разработанные OpenAI, R1 показала сопоставимую производительность с o1 и превзошла более раннюю версию o1-mini, даже доработанная сторонними энтузиастами до мобильной версии. Хотя некоторые пользователи отмечают, что R1 уступает o1 в отдельных задачах, ее стоимость существенно ниже. DeepSeek заявляет о стоимости обучения в $5 млн, по сравнению со 100 млн и более для OpenAI.

DeepSeek R1 доступна для скачивания и модификации, что позволяет пользователям размещать ее на собственных серверах и адаптировать под свои нужды, что делает ее привлекательной для компаний, желающих кастомизировать AI-решения. OpenAI же, напротив, предлагает проприетарную модель o1, доступ к которой предоставляется на платной основе и предусматривает встроенные механизмы кибербезопасности. При этом DeepSeek V3 отказывается отвечать на политически острые вопросы о Китае, что вызывает критику в сравнении с более нейтральными ответами ChatGPT.

Несмотря на то, что DeepSeek не опубликовала датасет, использованный для обучения R1, сообщество активно использует ее веса, загрузив их более 3 миллионов раз с платформы Hugging Face. OpenAI проводит расследование о возможных запросах DeepSeek к своим моделям для обучения, но Сэм Альтман признает DeepSeek R1 впечатляющей разработкой, особенно с учетом ее стоимости, и считает ее стимулом для OpenAI ускорить разработку своих продуктов.


Новое на сайте

19209Как беспрецедентный бунт чернокожих женщин в суде Бостона разрушил планы рабовладельцев? 19208Как новые поколения троянов удаленного доступа захватывают системы ради кибершпионажа и... 19207Почему мировые киберпреступники захватили рекламные сети, и как Meta вместе с властями... 19206Как фальшивый пакет StripeApi.Net в NuGet Gallery незаметно похищал финансовые API-токены... 19205Зачем неизвестная группировка UAT-10027 внедряет бэкдор Dohdoor в системы образования и... 19204Ритуальный предсвадебный плач как форма протеста в традиционном Китае 19203Невидимая угроза в оперативной памяти: масштабная атака северокорейских хакеров на... 19202Как уязвимость нулевого дня в Cisco SD-WAN позволяет хакерам незаметно захватывать... 19201Как Google разрушил глобальную шпионскую сеть UNC2814, охватившую правительства 70 стран... 19200Как простое открытие репозитория в Claude Code позволяет хакерам получить полный контроль... 19199Зачем киберсиндикат SLH платит женщинам до 1000 долларов за один телефонный звонок в... 19198Устранение слепых зон SOC: переход к доказательной сортировке угроз для защиты бизнеса 19197Скрытые бэкдоры в цепочках поставок по: атаки через вредоносные пакеты NuGet и npm 19196Как абсолютная самоотдача, отказ от эго и физиологическое переосмысление тревоги помогают... 19195Отказ от стратегии гладиаторов как главный драйвер экспоненциального роста корпораций
Ссылка