Соперничество AI-гигантов: DeepSeek R1 против OpenAI o1

Китайский стартап DeepSeek бросил вызов OpenAI, представив модель R1, которая, по их утверждениям, не уступает o1 по производительности в решении сложных задач, но при этом обходится значительно дешевле. DeepSeek R1 использует метод «Смеси экспертов» и «Цепочки рассуждений», что позволяет ей снизить затраты на обучение и обработку запросов, а также демонстрировать логику своих рассуждений пользователям. При этом компания не скрывает факт использования адаптированных наработок других китайских AI-компаний.
Соперничество AI-гигантов: DeepSeek R1 против OpenAI o1
Изображение носит иллюстративный характер

В то время как OpenAI o1 также использует «Цепочки рассуждений», DeepSeek R1 не только показывает ход своих рассуждений, но и может использовать эту информацию для обучения более компактных моделей. В тестах, включая разработанные OpenAI, R1 показала сопоставимую производительность с o1 и превзошла более раннюю версию o1-mini, даже доработанная сторонними энтузиастами до мобильной версии. Хотя некоторые пользователи отмечают, что R1 уступает o1 в отдельных задачах, ее стоимость существенно ниже. DeepSeek заявляет о стоимости обучения в $5 млн, по сравнению со 100 млн и более для OpenAI.

DeepSeek R1 доступна для скачивания и модификации, что позволяет пользователям размещать ее на собственных серверах и адаптировать под свои нужды, что делает ее привлекательной для компаний, желающих кастомизировать AI-решения. OpenAI же, напротив, предлагает проприетарную модель o1, доступ к которой предоставляется на платной основе и предусматривает встроенные механизмы кибербезопасности. При этом DeepSeek V3 отказывается отвечать на политически острые вопросы о Китае, что вызывает критику в сравнении с более нейтральными ответами ChatGPT.

Несмотря на то, что DeepSeek не опубликовала датасет, использованный для обучения R1, сообщество активно использует ее веса, загрузив их более 3 миллионов раз с платформы Hugging Face. OpenAI проводит расследование о возможных запросах DeepSeek к своим моделям для обучения, но Сэм Альтман признает DeepSeek R1 впечатляющей разработкой, особенно с учетом ее стоимости, и считает ее стимулом для OpenAI ускорить разработку своих продуктов.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка