Стоит ли доверять шумихе вокруг DeepSeek-R1?

DeepSeek-R1, модель с открытым исходным кодом, вызвала ажиотаж в сообществе ИИ, особенно после сравнений с OpenAI o1. Модель использует архитектуру Mixture of Experts, где лишь часть параметров активна во время вывода, что обеспечивает ее эффективность. DeepSeek также выпустила более слабые модели, обученные на данных, дистиллированных из R1, демонстрируя потенциал обучения небольших моделей на знаниях более крупных.
Стоит ли доверять шумихе вокруг DeepSeek-R1?
Изображение носит иллюстративный характер

Ключевой особенностью DeepSeek-R1 является ее способность к рассуждению благодаря технике, подобной "reflection". Модель размышляет «вслух» перед ответом, предоставляя промежуточные шаги своих размышлений. Этот подход, хотя и может быть многословным, способствует повышению точности ответов. Это делает DeepSeek-R1 потенциально эффективной для задач RAG (Retrieval Augmented Generation), где контекстная информация интегрируется в процесс генерации.

Однако модели подвержены предвзятости, как и все LLM. Предвзятость формируется из обучающих данных и человеческих предпочтений, и абсолютная объективность не является достижимой целью. Вместо этого, предпочтение должно отдаваться ответам, которые честно выражают точку зрения модели, даже если она не совпадает с ожиданиями пользователя.

Для тех, кто хочет самостоятельно протестировать DeepSeek-R1, предложен репозиторий на GitHub, который позволяет запустить модель даже на устройствах с ограниченными ресурсами. Процесс включает запуск API-сервера и скрипта Python, использующего библиотеку OpenAI. Самостоятельное тестирование — лучший способ оценить возможности этой модели. Кроме того, DeepSeek также выпустила генератор изображений Janus-Pro.


Новое на сайте

19817В Луксоре нашли стелу с римским императором в образе фараона 19816Экипаж Artemis II о моменте, когда земля исчезла за луной 19815Почему луна выглядит по-разному в разных точках земли? 19814Adobe экстренно закрыла опасную дыру в Acrobat Reader, которую хакеры использовали с... 19813Метеорный поток, рождённый из умирающего астероида 19812Когда робот пишет за тебя прощальную смс 19811Что общего у лунной миссии, толстого попугая, загадочной плащаницы и лекарства от диабета? 19810Какие снимки Artemis II уже стали иконами лунной программы? 19809Кто на самом деле хочет сладкого — вы или ваши бактерии? 19808Как рекламные данные 500 миллионов телефонов оказались в руках спецслужб? 19807Экипаж Artemis II вернулся на землю после десяти дней в космосе 19806Зелёная и коричневая луна: почему геологи Artemis II уже не могут усидеть на месте 19805Эксперты уверены в теплозащитном щите Artemis II, несмотря на проблемы предшественника 19804Выжить внутри торнадо: каково это — когда тебя засасывает в воронку 19803Аляскинские косатки-охотники на млекопитающих замечены у берегов Сиэтла
Ссылка