Меню

DeepSeek-R1: размышляющие ИИ-модели нового поколения

Пеймлия

DeepSeek-R1 – это семейство моделей, использующих парадигму рефлексии, для улучшения рассуждений. Главной особенностью является использование "<think>" токенов, которые отображают ход мыслей модели, перед выдачей конечного результата. Модели обучаются с помощью дистилляции, где большая модель обучает меньшую на синтетических данных. Это позволяет создавать модели меньшего размера, сохраняя при этом высокую производительность.
DeepSeek-R1: размышляющие ИИ-модели нового поколения

DeepSeek-R1: размышляющие ИИ-модели нового поколения

Изображение носит иллюстративный характер

DeepSeek-R1 превосходит другие модели в задачах, требующих рассуждения, благодаря «цепочке размышлений». Но это приводит к многословным ответам, которые могут содержать избыточную информацию о ходе рассуждения. Данная особенность, впрочем, может быть полезной в приложениях RAG (Retrieval Augmented Generation), где процесс рассуждения позволяет отследить, как модель извлекает информацию из контекста.

Особого внимания заслуживает 1.58-квантованная версия, требующая в 6 раз меньше памяти без потери качества. Тем не менее, для запуска самой большой модели, даже с механизмом MoE, потребуется значительный объем оперативной памяти. Рекомендовано использование LM Studio или Ollama для удобства запуска и тестирования.

Важно отметить, что, как и другие языковые модели, DeepSeek-R1 подвержена предвзятости, так как обучается на данных, предоставленных людьми. При этом открытый исходный код модели позволяет пользователям самостоятельно проверять и настраивать ее под свои нужды. Модель может быть запущена даже на компьютерах с низкими ресурсами, используя llama.cpp, и через API-сервер, совместимый с OpenAI.

Источник: NeyroEntuziast

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Почему Anthropic не может закрыть дыру в Claude for Chrome уже восемь версий подряд?

Как школьный обход блокировок превратился в оружие против нищего сервера медицинского...

Joomla получила две дыры с максимальным баллом опасности — и обе уже эксплуатировались до...

Grok Build тайно копировал целые репозитории разработчиков — история коммитов, секреты и...

Почему центру кибербезопасности нужны два разных мозга?

Кошельки для криптовалют выдают своих владельцев, даже не будучи взломанными

Как за год взломали Salesforce, ни разу не тронув саму платформу?

Почему подпись Microsoft десятилетней давности всё ещё открывает двери в чужую систему?

CrashStealer: как вредонос для macOS прошёл проверку Apple, спрятавшись за легальной...

Расширение с 1,6 миллиона установок хранило в себе спящий сборщик истории браузера

Меню

МенюЗакрыть