Deepseek V3: новый игрок в мире ИИ

Модель V3, разработанная китайской компанией DeepSeek, выделяется среди аналогов благодаря внушительному размеру, включающему 671 миллиард параметров, 37 миллиардов из которых активируются при каждом запросе. Обучение на 14,8 триллионах токенов и открытая лицензия делают её привлекательной для разработчиков, хотя и требуют значительных вычислительных ресурсов.
Deepseek  V3: новый игрок в мире ИИ
Изображение носит иллюстративный характер

По результатам тестов V3 превосходит такие модели как Llama 3.1, GPT-4o и Qwen 2.5, демонстрируя высокую производительность в задачах генерации текста, включая написание кода, перевод и создание эссе. Особенно выделяется её способность интегрировать сгенерированный код в уже существующие проекты.

Несмотря на затраты в 5,5 миллионов долларов и 3 миллиона часов на обучение, что меньше, чем у GPT-4, V3 требует мощного оборудования для эффективной работы. Открытый доступ к модели по разрешительной лицензии позволяет использовать её в коммерческих разработках и способствует развитию сообщества.


Новое на сайте

19757Что за ядовито-зелёное пятно на водохранилище в ЮАР видно даже из космоса? 19756Как Storm-1175 из Китая ломает корпоративные сети за сутки и что делает Medusa настолько... 19755Почему 12 000 серверов с ИИ-платформой Flowise оказались беззащитны перед хакерами? 19754Северокорейские хакеры спрятали командный центр на GitHub 19753ИИ обгоняет людей в биомедицинском анализе — так ли это опасно, как звучит? 19752Artemis II летит к луне: что происходит и как за этим следить 19751Лекарство от диабета первого типа: шутка про «пять лет» перестаёт быть шуткой 19750Псевдонаука на службе рабства: как учёные XIX века торговали теориями о смешанной крови 19749Как SOC-команды теряют время на многоплатформенных атаках и как это остановить 19748Как люди научились жить там, где жить невозможно? 19747Рабочий ноутбук разработчика стал главной целью хакеров 19746Может ли песок решить главную проблему возобновляемой энергетики? 19745Как группировки Qilin и Warlock обезоруживают антивирусы через уязвимые драйверы 19744Самые прожорливые чёрные дыры во вселенной остаются без еды 19743Artemis: момент, который определит целое поколение
Ссылка