DeepSeek и компания: анализ языковых моделей

DeepSeek-R1, большая языковая модель китайского происхождения, выделяется открытым доступом и возможностью локального развертывания. Ее можно запустить, используя ollama, на компьютере с достаточным объемом оперативной памяти и, при желании, с графическим ускорителем. Доступны дистиллированные версии с меньшим количеством параметров для менее мощных компьютеров, но с компромиссом по точности. DeepSeek-R1 показала себя конкурентоспособной по результатам тестов с другими известными языковыми моделями, особенно в точных науках.
DeepSeek и компания: анализ языковых моделей
Изображение носит иллюстративный характер

В ходе интервью DeepSeek продемонстрировала склонность к англоязычному мышлению, даже при запросах на русском. Хотя облачная версия лучше справляется с языком запроса, в некоторых случаях она может «протекать» на китайском. DeepSeek показала разную результативность в различных областях знаний. Например, в математических и химических задачах ее результаты варьировались, но в биологии, например, в задачах по генетике, часто демонстрировала ошибки. Но особенно выделяется склонность DeepSeek к самоидентификации с моделями OpenAI.

В философских вопросах, таких как «в чем смысл жизни», ответы моделей были предсказуемыми и расплывчатыми. В творческих задачах, например, в сочинении рассказа с ограниченным набором букв, модели оказались не очень успешными. В то же время, модели не имеют предубеждений по поводу гастрономических фантазий и готовы с готовностью обсуждать кулинарию из «свиных крылышек», не отрицая их существования.

Несмотря на открытый доступ и отсутствие ограничений для пользователей из России, DeepSeek может быть подвержена ограничениям со стороны веб-интерфейса при большом количестве запросов. Важно отметить, что как и у других языковых моделей, DeepSeek может допускать ошибки, и результаты ее работы стоит рассматривать критически. Тем не менее, это действительно интересная модель для дальнейшего изучения и экспериментов.


Новое на сайте

19989Шесть историй, которые умещаются на ладони 19986Как 30 000 аккаунтов Facebook оказались в руках вьетнамских хакеров? 19985LofyGang вернулась: как бразильские хакеры охотятся на геймеров через поддельные читы 19984Автономная проверка защиты: как не отстать от ИИ-атак 19983Взлом Trellix: хакеры добрались до исходного кода одной из ведущих компаний по... 19982Почему почти 3000 монет в норвежском поле перевернули представление о викингах? 19981Как поддельная CAPTCHA опустошает ваш счёт и крадёт криптовалюту? 19980Слежка за каждым шагом: как ИИ превращает государство в машину тотального контроля 19979Как хакеры грабят компании через звонок в «техподдержку» 19978Почему именно Нью-Йорк стал самым уязвимым городом восточного побережья перед... 19977Как одна команда git push открывала доступ к миллионам репозиториев 19976Зачем древние народы убивали ножами и мечами: оружие как основа власти 19975Как Python-бэкдор DEEPDOOR крадёт ваши облачные пароли незаметно? 19974Послание в бутылке: математика невозможного 19973Почему ИИ-инфраструктура стала новой целью хакеров быстрее, чем ждали все?
Ссылка