Ssylka

DeepSeek и компания: анализ языковых моделей

DeepSeek-R1, большая языковая модель китайского происхождения, выделяется открытым доступом и возможностью локального развертывания. Ее можно запустить, используя ollama, на компьютере с достаточным объемом оперативной памяти и, при желании, с графическим ускорителем. Доступны дистиллированные версии с меньшим количеством параметров для менее мощных компьютеров, но с компромиссом по точности. DeepSeek-R1 показала себя конкурентоспособной по результатам тестов с другими известными языковыми моделями, особенно в точных науках.
DeepSeek и компания: анализ языковых моделей
Изображение носит иллюстративный характер

В ходе интервью DeepSeek продемонстрировала склонность к англоязычному мышлению, даже при запросах на русском. Хотя облачная версия лучше справляется с языком запроса, в некоторых случаях она может «протекать» на китайском. DeepSeek показала разную результативность в различных областях знаний. Например, в математических и химических задачах ее результаты варьировались, но в биологии, например, в задачах по генетике, часто демонстрировала ошибки. Но особенно выделяется склонность DeepSeek к самоидентификации с моделями OpenAI.

В философских вопросах, таких как «в чем смысл жизни», ответы моделей были предсказуемыми и расплывчатыми. В творческих задачах, например, в сочинении рассказа с ограниченным набором букв, модели оказались не очень успешными. В то же время, модели не имеют предубеждений по поводу гастрономических фантазий и готовы с готовностью обсуждать кулинарию из «свиных крылышек», не отрицая их существования.

Несмотря на открытый доступ и отсутствие ограничений для пользователей из России, DeepSeek может быть подвержена ограничениям со стороны веб-интерфейса при большом количестве запросов. Важно отметить, что как и у других языковых моделей, DeepSeek может допускать ошибки, и результаты ее работы стоит рассматривать критически. Тем не менее, это действительно интересная модель для дальнейшего изучения и экспериментов.


Новое на сайте

7556Грузовой мустанг: обзор Shulz The Tentacle 7555Космическая Одиссея: рекордные прогулки и затянувшаяся экспедиция на МКС 7554Астероид 2024 YR4: космическая угроза, требующая пристального внимания 7553Металлический путь Желтой реки: от земли к живым организмам 7552Скрытые рифы: как "мусорная" еда губит здоровье чернопёрых рифовых акул 7551Может ли аквакультура спасти королевского конха от вымирания? 7550Аллокаторы памяти в играх: оптимизация и выбор 7549Возрождение образования: путь к человеческому процветанию, а не религиозному контролю 7548Империя на коне: подвиги и тайны Александра Македонского 7547Белое карликовое сердце: рекордные пульсации звезды WD J0135+5722 7546Голоса разума: пути развития шизофрении 7545DeepSeek vs ChatGPT: сравнительный анализ генерации SwiftUI кода 7544Могут ли материалы помнить последовательность событий вопреки всем правилам? 7543Загадки C23 и Boolean в Chocolate Doom 7542Опасность на прилавках: масштабный отзыв салатов из-за сальмонеллы