Ssylka

DeepSeek и компания: анализ языковых моделей

DeepSeek-R1, большая языковая модель китайского происхождения, выделяется открытым доступом и возможностью локального развертывания. Ее можно запустить, используя ollama, на компьютере с достаточным объемом оперативной памяти и, при желании, с графическим ускорителем. Доступны дистиллированные версии с меньшим количеством параметров для менее мощных компьютеров, но с компромиссом по точности. DeepSeek-R1 показала себя конкурентоспособной по результатам тестов с другими известными языковыми моделями, особенно в точных науках.
DeepSeek и компания: анализ языковых моделей
Изображение носит иллюстративный характер

В ходе интервью DeepSeek продемонстрировала склонность к англоязычному мышлению, даже при запросах на русском. Хотя облачная версия лучше справляется с языком запроса, в некоторых случаях она может «протекать» на китайском. DeepSeek показала разную результативность в различных областях знаний. Например, в математических и химических задачах ее результаты варьировались, но в биологии, например, в задачах по генетике, часто демонстрировала ошибки. Но особенно выделяется склонность DeepSeek к самоидентификации с моделями OpenAI.

В философских вопросах, таких как «в чем смысл жизни», ответы моделей были предсказуемыми и расплывчатыми. В творческих задачах, например, в сочинении рассказа с ограниченным набором букв, модели оказались не очень успешными. В то же время, модели не имеют предубеждений по поводу гастрономических фантазий и готовы с готовностью обсуждать кулинарию из «свиных крылышек», не отрицая их существования.

Несмотря на открытый доступ и отсутствие ограничений для пользователей из России, DeepSeek может быть подвержена ограничениям со стороны веб-интерфейса при большом количестве запросов. Важно отметить, что как и у других языковых моделей, DeepSeek может допускать ошибки, и результаты ее работы стоит рассматривать критически. Тем не менее, это действительно интересная модель для дальнейшего изучения и экспериментов.


Новое на сайте

16938Хроники мангровых лесов: победители фотоконкурса 2025 года 16936Ай-ай: причудливый лемур, проклятый своим пальцем 16935Как рентгеновское зрение раскрывает самые бурные процессы во вселенной? 16934Уязвимость нулевого дня в SonicWall VPN стала оружием группировки Akira 16933Может ли государственный фонд единолично решать судьбу американской науки? 16932Способна ли филантропия блогеров решить мировой водный кризис? 16931Взлом через промпт: как AI-редактор Cursor превращали в оружие 16930Мог ли древний кризис заставить людей хоронить мертвых в печах с собаками? 16929Какие наушники Bose выбрать на распродаже: для полной изоляции или контроля над... 16928Может ли искусство напрямую очищать экосистемы от вредителей? 16927Вирусное наследие в геноме человека оказалось ключевым регулятором генов 16926Рекордные оазисы жизни обнаружены в бездне океанских траншей 16925Крах прогнозов UnitedHealth на фоне растущих издержек и трагедий 16924Формула ясного ума: доказанный способ замедлить когнитивное старение