Ssylka

DeepSeek и компания: анализ языковых моделей

DeepSeek-R1, большая языковая модель китайского происхождения, выделяется открытым доступом и возможностью локального развертывания. Ее можно запустить, используя ollama, на компьютере с достаточным объемом оперативной памяти и, при желании, с графическим ускорителем. Доступны дистиллированные версии с меньшим количеством параметров для менее мощных компьютеров, но с компромиссом по точности. DeepSeek-R1 показала себя конкурентоспособной по результатам тестов с другими известными языковыми моделями, особенно в точных науках.
DeepSeek и компания: анализ языковых моделей
Изображение носит иллюстративный характер

В ходе интервью DeepSeek продемонстрировала склонность к англоязычному мышлению, даже при запросах на русском. Хотя облачная версия лучше справляется с языком запроса, в некоторых случаях она может «протекать» на китайском. DeepSeek показала разную результативность в различных областях знаний. Например, в математических и химических задачах ее результаты варьировались, но в биологии, например, в задачах по генетике, часто демонстрировала ошибки. Но особенно выделяется склонность DeepSeek к самоидентификации с моделями OpenAI.

В философских вопросах, таких как «в чем смысл жизни», ответы моделей были предсказуемыми и расплывчатыми. В творческих задачах, например, в сочинении рассказа с ограниченным набором букв, модели оказались не очень успешными. В то же время, модели не имеют предубеждений по поводу гастрономических фантазий и готовы с готовностью обсуждать кулинарию из «свиных крылышек», не отрицая их существования.

Несмотря на открытый доступ и отсутствие ограничений для пользователей из России, DeepSeek может быть подвержена ограничениям со стороны веб-интерфейса при большом количестве запросов. Важно отметить, что как и у других языковых моделей, DeepSeek может допускать ошибки, и результаты ее работы стоит рассматривать критически. Тем не менее, это действительно интересная модель для дальнейшего изучения и экспериментов.


Новое на сайте

19019Действительно ли «зомби-клетки» провоцируют самую распространенную форму эпилепсии и... 19018Генетический анализ мумий гепардов из саудовской Аравии открыл путь к возрождению... 19017Вредоносная кампания в Chrome перехватывает управление HR-системами и блокирует... 19016Глубоководные оползни раскрыли историю мегаземлетрясений зоны Каскадия за 7500 лет 19015Насколько глубоки ваши познания об эволюции и происхождении человека? 19014Как уязвимость CodeBreach в AWS CodeBuild могла привести к глобальной атаке через ошибку... 19013Затерянный фрагмент древней плиты пионер меняет карту сейсмических угроз Калифорнии 19012Генетические мутации вызывают слепоту менее чем в 30% случаев вопреки прежним прогнозам 19011Завершено строительство космического телескопа Nancy Grace Roman для поиска ста тысяч... 19010Вязкость пространства и фононы вакуума как разгадка аномалий расширения вселенной 19009Приведет ли массовое плодоношение дерева Риму к рекордному росту популяции какапо? 19008Как уязвимость CVE-2026-23550 в плагине Modular DS позволяет захватить управление сайтом? 19007Может ли уличная драка французского авантюриста раскрыть кризис американского гражданства... 19006Может ли один клик по легитимной ссылке заставить Microsoft Copilot и другие ИИ тайно... 19005Утрата истинного мастерства в эпоху алгоритмов и скрытые механизмы человеческого...