Ssylka

Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen

Бесплатные ИИ-модели, такие как Gemini 2.0 Flash Thinking от Google, DeepSeek 2.5 и Qwen QwQ от Alibaba, демонстрируют способность к «рассуждению», что улучшает качество их ответов. Эти модели, в отличие от платных OpenAI, анализируют задачу перед ее решением, обеспечивая более точные результаты. Однако все три могут переходить на английский в процессе ответа, а у Qwen замечены китайские иероглифы.
Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen
Изображение носит иллюстративный характер

В задачах на вычисления все три модели показали высокую точность, хотя DeepSeek и Qwen иногда упускают детали при объяснении решения. В задаче с таблицей, где требовалось определить срок окупаемости проекта, результаты разделились: Gemini и Qwen QvQ-72B справились, в то время как DeepSeek ошибся.

Логические задачи оказались сложными. Gemini правильно вывела формулу для дилеммы, но не определила её вид. DeepSeek также дал верную формулу, но не назвал дилемму, а Qwen и вовсе не смогла справиться. В задаче с обвинением в ограблении только Gemini верно определила виновных и невиновных. В задании по поиску ошибок в коде все три модели правильно выявили проблему, Gemini и Qwen представили исправления.

Общая картина такова: Gemini лидирует по количеству решённых задач и качеству перевода, DeepSeek демонстрирует неплохие результаты, но уступает в логике и анализе таблиц, а Qwen имеет проблемы с последовательностью языка и логикой, но хорошо показал себя в программировании. Простой ребус из комментариев, где слова зашифрованы картинками, ни одна из тестируемых нейросетей не смогла решить.


Новое на сайте

18324Доступ к эксклюзиву: новая ловушка для розничного инвестора 18323Может ли антивирус стать идеальным прикрытием для кибершпионажа? 18322Хранят ли два священных острова в ядовито-зеленом озере мумии древних императоров? 18321Что может рассказать пепел сгоревшей таверны XIX века? 18320Возможно ли создать универсальный донорский орган, изменив его группу крови? 18319Какие пять уязвимостей от Oracle до Apple стали оружием в руках хакеров? 18318Что может рассказать забытый соперник Рима о его истинном облике? 18317Почему оптическая иллюзия обманывает рыб, но не горлиц? 18316Эффект домино в облаке: как один сбой Amazon парализовал интернет 18315Непреодолимый энергетический барьер человеческого тела 18314Воздушный перегон в Бэдлендс: как вертолеты сохраняют популяцию бизонов 18313Бразильская спам-империя в магазине Google Chrome 18312Чистка рая: война Лос-Анджелеса против белых безработных 18311Архитектура страха: научное объяснение призраков и проклятых мест 18310Может ли копирование кода с веб-страницы обойти все ваши системы защиты?