Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen

Бесплатные ИИ-модели, такие как Gemini 2.0 Flash Thinking от Google, DeepSeek 2.5 и Qwen QwQ от Alibaba, демонстрируют способность к «рассуждению», что улучшает качество их ответов. Эти модели, в отличие от платных OpenAI, анализируют задачу перед ее решением, обеспечивая более точные результаты. Однако все три могут переходить на английский в процессе ответа, а у Qwen замечены китайские иероглифы.
Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen
Изображение носит иллюстративный характер

В задачах на вычисления все три модели показали высокую точность, хотя DeepSeek и Qwen иногда упускают детали при объяснении решения. В задаче с таблицей, где требовалось определить срок окупаемости проекта, результаты разделились: Gemini и Qwen QvQ-72B справились, в то время как DeepSeek ошибся.

Логические задачи оказались сложными. Gemini правильно вывела формулу для дилеммы, но не определила её вид. DeepSeek также дал верную формулу, но не назвал дилемму, а Qwen и вовсе не смогла справиться. В задаче с обвинением в ограблении только Gemini верно определила виновных и невиновных. В задании по поиску ошибок в коде все три модели правильно выявили проблему, Gemini и Qwen представили исправления.

Общая картина такова: Gemini лидирует по количеству решённых задач и качеству перевода, DeepSeek демонстрирует неплохие результаты, но уступает в логике и анализе таблиц, а Qwen имеет проблемы с последовательностью языка и логикой, но хорошо показал себя в программировании. Простой ребус из комментариев, где слова зашифрованы картинками, ни одна из тестируемых нейросетей не смогла решить.


Новое на сайте

20065[b]СПКЯ стало СПМЯ: почему переименование болезни, затрагивающей миллионы женщин, заняло... 20064[b]Почему великая пирамида Гизы пережила все землетрясения за 4500 лет[/b] 20063[b]Генетика Homo erectus: что зубная эмаль рассказала о наших предках[/b] 20062[b]Кости в бухте эребус: что кости моряков Франклина рассказывают спустя полтора века[/b] 20061[b]Крупнейший плавучий ветрогенератор в мире: Китай испытывает установку у берегов... 20060[b]Карие глаза младенца стали индиго после лечения от COVID-19[/b] 20058[b]Почему серебряная чаша с Афиной пролежала в немецком лесу две тысячи лет?[/b] 20057[b]Дыра в атмосфере солнца: вспышка достигла пика и может зажечь полярное сияние[/b] 20056[b]Динго возрастом 950 лет: кто и зачем кормил могилу животного сотни лет?[/b] 20055[b]Томоэ гозэн: женщина-самурай, которая существовала на самом деле[/b] 20054[b]Что видели астронавты «Аполлона-12» над лунным горизонтом?[/b] 20053[b]Восковой блокнот на латыни и шёлковая туалетная бумага: кто посещал средневековый... 20052[b]Хантавирус на борту: 41 человек под наблюдением после рейса MV Hondius[/b]
Ссылка