Ssylka

Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen

Бесплатные ИИ-модели, такие как Gemini 2.0 Flash Thinking от Google, DeepSeek 2.5 и Qwen QwQ от Alibaba, демонстрируют способность к «рассуждению», что улучшает качество их ответов. Эти модели, в отличие от платных OpenAI, анализируют задачу перед ее решением, обеспечивая более точные результаты. Однако все три могут переходить на английский в процессе ответа, а у Qwen замечены китайские иероглифы.
Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen
Изображение носит иллюстративный характер

В задачах на вычисления все три модели показали высокую точность, хотя DeepSeek и Qwen иногда упускают детали при объяснении решения. В задаче с таблицей, где требовалось определить срок окупаемости проекта, результаты разделились: Gemini и Qwen QvQ-72B справились, в то время как DeepSeek ошибся.

Логические задачи оказались сложными. Gemini правильно вывела формулу для дилеммы, но не определила её вид. DeepSeek также дал верную формулу, но не назвал дилемму, а Qwen и вовсе не смогла справиться. В задаче с обвинением в ограблении только Gemini верно определила виновных и невиновных. В задании по поиску ошибок в коде все три модели правильно выявили проблему, Gemini и Qwen представили исправления.

Общая картина такова: Gemini лидирует по количеству решённых задач и качеству перевода, DeepSeek демонстрирует неплохие результаты, но уступает в логике и анализе таблиц, а Qwen имеет проблемы с последовательностью языка и логикой, но хорошо показал себя в программировании. Простой ребус из комментариев, где слова зашифрованы картинками, ни одна из тестируемых нейросетей не смогла решить.


Новое на сайте

19022Зачем Сэм Альтман решил внедрить рекламу в бесплатные версии ChatGPT? 19021Хитроумная маскировка вредоноса GootLoader через тысячи склеенных архивов 19020Удастся ли знаменитому археологу Захи Хавассу найти гробницу Нефертити до ухода на покой? 19019Действительно ли «зомби-клетки» провоцируют самую распространенную форму эпилепсии и... 19018Генетический анализ мумий гепардов из саудовской Аравии открыл путь к возрождению... 19017Вредоносная кампания в Chrome перехватывает управление HR-системами и блокирует... 19016Глубоководные оползни раскрыли историю мегаземлетрясений зоны Каскадия за 7500 лет 19015Насколько глубоки ваши познания об эволюции и происхождении человека? 19014Как уязвимость CodeBreach в AWS CodeBuild могла привести к глобальной атаке через ошибку... 19013Затерянный фрагмент древней плиты пионер меняет карту сейсмических угроз Калифорнии 19012Генетические мутации вызывают слепоту менее чем в 30% случаев вопреки прежним прогнозам 19011Завершено строительство космического телескопа Nancy Grace Roman для поиска ста тысяч... 19010Вязкость пространства и фононы вакуума как разгадка аномалий расширения вселенной 19009Приведет ли массовое плодоношение дерева Риму к рекордному росту популяции какапо? 19008Как уязвимость CVE-2026-23550 в плагине Modular DS позволяет захватить управление сайтом?