Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen

Бесплатные ИИ-модели, такие как Gemini 2.0 Flash Thinking от Google, DeepSeek 2.5 и Qwen QwQ от Alibaba, демонстрируют способность к «рассуждению», что улучшает качество их ответов. Эти модели, в отличие от платных OpenAI, анализируют задачу перед ее решением, обеспечивая более точные результаты. Однако все три могут переходить на английский в процессе ответа, а у Qwen замечены китайские иероглифы.
Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen
Изображение носит иллюстративный характер

В задачах на вычисления все три модели показали высокую точность, хотя DeepSeek и Qwen иногда упускают детали при объяснении решения. В задаче с таблицей, где требовалось определить срок окупаемости проекта, результаты разделились: Gemini и Qwen QvQ-72B справились, в то время как DeepSeek ошибся.

Логические задачи оказались сложными. Gemini правильно вывела формулу для дилеммы, но не определила её вид. DeepSeek также дал верную формулу, но не назвал дилемму, а Qwen и вовсе не смогла справиться. В задаче с обвинением в ограблении только Gemini верно определила виновных и невиновных. В задании по поиску ошибок в коде все три модели правильно выявили проблему, Gemini и Qwen представили исправления.

Общая картина такова: Gemini лидирует по количеству решённых задач и качеству перевода, DeepSeek демонстрирует неплохие результаты, но уступает в логике и анализе таблиц, а Qwen имеет проблемы с последовательностью языка и логикой, но хорошо показал себя в программировании. Простой ребус из комментариев, где слова зашифрованы картинками, ни одна из тестируемых нейросетей не смогла решить.


Новое на сайте

5563Как правильно выбирать полосу движения в городе: экзамен по пдд? 5562Разработка резервной утилиты ReBack на Rust: ключевые решения и архитектура 5561Нужен ли RabbitMQ в контейнерной среде? 5560Может ли один человек изменить ситуацию в условиях катастрофы? 5559Сколько стоят ваши идеи? Как оценить интеллектуальную собственность? 5558Как дизайн стал драйвером бизнеса: трансформация роли дизайнера? 5557Как сохранить неповторимую красоту сельской местности Суррея: ваш голос имеет значение? 5556Сердце приюта: невероятная история Анн Чард и ее любви к животным 5555Зимняя тревога на Харкерли-роуд: более 150 лебедей под угрозой на дороге 5554Какие песни русского рока покорили слушателей? 5553Не станет ли лондонская система общественного транспорта ещё удобнее? 5552Как посчитать стоимость забора вокруг садовых участков? 5551Как встроить фронтенд в JAR-файл: практическое руководство 5549Due Diligence: зачем нужны «шпионские игры» перед покупкой IT-продукта?