Ssylka

Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen

Бесплатные ИИ-модели, такие как Gemini 2.0 Flash Thinking от Google, DeepSeek 2.5 и Qwen QwQ от Alibaba, демонстрируют способность к «рассуждению», что улучшает качество их ответов. Эти модели, в отличие от платных OpenAI, анализируют задачу перед ее решением, обеспечивая более точные результаты. Однако все три могут переходить на английский в процессе ответа, а у Qwen замечены китайские иероглифы.
Сравнительный анализ бесплатных "рассуждающих" ИИ: Gemini, DeepSeek, Qwen
Изображение носит иллюстративный характер

В задачах на вычисления все три модели показали высокую точность, хотя DeepSeek и Qwen иногда упускают детали при объяснении решения. В задаче с таблицей, где требовалось определить срок окупаемости проекта, результаты разделились: Gemini и Qwen QvQ-72B справились, в то время как DeepSeek ошибся.

Логические задачи оказались сложными. Gemini правильно вывела формулу для дилеммы, но не определила её вид. DeepSeek также дал верную формулу, но не назвал дилемму, а Qwen и вовсе не смогла справиться. В задаче с обвинением в ограблении только Gemini верно определила виновных и невиновных. В задании по поиску ошибок в коде все три модели правильно выявили проблему, Gemini и Qwen представили исправления.

Общая картина такова: Gemini лидирует по количеству решённых задач и качеству перевода, DeepSeek демонстрирует неплохие результаты, но уступает в логике и анализе таблиц, а Qwen имеет проблемы с последовательностью языка и логикой, но хорошо показал себя в программировании. Простой ребус из комментариев, где слова зашифрованы картинками, ни одна из тестируемых нейросетей не смогла решить.


Новое на сайте

18607Золотой распад кометы ATLAS C/2025 K1 18606Секретный бренд древнего Рима на стеклянных шедеврах 18605Смогут ли чипсы без искусственных красителей сохранить свой знаменитый вкус? 18604Является ли рекордная скидка на Garmin Instinct 3 Solar лучшим предложением ноября? 18603Могла ли детская смесь ByHeart вызвать национальную вспышку ботулизма? 18602Готовы ли банки доверить агентскому ИИ управление деньгами клиентов? 18601Как сезонные ветры создают миллионы загадочных полос на Марсе? 18600Как тело человека превращается в почву за 90 дней? 18599Как ваш iPhone может заменить паспорт при внутренних перелетах по США? 18598Мозговой шторм: что происходит, когда мозг отключается от усталости 18597Раскрыта асимметричная форма рождения сверхновой 18596Скидки Ninja: как получить идеальную корочку и сэкономить на доставке 18595Почему работа на нескольких работах становится новой нормой? 18594Записная книжка против нейросети: ценность медленного мышления 18593Растущая брешь в магнитном щите земли