Ssylka

Эмоциональный код: как ИИ научился понимать чувства лучше людей

Исследование, опубликованное 21 мая в журнале Communications Psychology, утверждает, что искусственный интеллект превосходит людей в понимании эмоций, особенно в выборе правильной реакции для разрядки напряженных ситуаций. Работа, проведенная учеными из Женевского университета (UNIGE) и Бернского университета (UniBE), ставила целью сравнить производительность моделей ИИ и людей в тестах на эмоциональный интеллект (ЭИ), а также оценить способность ИИ создавать новые валидные тестовые вопросы.
Эмоциональный код: как ИИ научился понимать чувства лучше людей
Изображение носит иллюстративный характер

В ходе эксперимента были задействованы шесть крупных языковых моделей: ChatGPT-4, ChatGPT-o1, Gemini 1.5 Flash, Claude 3.5 Haiku, Copilot 365 и DeepSeek V3. Их результаты сравнивались с человеческими на стандартных тестах ЭИ, таких как STEM, STEU, GEMOK-Blends, GECo Regulation и GECo Management.

Результаты оказались однозначными. Согласно оценкам экспертов-людей, языковые модели выбирали «правильный» эмоциональный ответ в 81% случаев. Показатель людей составил всего 56%. Кроме того, тестовые вопросы, сгенерированные искусственным интеллектом, были признаны людьми-оценщиками эквивалентными по сложности оригинальным и не являлись простым перефразированием. Корреляция между тестами, созданными ИИ, и оригинальными была оценена как «сильная», с коэффициентом 0,46.

Однако многие эксперты скептически отнеслись к выводам, указывая, что методология исследования, основанная на тестах с множественным выбором, не отражает всей сложности реальных эмоциональных взаимодействий. Таймур Иджлал, эксперт в области финансов и информационной безопасности, утверждает, что ИИ не демонстрирует «глубокого понимания», а просто чаще выбирает «статистически ожидаемый ответ». Он отмечает, что даже психологи-люди могут по-разному интерпретировать одни и те же эмоциональные сигналы.

Джейсон Хеннесси, основатель и генеральный директор Hennessy Digital, проводит параллель между исследованием и «Тестом на чтение мыслей по глазам», отмечая, что точность ИИ «резко падает», когда меняются такие переменные, как освещение или культурный контекст. Уайатт Мэйхэм, основатель Northwest AI Consulting, вовсе отвергает значимость исследования, сравнивая его с попыткой считать себя великим терапевтом только потому, что «хорошо справился с тематической викториной об эмоциях на BuzzFeed».

Несмотря на критику, существует реальный пример, подтверждающий способность ИИ эффективно управлять эмоциональными ситуациями. Система Aílton, разработанная Маркосом Алвесом, генеральным директором и главным научным сотрудником HAL-AI, является мультимодальным ассистентом в WhatsApp, использующим голос, текст и изображения. Системой пользуются более 6000 дальнобойщиков в Бразилии.

Aílton с точностью около 80% идентифицирует стресс, гнев или печаль в сообщениях водителей. Этот показатель примерно на 20 процентных пунктов выше, чем у его коллег-людей в аналогичных условиях.

Показательным стал инцидент, когда водитель, ставший свидетелем смертельной аварии с участием своего коллеги, отправил ассистенту 15-секундное голосовое сообщение, полное отчаяния. Aílton мгновенно отреагировал: он выразил тонко сформулированные соболезнования, предоставил контакты для получения психологической помощи и автоматически оповестил менеджеров автопарка о произошедшем.

Маркос Алвес признает, что лабораторные тесты упрощают распознавание эмоций, но утверждает, что изоляция «когнитивного уровня» полезна для анализа. По его словам, большие языковые модели способны анализировать миллиарды предложений и тысячи часов аудиозаписей, что позволяет им кодировать «микроинтонационные сигналы, которые люди часто упускают». Он заключает, что данные, полученные от Aílton в реальных условиях, подтверждают: современные языковые модели уже способны распознавать эмоции и реагировать на них лучше, чем большинство людей.

Статья была обновлена в 10 утра по восточному времени 29 июля для исправления названия и ссылки на Northwest AI Consulting.


Новое на сайте

18817Искусственный интеллект в математике: от олимпиадного золота до решения вековых проблем 18816Радиоактивный след в Арктике: путь цезия-137 от лишайника через оленей к коренным народам 18815Критическая уязвимость WatchGuard CVE-2025-14733 с рейтингом 9.3 уже эксплуатируется в... 18814Что подготовило ночное небо на праздники 2025 года и какие астрономические явления нельзя... 18813Зачем нубийские христиане наносили татуировки на лица младенцев 1400 лет назад? 18812Как увидеть метеорный поток Урсиды в самую длинную ночь 2025 года? 18811Кто стоял за фишинговой империей RaccoonO365 и как спецслужбы ликвидировали угрозу... 18810Как злоумышленники могут использовать критическую уязвимость UEFI для взлома плат ASRock,... 18809Как наблюдать максимальное сближение с землей третьей межзвездной кометы 3I/ATLAS? 18808Передовая римская канализация не спасла легионеров от тяжелых кишечных инфекций 18807Способен ли вулканический щебень на дне океана работать как гигантская губка для... 18806Зонд NASA Europa Clipper успешно запечатлел межзвездную комету 3I/ATLAS во время полета к... 18805Может ли перенос лечения на первую половину дня удвоить выживаемость при раке легких? 18804Новая китайская группировка LongNosedGoblin использует легальные облачные сервисы для... 18803Генетический анализ раскрыл древнейший случай кровосмешения первой степени в итальянской...