Ssylka

Методика оценки качества чат-ботов: сравнение LLM и Intent-based решений

Эксперимент, сравнивший чат-бота на основе LLM (GPT-4o) и бота на интентах, показал, что LLM-решение выиграло по общему впечатлению и суммарной оценке критериев, таких как актуальность и проактивность. Однако, LLM-бот проигрывал в скорости ответа, стабильности работы и достоверности информации, иногда выдавая «галлюцинации».
Методика оценки качества чат-ботов: сравнение LLM и Intent-based решений
Изображение носит иллюстративный характер

Тестирование проводилось на базе действующего бота компании КНАУФ. Фокус-группа оценивала ботов по ряду критериев, включая понятность функционала, решение поставленной задачи, общее впечатление и соответствие утверждениям, опирающимся на принципы дизайна разговорных интерфейсов.

Анализ комментариев респондентов выявил, что бот на интентах лучше воспринимался как справочник для пользователей, знающих, что ищут, в то время как LLM-бот лучше справлялся с общими вопросами. При этом классическое решение получило высокую оценку за навигацию и лаконичность, а LLM-версия была многословной.

В ходе эксперимента подтвердилась гипотеза о целесообразности гибридного подхода, сочетающего прописанные скрипты и LLM для улучшения навигации и обработки нестандартных ситуаций. Red политики компании в целом оказались полезными при работе над личностью бота.


Новое на сайте

8767Криптовалютные кошельки под прицелом: как хакеры из Lazarus Group вербуют жертв через... 8766Динамические Sheet-ы в SwiftUI с автоматическим определением высоты для iOS 15+ 8765Сколько чудес скрывает мир животных? Проверьте свои знания! 8764Стоит ли рискнуть ради обновленных Bose Ultra Open Earbuds: спасение для ушей или... 8763Топливные аппетиты Америки: почему США не экономят бензин? 8762Solar Quest: графовая платформа для киберучений и развития навыков 8761Ледяной армагеддон надвигается на средний Запад и Северо-Восток США: города готовятся к... 8760Параллельная реализация A на Rust для поиска оптимального пути 8759Как языческие ритуалы повлияли на раннее средневековье в Нидерландах? 8758Обманчивая безопасность: как муляжи камер видеонаблюдения защищают ваш дом 8757Неужели тайные реки Антарктиды предрекают судьбу мирового океана? 8756Workday делает ставку на искусственный интеллект, сокращая 1750 рабочих мест 8755Новый вид Paranthropus capensis меняет представление об эволюции человека 8754Оптимизация ИТ-инфраструктуры цод: кейс "Датахаты" и решения ISPsystem 8753Загадка Антарктиды: череп Vegavis iaai переписывает историю птиц