Надежность ИИ в бизнесе: развеиваем мифы о галлюцинациях

Большие языковые модели (БЯМ) при генерации текста используют семплирование, выбирая на каждом шаге из нескольких вариантов продолжения. Это приводит к вариативности ответов, включая так называемые «галлюцинации» – нелогичные или неправдивые результаты. Для бизнес-задач, где важна точность, такое поведение неприемлемо.
Надежность ИИ в бизнесе: развеиваем мифы о галлюцинациях
Изображение носит иллюстративный характер

Управляя параметрами семплирования, такими как temperature, top_p и top_k, можно минимизировать «галлюцинации». Снижение температуры, например, уменьшает случайность выбора, делая ответы более предсказуемыми. Полное отключение семплирования путем задания минимальных значений этих параметров, обеспечивает получение практически одинакового ответа на один и тот же запрос.

Для критически важных задач можно использовать многократное дублирование запросов. Отправляя один и тот же запрос несколько раз, а затем выбирая наиболее часто встречающийся ответ, можно значительно повысить надежность и уменьшить вероятность ошибки. Это масштабируемый метод, подходящий для бизнес-применений, где цена запроса обычно невелика.

Внедрение БЯМ в бизнес требует внимательного контроля параметров генерации и, в некоторых случаях, использования дополнительных мер предосторожности, таких как дублирование запросов. В целом, уровень ошибок, достигаемый при правильном использовании, может быть ниже, чем у людей. Важно пересмотреть представление об ИИ как о «болталке» и рассматривать его как мощный инструмент для решения бизнес-задач.


Новое на сайте

19164Уязвимые обучающие приложения открывают доступ к облакам Fortune 500 для криптомайнинга 19163Почему ботнет SSHStalker успешно атакует Linux уязвимостями десятилетней давности? 19162Microsoft устранила шесть уязвимостей нулевого дня и анонсировала радикальные изменения в... 19161Эскалация цифровой угрозы: как IT-специалисты КНДР используют реальные личности для... 19160Скрытые потребности клиентов и преимущество наблюдения над опросами 19159Академическое фиаско Дороти Паркер в Лос-Анджелесе 19158Китайский шпионский фреймворк DKnife захватывает роутеры с 2019 года 19157Каким образом корейские детские хоры 1950-х годов превратили геополитику в музыку и... 19156Научная революция цвета в женской моде викторианской эпохи 19155Как новый сканер Microsoft обнаруживает «спящих агентов» в открытых моделях ИИ? 19154Как новая кампания DEADVAX использует файлы VHD для скрытой доставки трояна AsyncRAT? 19153Как новые китайские киберкампании взламывают госструктуры Юго-Восточной Азии? 19152Культ священного манго и закат эпохи хунвейбинов в маоистском Китае 19151Готовы ли вы к эре коэффициента адаптивности, когда IQ и EQ больше не гарантируют успех? 19150Иранская группировка RedKitten применяет сгенерированный нейросетями код для кибершпионажа
Ссылка