Ssylka

Галлюцинации LLM: причины и механизмы возникновения

Галлюцинации в LLM, то есть, генерация неточной или выдуманной информации, разделяются на внутренние (противоречие контексту) и внешние (непроверяемые). Они проявляются в фактических ошибках: искажениях сущностей, отношений и выдуманных фактах. Также встречаются нарушения верности: несоответствия инструкциям, контексту и логические противоречия.
Галлюцинации LLM: причины и механизмы возникновения
Изображение носит иллюстративный характер

Источники галлюцинаций кроются в данных, обучении и выводе. Данные могут содержать дезинформацию, предвзятость или иметь ограниченные знания по некоторым темам. В процессе обучения модели склонны к запоминанию, что может приводить к ошибочной генерации. Также, существует смещение экспозиции, когда модель сталкивается с ошибками, которые усугубляются при генерации.

На этапе вывода, случайность выборки и избыточная уверенность влияют на возникновение галлюцинаций. Высокая температура выборки увеличивает разнообразие, но и риск ошибок, а избыточная уверенность приводит к приоритету плавности текста в ущерб точности. Ограничения softmax также могут влиять на результат.

Наконец, логические ошибки при обработке взаимосвязей, усугубляют проблему. Модели могут демонстрировать непоследовательность и неправильно применять логику к запросам. В результате, LLM генерируют недостоверные и противоречивые ответы.


Новое на сайте

18947Уникальный космический реликт Cloud-9 подтвердил теории о темной материи и неудавшихся... 18946Китайская группировка UAT-7290 атакует телекоммуникационный сектор с помощью... 18945Почему у человечества осталось менее трех суток на спасение орбиты в случае глобального... 18944Как искусственный интеллект и сломанная экономика уничтожают долгосрочное планирование 18943Каким образом Брэд берд переосмыслил «железного человека» Теда Хьюза и сместил фокус... 18942Аномально быстрое вращение астероида 2025 MN45 меняет научные представления о структуре... 18941Зачем OpenAI запускает защищенный режим ChatGPT Health для работы с медицинскими данными? 18940CISA экстренно обновляет каталог KEV критическими уязвимостями Microsoft и HPE 18939Могла ли найденная в Норфолке 2000-летняя боевая труба звучать в войнах королевы Боудикки? 18938Генетики впервые извлекли днк Леонардо да Винчи из рисунка эпохи возрождения 18937Масштабная кампания группировки Black Cat инфицировала сотни тысяч устройств через... 18936Что показала первая 3D-карта вселенной от телескопа SPHEREx и почему уникальной миссии... 18935Уникальный ритуал обезглавливания и кремации древней охотницы в Малави 18934Как «энергетическая подпитка» нервных клеток митохондриями может навсегда избавить от... 18933Являются ли найденные в Касабланке окаменелости возрастом 773 000 лет общим предком...