RAG: основы, продвинутые техники и автоматизация

RAG (Retrieval Augmented Generation) – подход, сочетающий генеративные модели с поисковыми механизмами для предоставления ответов, подкреплённых внешними данными. Стандартная схема включает векторизацию запроса, поиск релевантных документов в базе данных, их переранжирование, интеграцию в промпт и генерацию ответа. RAG необходим, поскольку LLM ограничены данными обучения, что приводит к неточностям. Выбор ретривера – sparse (лексический), dense (векторный) или гибридный – и базы данных (от PostgreSQL до графовых, типа Neo4j) зависит от задачи. Данные предварительно обрабатываются: разбиваются на фрагменты (чанки), векторизуются с помощью эмбеддинговых моделей (например, e5_multilingual).
RAG: основы, продвинутые техники и автоматизация
Изображение носит иллюстративный характер

Улучшить retrieval можно, применяя семантическое чанкирование, мультимодальность, перефразирование запросов, HyDE (генерация гипотетического ответа для поиска), контекстуализацию запросов и чанков, и декомпозицию сложных запросов. Переранжирование выдачи проводится с использованием BM25 или перекрёстных эмбеддеров (cross-encoder) для улучшения релевантности. Перед аугментацией – внедрением документов в промпт – документы фильтруются и суммируются.

На этапе генерации LLM выдаёт ответ с учётом актуализированной информации. Оценка RAG проводится метриками MRR, MAP, BLEU и ROUGE, а также триадой метрик, оцениваемых с помощью LLM: релевантность ответа, верность (соответствие фактам) и релевантность контекста. AutoRAG – автоматизированный фреймворк, который оптимизирует процесс RAG, и заслуживает отдельного внимания.


Новое на сайте

19857Острова как политический побег: от Атлантиды до плавучих государств Питера Тиля 19856Яйца, которые спасли предков млекопитающих от худшего апокалипсиса на Земле? 19855Могут ли омары чувствовать боль, и почему учёные требуют запретить варить их живыми? 19854Премия в $3 млн за первое CRISPR-лечение серповидноклеточной анемии 19853Почему сотрудники игнорируют корпоративное обучение и как это исправить 19852Тинтагель: место силы Артура или красивая легенда? 19851Голоса в голове сказали правду: что происходит, когда галлюцинации ставят диагноз точнее... 19850Куда исчезает информация из чёрных дыр, если они вообще исчезают? 19849Чёрная дыра лебедь Х-1 бросает джеты со скоростью света — но кто ими управляет? 19848Что увидели фотографы над замком Линдисфарн — и почему они закричали? 19847Почему антисептики в больницах могут создавать устойчивых к ним микробов? 19846Правда ли, что курица может жить без головы? 19845Как Оскар Уайльд использовал причёску как оружие против викторианской морали? 19844Назальный спрей против всех вирусов: как далеко зашла наука 19843«Я ещё не осознал, что мы только что сделали»: первая пресс-конференция экипажа Artemis II
Ссылка