RAG: основы, продвинутые техники и автоматизация

RAG (Retrieval Augmented Generation) – подход, сочетающий генеративные модели с поисковыми механизмами для предоставления ответов, подкреплённых внешними данными. Стандартная схема включает векторизацию запроса, поиск релевантных документов в базе данных, их переранжирование, интеграцию в промпт и генерацию ответа. RAG необходим, поскольку LLM ограничены данными обучения, что приводит к неточностям. Выбор ретривера – sparse (лексический), dense (векторный) или гибридный – и базы данных (от PostgreSQL до графовых, типа Neo4j) зависит от задачи. Данные предварительно обрабатываются: разбиваются на фрагменты (чанки), векторизуются с помощью эмбеддинговых моделей (например, e5_multilingual).
RAG: основы, продвинутые техники и автоматизация
Изображение носит иллюстративный характер

Улучшить retrieval можно, применяя семантическое чанкирование, мультимодальность, перефразирование запросов, HyDE (генерация гипотетического ответа для поиска), контекстуализацию запросов и чанков, и декомпозицию сложных запросов. Переранжирование выдачи проводится с использованием BM25 или перекрёстных эмбеддеров (cross-encoder) для улучшения релевантности. Перед аугментацией – внедрением документов в промпт – документы фильтруются и суммируются.

На этапе генерации LLM выдаёт ответ с учётом актуализированной информации. Оценка RAG проводится метриками MRR, MAP, BLEU и ROUGE, а также триадой метрик, оцениваемых с помощью LLM: релевантность ответа, верность (соответствие фактам) и релевантность контекста. AutoRAG – автоматизированный фреймворк, который оптимизирует процесс RAG, и заслуживает отдельного внимания.


Новое на сайте

20072Эффект красоты решает исход собеседования до первых слов 20069Как черта характера крадёт деньги на переговорах 20068Карточная игра против главной дисфункции команды 20066Фотосинтез в глазах мышей: возможно ли это без превращения в растение? 20065СПКЯ стало СПМЯ: почему переименование болезни, затрагивающей миллионы женщин, заняло так... 20064Почему великая пирамида Гизы пережила все землетрясения за 4500 лет 20063Генетика Homo erectus: что зубная эмаль рассказала о наших предках 20062Кости в бухте Эребус: что кости моряков Франклина рассказывают спустя полтора века 20061Крупнейший плавучий ветрогенератор в мире: Китай испытывает установку у берегов Шанхая 20060Карие глаза младенца стали индиго после лечения от COVID-19 20058Почему серебряная чаша с Афиной пролежала в немецком лесу две тысячи лет? 20057Дыра в атмосфере солнца: вспышка достигла пика и может зажечь полярное сияние 20056Динго возрастом 950 лет: кто и зачем кормил могилу животного сотни лет?
Ссылка