Меню

RAG: основы, продвинутые техники и автоматизация

Адалстан

RAG (Retrieval Augmented Generation) – подход, сочетающий генеративные модели с поисковыми механизмами для предоставления ответов, подкреплённых внешними данными. Стандартная схема включает векторизацию запроса, поиск релевантных документов в базе данных, их переранжирование, интеграцию в промпт и генерацию ответа. RAG необходим, поскольку LLM ограничены данными обучения, что приводит к неточностям. Выбор ретривера – sparse (лексический), dense (векторный) или гибридный – и базы данных (от PostgreSQL до графовых, типа Neo4j) зависит от задачи. Данные предварительно обрабатываются: разбиваются на фрагменты (чанки), векторизуются с помощью эмбеддинговых моделей (например, e5_multilingual).
RAG: основы, продвинутые техники и автоматизация

RAG: основы, продвинутые техники и автоматизация

Изображение носит иллюстративный характер

Улучшить retrieval можно, применяя семантическое чанкирование, мультимодальность, перефразирование запросов, HyDE (генерация гипотетического ответа для поиска), контекстуализацию запросов и чанков, и декомпозицию сложных запросов. Переранжирование выдачи проводится с использованием BM25 или перекрёстных эмбеддеров (cross-encoder) для улучшения релевантности. Перед аугментацией – внедрением документов в промпт – документы фильтруются и суммируются.

На этапе генерации LLM выдаёт ответ с учётом актуализированной информации. Оценка RAG проводится метриками MRR, MAP, BLEU и ROUGE, а также триадой метрик, оцениваемых с помощью LLM: релевантность ответа, верность (соответствие фактам) и релевантность контекста. AutoRAG – автоматизированный фреймворк, который оптимизирует процесс RAG, и заслуживает отдельного внимания.

Источник: mrcoolinhabr

← Предыдущее в разделе Следующее в разделе →

Вверх

Новое на сайте

Кости прерий: как истребление бизонов породило целую индустрию — и сама себя же уничтожила

Кто и зачем взламывает серверы Ollama и ComfyUI ради ключей от AWS?

Как злоумышленники спрятали командный сервер внутри блокчейна и почему его невозможно...

Брюссель заставляет Android делиться секретами с чужими ИИ-помощниками

WordPress: как два бага слились в одну критическую дыру, которую назвали wp2shell

Как китайские хакеры обманули DigiCert и украли сертификаты для подписи кода?

Что скрывается за уязвимостью, которую агентство США внесло в список активно используемых...

Автономные системы наступают быстрее, чем инфраструктура для управления ими: кто выиграет...

Почему в OpenSSL нашли дыру, съедающую память серверов, но не дали ей даже номер CVE?

SonicWall SMA 1000: как два бага превратили VPN-шлюз в бэкдор для атакующих

Может ли уязвимость в клиенте Zoom для Windows открыть доступ к чужому аккаунту без...

TELEPUZ: новый вредонос на C, который научился прятаться в Telegram, Steam и блокчейне...

Дома из дёрна: как исландцы триста лет прятались от холода под слоем земли и травы

Как один токен от чужого сервиса мог впустить злоумышленника в чужой аккаунт n8n?

Меню

МенюЗакрыть