Углубленный RAG: графы знаний для точного поиска информации

Традиционный подход Retrieval Augmented Generation (RAG) с векторными базами данных эффективен, но ограничен в решении сложных запросов, требующих многоаспектного рассуждения или объединения разрозненных данных. GraphRAG преодолевает эти ограничения, интегрируя графы знаний (KG) в процесс извлечения и генерации. В начале текстовые фрагменты анализируются LLM на предмет сущностей, связей и утверждений, образуя начальный граф знаний. Далее применяется иерархическая кластеризация для выделения сообществ – групп плотно связанных сущностей. Для каждого сообщества создаются краткие сводки, включающие ключевые сущности, их отношения и утверждения.
Углубленный RAG: графы знаний для точного поиска информации
Изображение носит иллюстративный характер

При обработке запросов GraphRAG использует глобальный и локальный поиск. Глобальный поиск, подходящий для комплексных вопросов, анализирует сводки сообществ, ранжируя и фильтруя промежуточные ответы для формирования окончательного ответа. Локальный поиск, применяемый к запросам о конкретных сущностях, идентифицирует семантически связанные сущности в графе знаний. Извлеченные фрагменты текста сопоставляются с сущностями, их отношениями и ковариатами. Таким образом, контекст для LLM обогащается не только семантическим сходством текста, но и структурированными знаниями о связях между сущностями.

Приведенный в статье пример с набором данных VIINA демонстрирует преимущество GraphRAG над базовым RAG в вопросах, требующих агрегации информации. В то время как базовый RAG извлекал несвязный текст, GraphRAG выдал релевантный ответ, определяя основные темы и ссылаясь на исходный материал. Также использование векторной базы данных Milvus позволяет хранить эмбеддинги описаний сущностей для быстрого и точного локального поиска. Этот подход сочетает структурированные данные из графа знаний с неструктурированными данными из документов.

GraphRAG также имеет возможность генерировать вопросы на основе исторических запросов. Это позволяет использовать его в чат-ботах. Система анализирует предыдущие запросы и контекст, генерируя вопросы, связанные с определенными сущностями. Такая способность к генерации вопросов делает GraphRAG более динамичным и интерактивным. Практическая реализация GraphRAG с Milvus показывает, что его можно легко интегрировать в существующие рабочие процессы, предоставляя мощный инструмент для работы со сложными данными.


Новое на сайте

19232Скелет великана с трепанированным черепом обнаружен в массовом захоронении эпохи викингов 19231Почему пустыни возникают на берегу океана? 19230Кто вы по хронотипу — сова или жаворонок? 19229Сколько миллиардов лет отведено земле и другим планетам до их неизбежного разрушения? 19228Как экспериментальная назальная вакцина защищает лабораторных мышей от вирусов, бактерий... 19225Как привычная проверка паспорта превращается в скрытый канал утечки данных внутри... 19224Многоступенчатая угроза VOIDGEIST: как злоумышленники скрытно внедряют трояны XWorm,... 19223Эпоха «вайбвейра»: ИИ и экзотический код в масштабных кибератаках группировки APT36 19222Почему переход на ИИ-управление рисками становится главным условием роста для современных... 19221Атака на телекоммуникации южной Америки: новые инструменты китайской группировки UAT-9244 19220Критические бреши Hikvision и Rockwell Automation спровоцировали экстренные меры... 19219Масштабная кампания ClickFix использует Windows Terminal для развертывания Lumma Stealer... 19218Критический март для Cisco: хакеры активно эксплуатируют уязвимости Catalyst SD-WAN... 19217Трансформация двухколесного будущего: от индустриального триумфа до постапокалиптического... 19216Смертельный симбиоз спама и эксплойтов: как хакеры захватывают корпоративные сети за 11...
Ссылка