Адаптивный RAG: динамическое улучшение LLM для юридического NER

В юридической сфере, где точность и полнота данных критичны, использование больших языковых моделей (LLM) для извлечения именованных сущностей (NER) сталкивается с трудностями из-за специфической терминологии и иерархической структуры данных. Традиционный подход RAG (Retrieval-Augmented Generation) дополняется динамическим промптингом, где примеры для few-shot обучения подбираются не статически, а на основе семантического сходства с текущим документом.
Адаптивный RAG: динамическое улучшение LLM для юридического NER
Изображение носит иллюстративный характер

Применение динамического промптинга заключается в том, что сначала юридические тексты разбиваются на фрагменты и векторизуются, формируя базу данных примеров. Затем, при обработке нового документа, его фрагменты также векторизуются, и из базы данных извлекаются наиболее похожие примеры. Эти примеры, в сочетании с инструкциями и схемой данных, формируют промпт для LLM. Это позволяет модели адаптироваться к уникальным особенностям каждого документа.

Ключевыми моментами в динамическом промптинге являются выбор модели для формирования векторов (эмбеддингов) и определение оптимального размера фрагмента текста. Модель для эмбеддингов должна обеспечивать баланс между качеством векторных представлений и скоростью обработки. Оптимальный размер фрагмента должен содержать достаточно контекста, но не быть чрезмерно большим, чтобы не снижать скорость и качество работы системы.

Динамический промптинг обеспечивает улучшение качества извлечения юридических фактов и ускоряет процесс работы над ошибками. Подход масштабируем и легко адаптируется к новым типам документов. Применение такого метода снижает рутинную нагрузку, связанную с подбором примеров, и повышает точность NER.


Новое на сайте

20099Нейронаука одиночества: есть ли в мозге клетки, которые страдают? 20098Почему глаза так долго привыкают к темноте — и что за этим стоит? 20097Мыть или не мыть рис: что реально происходит в кастрюле 20095Мне не предоставили текст для написания статьи. 20094Мыть или не мыть рис: что реально происходит в кастрюле 20092Почему глаза так долго привыкают к темноте — и что за этим стоит? 20087Игла сквозь череп: медицинский случай с рыбой-иглой и задачей, которую хирурги решали... 20085Живая квантовая сеть в Нью-Йорке: как Qunnect пытается построить интернет, который нельзя... 20084Живые обои: дрожжи, алгинат и 3D-принтер вместо поклейки 20083ИИ-агент уничтожил базу данных за 9 секунд и сам же признался в этом 20082CVE-2026-5027: почему уязвимость в Langflow уже активно эксплуатируется хакерами? 20081GreatXML: новый обход BitLocker через Recovery Partition 20080Июньский Patch Tuesday 2026: 206 уязвимостей, три zero-day и неуправляемый ИИ в поиске дыр
Ссылка