AI-Безопасность: RAG-подход к защите LLM

Современные LLM-модели подвержены рискам, включая промпт-инъекции и утечки данных. RAG (Retrieval-Augmented Generation) можно использовать для усиления безопасности LLM-сервисов, а не только для генерации ответов. Этот подход предполагает классификацию запросов и ответов на основе анализа контекста, полученного из базы данных векторизованных примеров. Применение RAG позволяет не только обнаруживать вредоносные запросы и ответы, но и обеспечивать более стабильные и предсказуемые реакции модели.
AI-Безопасность: RAG-подход к защите LLM
Изображение носит иллюстративный характер

Для реализации такого подхода необходим векторный эмбеддер для преобразования текстовых данных в векторы. Nomic-embed-text обеспечивает достаточную длину последовательности и хорошую производительность. Затем используется векторная база данных, например, ChromaDB, для хранения и быстрого поиска схожих контекстов. LLM-модель, например, Mistral, применяется для классификации с учетом контекста.

Архитектура системы включает в себя AI Guardrail для детекции угроз, состоящий из RAG пайплайна, LLM, ChromaDB и Ollama. Реализация такого сервиса Security RAG включает: микросервисную архитектуру, быстрый вывод на инференс, минимальные ложные срабатывания, а также API тесты.

Демонстрацию можно организовать с помощью телеграм-бота и дашбордов (Langfuse). Несмотря на то, что Security RAG не блокирует ответы LLM, а возвращает их вместе с JSON-классификацией для демонстрационных целей, этот инструмент помогает выявлять потенциально опасные взаимодействия с LLM. Дополнительно, можно использовать проприетарные или open-source решения для усиления безопасности, включая классификацию запросов, ответов, и очистку данных.


Новое на сайте

20065[b]СПКЯ стало СПМЯ: почему переименование болезни, затрагивающей миллионы женщин, заняло... 20064[b]Почему великая пирамида Гизы пережила все землетрясения за 4500 лет[/b] 20063[b]Генетика Homo erectus: что зубная эмаль рассказала о наших предках[/b] 20062[b]Кости в бухте эребус: что кости моряков Франклина рассказывают спустя полтора века[/b] 20061[b]Крупнейший плавучий ветрогенератор в мире: Китай испытывает установку у берегов... 20060[b]Карие глаза младенца стали индиго после лечения от COVID-19[/b] 20058[b]Почему серебряная чаша с Афиной пролежала в немецком лесу две тысячи лет?[/b] 20057[b]Дыра в атмосфере солнца: вспышка достигла пика и может зажечь полярное сияние[/b] 20056[b]Динго возрастом 950 лет: кто и зачем кормил могилу животного сотни лет?[/b] 20055[b]Томоэ гозэн: женщина-самурай, которая существовала на самом деле[/b] 20054[b]Что видели астронавты «Аполлона-12» над лунным горизонтом?[/b] 20053[b]Восковой блокнот на латыни и шёлковая туалетная бумага: кто посещал средневековый... 20052[b]Хантавирус на борту: 41 человек под наблюдением после рейса MV Hondius[/b] 20051[b]Зелёные камни в пещере Пиренеев: четыре тысячи лет медной металлургии[/b]
Ссылка