Замкнутый цикл защиты искусственного интеллекта от Pillar Security

Компания Pillar Security, основанная на синергии наступательного и оборонительного подходов к кибербезопасности, разработала платформу для сквозной защиты систем на базе искусственного интеллекта. Соучредитель и CEO Дор Сариг, специалист по наступательным кибероперациям («красная команда») с десятилетним опытом руководства операциями безопасности в государственных и корпоративных структурах, объединил усилия с соучредителем и CTO Зивом Карлингером, экспертом по защитным техникам («синяя команда»), который более десяти лет разрабатывал методы противодействия финансовым киберпреступлениям и обеспечивал безопасность цепочек поставок.
Замкнутый цикл защиты искусственного интеллекта от Pillar Security
Изображение носит иллюстративный характер

В основе платформы лежит философия замкнутого цикла обратной связи. Это не набор разрозненных инструментов, а целостная система, где каждый компонент обогащает следующий. Например, данные, полученные модулем обнаружения активов, используются для уточнения оценки рисков в модуле управления состоянием безопасности. Аналогично, защитные барьеры, работающие в реальном времени, строятся на основе выводов, сделанных на этапе моделирования угроз и внутреннего пентестинга. Такой механизм создает динамическую, контекстуальную и адаптивную защиту, охватывающую весь жизненный цикл ИИ-системы.

Процесс защиты начинается еще до написания кода на этапе «AI Workbench». Эта безопасная среда предназначена для проактивного моделирования угроз. Она помогает разработчикам и командам безопасности систематически выявлять потенциальные векторы атак и обеспечивать соответствие ИИ-систем корпоративным политикам и нормативным требованиям. Платформа поддерживает фреймворки STRIDE, ISO, MITRE ATLAS, OWASP Top Ten для LLM, а также собственный фреймворк Pillar под названием SAIL.

Следующий этап — «AI Discovery» — решает проблему неконтролируемого распространения ИИ-инструментов в организации. Модуль интегрируется напрямую с репозиториями кода, платформами данных, фреймворками ИИ/МО, поставщиками идентификационных данных (IdP) и локальными средами. Он автоматически обнаруживает и каталогизирует все связанные с ИИ активы, включая приложения, модели, наборы данных, серверы MCP, агенты для написания кода и мета-промпты. Платформа визуализирует обнаруженные активы и отмечает компоненты, оставшиеся без мониторинга.

После обнаружения активов в работу вступает модуль «AI-SPM» (AI Security Posture Management) для управления состоянием безопасности. Он проводит статический и динамический анализ всех ИИ-компонентов и их взаимосвязей для точной оценки рисков. Результатом его работы являются визуальные карты агентивных систем, их компонентов и поверхностей атаки, а также выявление угроз, связанных с цепочкой поставок, отравлением данных и уязвимостями на уровне моделей, промптов и инструментов. Централизованная панель управления политиками предоставляет полный обзор соответствия ИИ-систем корпоративным стандартам.

Для проверки надежности систем по принципу «доверие через проектирование» используется модуль «AI Red Teaming». Он проводит симулированные атаки, адаптированные под конкретный сценарий использования и бизнес-логику ИИ-приложения. Тестирование включает в себя техники промпт-инъекций, джейлбрейкинга и сложные атаки на бизнес-логику. Цель — проверить, можно ли манипулировать ИИ-агентом для выполнения несанкционированных действий, таких как возврат средств, утечка данных или запуск непредусмотренных инструментов.

Платформа также обладает уникальной возможностью «Black-Box Red Teaming» для тестирования сторонних и встраиваемых ИИ-приложений (например, копайлотов или кастомных чат-ботов), к коду которых нет доступа. Для проведения атаки требуются только URL-адрес и учетные данные. Специализированные adversarial-агенты проверяют приложение на прочность, чтобы выявить границы данных и риски их раскрытия. Модуль способен тестировать, как цепочки вызовов инструментов и API могут быть использованы в качестве оружия.

На этапе эксплуатации безопасность обеспечивают «Guardrails» — адаптивные защитные барьеры. Эта модель-агностик система, ориентированная на приложение, отслеживает входящие и исходящие данные для принудительного применения политик безопасности без снижения производительности. Барьеры постоянно развиваются на основе телеметрических данных, результатов редтиминга и каналов разведки угроз. Они предотвращают эксфильтрацию данных и несанкционированные действия, позволяя организациям внедрять собственные правила поведения для ИИ.

Для сдерживания риска чрезмерной агентности, когда ИИ-агенты выходят за рамки своих полномочий, используется «Sandbox». Этот компонент запускает ИИ-агентов, таких как ассистенты по написанию кода или серверы MCP, в строго контролируемых, изолированных средах. Применяя принципы нулевого доверия (zero-trust), он отделяет агентов от критически важной инфраструктуры, сдерживает вредоносное поведение и регистрирует каждое действие, создавая детализированный след для криминалистического анализа.

Фундаментом всей системы является «AI Telemetry». Этот модуль непрерывно собирает данные по всему стеку ИИ: промпты, действия агентов, вызовы инструментов и контекстуальные метаданные. Эта информация позволяет проводить глубокие расследования, отслеживать соответствие нормам и анализировать первопричины инцидентов. Модуль может быть развернут в облаке клиента, что обеспечивает полный контроль над конфиденциальными данными.

Мощность платформы подкрепляется крупнейшим в отрасли каналом разведки угроз, который обогащен данными из более чем 10 миллионов реальных взаимодействий. Гибкость развертывания — локально, в гибридных средах или полностью в облаке — предоставляет клиентам, особенно из регулируемых отраслей, полный контроль над своими данными и процессами безопасности.


Новое на сайте

20065[b]СПКЯ стало СПМЯ: почему переименование болезни, затрагивающей миллионы женщин, заняло... 20064[b]Почему великая пирамида Гизы пережила все землетрясения за 4500 лет[/b] 20063[b]Генетика Homo erectus: что зубная эмаль рассказала о наших предках[/b] 20062[b]Кости в бухте эребус: что кости моряков Франклина рассказывают спустя полтора века[/b] 20061[b]Крупнейший плавучий ветрогенератор в мире: Китай испытывает установку у берегов... 20060[b]Карие глаза младенца стали индиго после лечения от COVID-19[/b] 20058[b]Почему серебряная чаша с Афиной пролежала в немецком лесу две тысячи лет?[/b] 20057[b]Дыра в атмосфере солнца: вспышка достигла пика и может зажечь полярное сияние[/b] 20056[b]Динго возрастом 950 лет: кто и зачем кормил могилу животного сотни лет?[/b] 20055[b]Томоэ гозэн: женщина-самурай, которая существовала на самом деле[/b] 20054[b]Что видели астронавты «Аполлона-12» над лунным горизонтом?[/b] 20053[b]Восковой блокнот на латыни и шёлковая туалетная бумага: кто посещал средневековый... 20052[b]Хантавирус на борту: 41 человек под наблюдением после рейса MV Hondius[/b] 20051[b]Зелёные камни в пещере Пиренеев: четыре тысячи лет медной металлургии[/b]
Ссылка