Ssylka

Замкнутый цикл защиты искусственного интеллекта от Pillar Security

Компания Pillar Security, основанная на синергии наступательного и оборонительного подходов к кибербезопасности, разработала платформу для сквозной защиты систем на базе искусственного интеллекта. Соучредитель и CEO Дор Сариг, специалист по наступательным кибероперациям («красная команда») с десятилетним опытом руководства операциями безопасности в государственных и корпоративных структурах, объединил усилия с соучредителем и CTO Зивом Карлингером, экспертом по защитным техникам («синяя команда»), который более десяти лет разрабатывал методы противодействия финансовым киберпреступлениям и обеспечивал безопасность цепочек поставок.
Замкнутый цикл защиты искусственного интеллекта от Pillar Security
Изображение носит иллюстративный характер

В основе платформы лежит философия замкнутого цикла обратной связи. Это не набор разрозненных инструментов, а целостная система, где каждый компонент обогащает следующий. Например, данные, полученные модулем обнаружения активов, используются для уточнения оценки рисков в модуле управления состоянием безопасности. Аналогично, защитные барьеры, работающие в реальном времени, строятся на основе выводов, сделанных на этапе моделирования угроз и внутреннего пентестинга. Такой механизм создает динамическую, контекстуальную и адаптивную защиту, охватывающую весь жизненный цикл ИИ-системы.

Процесс защиты начинается еще до написания кода на этапе «AI Workbench». Эта безопасная среда предназначена для проактивного моделирования угроз. Она помогает разработчикам и командам безопасности систематически выявлять потенциальные векторы атак и обеспечивать соответствие ИИ-систем корпоративным политикам и нормативным требованиям. Платформа поддерживает фреймворки STRIDE, ISO, MITRE ATLAS, OWASP Top Ten для LLM, а также собственный фреймворк Pillar под названием SAIL.

Следующий этап — «AI Discovery» — решает проблему неконтролируемого распространения ИИ-инструментов в организации. Модуль интегрируется напрямую с репозиториями кода, платформами данных, фреймворками ИИ/МО, поставщиками идентификационных данных (IdP) и локальными средами. Он автоматически обнаруживает и каталогизирует все связанные с ИИ активы, включая приложения, модели, наборы данных, серверы MCP, агенты для написания кода и мета-промпты. Платформа визуализирует обнаруженные активы и отмечает компоненты, оставшиеся без мониторинга.

После обнаружения активов в работу вступает модуль «AI-SPM» (AI Security Posture Management) для управления состоянием безопасности. Он проводит статический и динамический анализ всех ИИ-компонентов и их взаимосвязей для точной оценки рисков. Результатом его работы являются визуальные карты агентивных систем, их компонентов и поверхностей атаки, а также выявление угроз, связанных с цепочкой поставок, отравлением данных и уязвимостями на уровне моделей, промптов и инструментов. Централизованная панель управления политиками предоставляет полный обзор соответствия ИИ-систем корпоративным стандартам.

Для проверки надежности систем по принципу «доверие через проектирование» используется модуль «AI Red Teaming». Он проводит симулированные атаки, адаптированные под конкретный сценарий использования и бизнес-логику ИИ-приложения. Тестирование включает в себя техники промпт-инъекций, джейлбрейкинга и сложные атаки на бизнес-логику. Цель — проверить, можно ли манипулировать ИИ-агентом для выполнения несанкционированных действий, таких как возврат средств, утечка данных или запуск непредусмотренных инструментов.

Платформа также обладает уникальной возможностью «Black-Box Red Teaming» для тестирования сторонних и встраиваемых ИИ-приложений (например, копайлотов или кастомных чат-ботов), к коду которых нет доступа. Для проведения атаки требуются только URL-адрес и учетные данные. Специализированные adversarial-агенты проверяют приложение на прочность, чтобы выявить границы данных и риски их раскрытия. Модуль способен тестировать, как цепочки вызовов инструментов и API могут быть использованы в качестве оружия.

На этапе эксплуатации безопасность обеспечивают «Guardrails» — адаптивные защитные барьеры. Эта модель-агностик система, ориентированная на приложение, отслеживает входящие и исходящие данные для принудительного применения политик безопасности без снижения производительности. Барьеры постоянно развиваются на основе телеметрических данных, результатов редтиминга и каналов разведки угроз. Они предотвращают эксфильтрацию данных и несанкционированные действия, позволяя организациям внедрять собственные правила поведения для ИИ.

Для сдерживания риска чрезмерной агентности, когда ИИ-агенты выходят за рамки своих полномочий, используется «Sandbox». Этот компонент запускает ИИ-агентов, таких как ассистенты по написанию кода или серверы MCP, в строго контролируемых, изолированных средах. Применяя принципы нулевого доверия (zero-trust), он отделяет агентов от критически важной инфраструктуры, сдерживает вредоносное поведение и регистрирует каждое действие, создавая детализированный след для криминалистического анализа.

Фундаментом всей системы является «AI Telemetry». Этот модуль непрерывно собирает данные по всему стеку ИИ: промпты, действия агентов, вызовы инструментов и контекстуальные метаданные. Эта информация позволяет проводить глубокие расследования, отслеживать соответствие нормам и анализировать первопричины инцидентов. Модуль может быть развернут в облаке клиента, что обеспечивает полный контроль над конфиденциальными данными.

Мощность платформы подкрепляется крупнейшим в отрасли каналом разведки угроз, который обогащен данными из более чем 10 миллионов реальных взаимодействий. Гибкость развертывания — локально, в гибридных средах или полностью в облаке — предоставляет клиентам, особенно из регулируемых отраслей, полный контроль над своими данными и процессами безопасности.


Новое на сайте

18302Можно ли предсказать извержение вулкана по его сейсмическому шёпоту? 18301Как случайное открытие позволило уместить радугу на чипе и решить проблему... 18300Визуальная летопись мира: триумфаторы 1839 Photography Awards 18299Загадка шагающих истуканов Рапа-Нуи 18298Двойное кометное зрелище украшает осеннее небо 18297Двигатель звездного роста: раскрыта тайна запуска протозвездных джетов 18296Нейробиология пробуждения: как мозг переходит от сна к бодрствованию 18295Как сервис для получения SMS-кодов стал оружием для мошенников по всему миру? 18294Сообщения в iOS 26: от ИИ-фонов до групповых опросов 18293Почему для исправления «техношеи» нужно укреплять мышцы, а не растягивать их? 18292Как новорожденная звезда подала сигнал из эпицентра мощнейшего взрыва? 18291Нотный рецепт: как наука превращает музыку в обезболивающее 18290Что превращает кофейное зерно в идеальный напиток? 18289Как пробуждение древних микробов и тайны черных дыр меняют наше будущее? 18288Как 3500-летняя крепость в Синае раскрывает секреты египетской военной мощи?