Лет тридцать подряд специалисты по безопасности жили по одной схеме: найти уязвимость, расставить приоритеты по CVSS, запланировать патч, проверить, двигаться дальше. Эта схема работала, потому что между обнаружением дыры и её эксплуатацией атакующим проходили месяцы. Именно этот временной зазор и был настоящим фундаментом всей отрасли патч-менеджмента. Сегодня этого фундамента нет.
По данным Zero Day Clock, средний показатель Time-to-Exploit (TTE) в 2024 году составлял около 53 дней. К 2026 году он сжался примерно до 24 часов. Это не постепенное сокращение, это обрыв. Процессы, которые строились из расчёта на несколько недель между обнаружением и атакой, физически не могут работать в условиях, когда на реакцию есть меньше суток.
Конкретные цифры делают картину ещё более неприятной. В мае 2026 года Anthropic совместно с примерно 50 партнёрами отчиталась о результатах работы своей закрытой модели Claude Mythos Preview: за один месяц она выявила более 10 000 уязвимостей высокого и критического уровня в «системно значимом программном обеспечении». При этом более 99% находок на момент публикации оставались незакрытыми. В тестах на Firefox модель написала 181 работающий эксплойт против двух, созданных предыдущей передовой моделью. Отдельно была найдена ошибка в OpenBSD, просидевшая незамеченной 27 лет.
В феврале 2026 года AWS опубликовал отчёт по угрозам, посвящённый атаке на устройства FortiGate. Атакующий не использовал никаких уязвимостей нулевого дня: достаточно оказалось слабых учётных данных и кастомного MCP-сервера (Model Context Protocol), который запускал наступательные инструменты автономно. AWS зафиксировал компрометацию 600+ устройств в 55+ странах. Независимые исследователи нашли в логах актора очередь из 2516 устройств в 106 странах. То, что раньше требовало редкой экспертизы, теперь масштабируется машиной без участия человека.
Отчёт Verizon 2026 DBIR, охвативший данные более чем 13 000 организаций, зафиксировал, что 32% техник первоначального доступа связаны с эксплуатацией уязвимостей, и эта доля будет расти. Но самое неудобное в этом отчёте не про атакующих, а про защищающихся. Медианное время устранения известных эксплуатируемых уязвимостей выросло с 32 до 43 дней год к году. Доля организаций, полностью закрывших такие уязвимости, упала с 38% до 26%. Даже лучшие команды закрывают лишь 30-40% известных эксплуатируемых уязвимостей в первую неделю после обнаружения, и этот показатель практически не менялся годами. В 2025 году медианная организация должна была обработать 16 известных эксплуатируемых уязвимостей (против 11 в 2024-м, рост около 50%), и это ещё до волны находок от ИИ-инструментов.
Требование «патчить быстрее» само по себе не решение. Патч требует регрессионного тестирования, согласования, окна для изменений, соблюдения обязательств по доступности систем. Аварийный простой это другая авария. Регуляторы движутся в сторону требований об исправлениях в тот же день для критических уязвимостей, но ни одна операционная реальность пока не позволяет этого сделать системно. Добавьте к этому проблему самого CVSS: когда ежедневно публикуются сотни и тысячи уязвимостей, список, где всё оценивается в 9 или 10 баллов, по факту ничего не приоритизирует. CVSS не показывает, достижима ли уязвимость именно в вашей среде, блокируют ли её уже существующие средства защиты и можно ли через неё выстроить цепочку к критическим активам.
Это и есть точка, где вопрос меняется с «Что у нас уязвимо?» на «Что реально эксплуатируемо прямо сейчас, и заметят ли наши средства защиты попытку атаки?» На этот вопрос отвечает Breach and Attack Simulation (BAS). Механизм прямолинейный: реальные тактики, техники и процедуры противника (TTPs) безопасно прогоняются против живого стека обнаружения и предотвращения. Это не сканирование и не теоретическое картирование, а фактическое испытание. На выходе видно, что блокируется, что детектируется, что проходит незамеченным.
BAS делает три вещи, которые классический VM не умеет. Первое: отделяет теоретический риск от реального, показывая, нейтрализует ли WAF, IPS или EDR конкретную уязвимость до того, как вы потратите силы на экстренный патч. Второе: проверяет, работают ли уже купленные инструменты так, как настроено, а не так, как предполагается (среднестатистическая крупная компания держит от 10 до 70 средств защиты с перекрывающимися политиками). Третье: если уязвимость перекрыта существующими контролями, патч проходит через обычный процесс согласования; если нет, сначала митигируют, потом патчат. Это и есть покупка времени без потери безопасности. Именно поэтому полевые наблюдения показывают, что CISOs выделяют под BAS отдельную строку бюджета там, где года не было ничего подобного.
Gartner сформулировал для этого подхода термин Adversarial Exposure Validation (AEV): сочетание оценки эффективности средств защиты с бизнес-контекстом. Не гипотетические сырые оценки CVSS, а приоритизация по тому, что реально достижимо в конкретной организации и что там наиболее ценно. В пару к BAS идёт автономное тестирование на проникновение, которое доказывает, сможет ли атакующий выстроить цепочку от первоначального плацдарма до критических активов. BAS спрашивает «Заметим ли мы?», авто-пентест спрашивает «Пробьются ли они?».
Но чтобы BAS работал против автономного противника, он сам должен быть автономным. Цикл валидации, который занимает неделю при ручном управлении, устаревает до завершения. Volkan Erturk, CTO компании Picus Security, указывал на конкретные риски прямого использования сырых генеративных ИИ-моделей: модель может вернуть живой образец вредоноса или выдумать техники, которые конкретная группировка никогда не применяла. Итог в первом случае — непроверенные бинарники в продакшене, во втором — защита от несуществующих атак.
Архитектура Picus Agentic BAS строится на мультиагентной системе, которая координирует заранее проверенную библиотеку готовых безопасных тестовых блоков. ИИ управляет логикой и координацией; пейлоады уже прошли предварительное одобрение. Рабочий процесс выглядит так: команда называет угрозу (скажем, свежее оповещение CISA или заголовок в новостях). Агент-планировщик идентифицирует угрозу и строит план исследования. Агенты-разведчики собирают и проверяют данные из нескольких источников. Агент-строитель превращает TTPs противника в цепочки атак, готовые к симуляции. На выходе через несколько минут: прицельный тест, оценка защищённости, приоритизированные меры и отчёт для руководства. Люди просматривают только исключения, а не управляют каждым шагом вручную.
По данным Zero Day Clock, средний показатель Time-to-Exploit (TTE) в 2024 году составлял около 53 дней. К 2026 году он сжался примерно до 24 часов. Это не постепенное сокращение, это обрыв. Процессы, которые строились из расчёта на несколько недель между обнаружением и атакой, физически не могут работать в условиях, когда на реакцию есть меньше суток.
Конкретные цифры делают картину ещё более неприятной. В мае 2026 года Anthropic совместно с примерно 50 партнёрами отчиталась о результатах работы своей закрытой модели Claude Mythos Preview: за один месяц она выявила более 10 000 уязвимостей высокого и критического уровня в «системно значимом программном обеспечении». При этом более 99% находок на момент публикации оставались незакрытыми. В тестах на Firefox модель написала 181 работающий эксплойт против двух, созданных предыдущей передовой моделью. Отдельно была найдена ошибка в OpenBSD, просидевшая незамеченной 27 лет.
В феврале 2026 года AWS опубликовал отчёт по угрозам, посвящённый атаке на устройства FortiGate. Атакующий не использовал никаких уязвимостей нулевого дня: достаточно оказалось слабых учётных данных и кастомного MCP-сервера (Model Context Protocol), который запускал наступательные инструменты автономно. AWS зафиксировал компрометацию 600+ устройств в 55+ странах. Независимые исследователи нашли в логах актора очередь из 2516 устройств в 106 странах. То, что раньше требовало редкой экспертизы, теперь масштабируется машиной без участия человека.
Отчёт Verizon 2026 DBIR, охвативший данные более чем 13 000 организаций, зафиксировал, что 32% техник первоначального доступа связаны с эксплуатацией уязвимостей, и эта доля будет расти. Но самое неудобное в этом отчёте не про атакующих, а про защищающихся. Медианное время устранения известных эксплуатируемых уязвимостей выросло с 32 до 43 дней год к году. Доля организаций, полностью закрывших такие уязвимости, упала с 38% до 26%. Даже лучшие команды закрывают лишь 30-40% известных эксплуатируемых уязвимостей в первую неделю после обнаружения, и этот показатель практически не менялся годами. В 2025 году медианная организация должна была обработать 16 известных эксплуатируемых уязвимостей (против 11 в 2024-м, рост около 50%), и это ещё до волны находок от ИИ-инструментов.
Требование «патчить быстрее» само по себе не решение. Патч требует регрессионного тестирования, согласования, окна для изменений, соблюдения обязательств по доступности систем. Аварийный простой это другая авария. Регуляторы движутся в сторону требований об исправлениях в тот же день для критических уязвимостей, но ни одна операционная реальность пока не позволяет этого сделать системно. Добавьте к этому проблему самого CVSS: когда ежедневно публикуются сотни и тысячи уязвимостей, список, где всё оценивается в 9 или 10 баллов, по факту ничего не приоритизирует. CVSS не показывает, достижима ли уязвимость именно в вашей среде, блокируют ли её уже существующие средства защиты и можно ли через неё выстроить цепочку к критическим активам.
Это и есть точка, где вопрос меняется с «Что у нас уязвимо?» на «Что реально эксплуатируемо прямо сейчас, и заметят ли наши средства защиты попытку атаки?» На этот вопрос отвечает Breach and Attack Simulation (BAS). Механизм прямолинейный: реальные тактики, техники и процедуры противника (TTPs) безопасно прогоняются против живого стека обнаружения и предотвращения. Это не сканирование и не теоретическое картирование, а фактическое испытание. На выходе видно, что блокируется, что детектируется, что проходит незамеченным.
BAS делает три вещи, которые классический VM не умеет. Первое: отделяет теоретический риск от реального, показывая, нейтрализует ли WAF, IPS или EDR конкретную уязвимость до того, как вы потратите силы на экстренный патч. Второе: проверяет, работают ли уже купленные инструменты так, как настроено, а не так, как предполагается (среднестатистическая крупная компания держит от 10 до 70 средств защиты с перекрывающимися политиками). Третье: если уязвимость перекрыта существующими контролями, патч проходит через обычный процесс согласования; если нет, сначала митигируют, потом патчат. Это и есть покупка времени без потери безопасности. Именно поэтому полевые наблюдения показывают, что CISOs выделяют под BAS отдельную строку бюджета там, где года не было ничего подобного.
Gartner сформулировал для этого подхода термин Adversarial Exposure Validation (AEV): сочетание оценки эффективности средств защиты с бизнес-контекстом. Не гипотетические сырые оценки CVSS, а приоритизация по тому, что реально достижимо в конкретной организации и что там наиболее ценно. В пару к BAS идёт автономное тестирование на проникновение, которое доказывает, сможет ли атакующий выстроить цепочку от первоначального плацдарма до критических активов. BAS спрашивает «Заметим ли мы?», авто-пентест спрашивает «Пробьются ли они?».
Но чтобы BAS работал против автономного противника, он сам должен быть автономным. Цикл валидации, который занимает неделю при ручном управлении, устаревает до завершения. Volkan Erturk, CTO компании Picus Security, указывал на конкретные риски прямого использования сырых генеративных ИИ-моделей: модель может вернуть живой образец вредоноса или выдумать техники, которые конкретная группировка никогда не применяла. Итог в первом случае — непроверенные бинарники в продакшене, во втором — защита от несуществующих атак.
Архитектура Picus Agentic BAS строится на мультиагентной системе, которая координирует заранее проверенную библиотеку готовых безопасных тестовых блоков. ИИ управляет логикой и координацией; пейлоады уже прошли предварительное одобрение. Рабочий процесс выглядит так: команда называет угрозу (скажем, свежее оповещение CISA или заголовок в новостях). Агент-планировщик идентифицирует угрозу и строит план исследования. Агенты-разведчики собирают и проверяют данные из нескольких источников. Агент-строитель превращает TTPs противника в цепочки атак, готовые к симуляции. На выходе через несколько минут: прицельный тест, оценка защищённости, приоритизированные меры и отчёт для руководства. Люди просматривают только исключения, а не управляют каждым шагом вручную.