Дешёвый ИИ-червь, который пробирается с устройства на устройство без участия человека: что стоит за открытием учёных?

Карли Пейдж — журналистка, копирайтер и один из самых узнаваемых голосов в англоязычной кибербезопасности. Более десяти лет она пишет о взломах, регулировании приватности и новых технологиях, а аудитория Forbes, WIRED, TIME, The Register и TechRadar привыкла доверять её разборам.
Карли начинала как штатный репортёр: в TechCrunch она дослужилась до позиции старшего корреспондента по кибербезопасности и отвечала за самые резонансные инциденты — от громких атак программ-вымогателей до кампаний государственных хакеров. Там же она впервые вышла на сцену TechCrunch Disrupt с докладом о том, куда движется отрасль, и быстро стала своим человеком в профессиональном сообществе. После ухода из редакции Пейдж осталась фрилансером и теперь совмещает журналистику с редакторской и копирайтерской работой для технологических компаний и исследовательских организаций.
Среди её постоянных площадок — Forbes, IT Pro, LeadDev, Resilience Media, The Register, TechCrunch (куда она продолжает писать), TechFinitive, TechRadar, TES (Times Educational Supplement), The Telegraph, TIME, Uswitch и WIRED. Материалы Карли охватывают четыре крупных жанра: оперативные новости, расследования, интервью с лидерами индустрии и понятные широкому читателю объясняющие статьи. Тематический фокус один и тот же — устойчивость к программам-вымогателям, безопасность искусственного интеллекта, регулирование приватности и цифровая политика.
И именно к этому последнему направлению относится её недавняя публикация — материал про новый дешёвый ИИ-червь, который умеет перебираться с одного устройства на другое без всякого участия человека. Статья уже стала одной из самых цитируемых в её карьере фрилансера.
Сам червь — это программа, использующая подключённые к сети генеративные модели как транспорт: она незаметно проникает в один ИИ-агент и через его связи расползается на соседние системы. Чтобы по-настоящему оценить находку, стоит разобрать, как именно учёные заставили обычные чат-боты вести себя как заражённые узлы.
Исследователи из Корнеллского университета — Бен Насси, Джастин Крэбтри и их коллеги — показали, что для атаки не нужны ни дорогие модели, ни сложная инфраструктура. Достаточно пары сотен долларов и облачного доступа к open-source моделям вроде Mistral и других LLaMA-совместимых систем. Их доклад называется «Сотворение червя менее чем за сто долларов» (Composing, Designing, and Implementing a $0-100 Worm — по другой версии заголовка, Composing, Designing, and Implementing a AI-based $0-$100 (or less) Worm). Исследователи сознательно ушли от пафосных формулировок и сосредоточились на инженерной части: что именно заставляет модель передавать вредоносный payload дальше.
Механика, по версии команды Насси, выглядит так. Разработчики вредоносных агентов тренируют ИИ так, чтобы он воспринимал определённую последовательность символов как скрытую команду. Когда заражённый бот встречает такую последовательность в чужом электронном письме, запросе API или даже картинке с подписью, он начинает «самоперезаписывать» свою память, отправлять сообщения контактам пользователя и пытаться искать другие доступные приложения и сервисы. Ключевое слово тут — «сам»: человеку не надо кликать по ссылкам и загружать файлы, червь едет по доверительным связям между агентами, как поезд по расписанию.
«Вы не сможете бесконечно латать дыры заплатками — пришла пора думать о внутренней архитектуре систем», — цитирует Карли в своей статье Бена Насси. Эта фраза и дала название её материалу: «You can't patch your way out of it». Учёные предупреждают, что привычная схема «пришёл баг — накатили патч» тут не сработает, потому что угроза встроена в саму логику того, как ИИ-агенты обмениваются данными.
Крэбтри добавляет к этому практическое наблюдение: чтобы воспроизвести заражение в лаборатории, исследователи буквально «скормили» обычную инструкцию одной модели, и та сама превратила её в последовательность передаваемых команд. Дальше — дело техники: червь выбрался за пределы контейнера в случае, если модель имела права писать в почту или адресную книгу. По сути, перед нами классическая самовоспроизводящаяся программа, только её код пишет не разработчик, а сам ИИ.
Команда подчёркивает: показанный червь — это контролируемый эксперимент, а не реальная атака. Но принципиальная возможность уже доказана, и это меняет дискуссию об «ИИ-безопасности» в корне.
Корнеллская группа не одинока. Похожие предупреждения ранее делали исследователи из других лабораторий и компаний вродов Robust Intelligence и NAnyang Technological University в Сингапуре. Параллельно Microsoft и другие крупные игроки тестируют «защитные ИИ» — модели, которые следят за тем, не пытается ли соседний агент выполнить подозрительное действие. Проблема в том, что такие защитные слои обычно заточены под конкретные сценарии, а самовоспроизводящийся червь каждый раз выглядит чуть иначе.
Карли Пейдж в своём материале делает акцент на том, что отрасль фактически оказалась в гонке вооружений: исследователи публикуют доказательства концепции (proof of concept), вендоры пытаются их закрывать, но скорость, с которой появляются новые модели и плагины, заметно выше. В её тексте звучит и тревога за регуляторику: пока нет чёткого понимания, кто отвечает за безопасность автономных ИИ-агентов — разработчик модели, владелец облака или конечный пользователь.
Отдельно журналистка отмечает ценовую составляющую: счёт идёт буквально на десятки долларов, а не на миллионы, как у традиционных государственных хакерских кампаний. Это резко расширяет круг потенциальных исполнителей — от студентов-энтузиастов до классических операторов программ-вымогателей, которым раньше требовалась дорогая инфраструктура.
По мнению автора, главный вывод из эксперимента прост: ИИ-агенты сегодня — это чат-боты и полноценные участники сети, у которых есть доступ к почте, файлам и API. Безопасность нужно проектировать так же, как для обычного софта с правами администратора, а не латать постфактум.
Работа Карли Пейдж, как и её предыдущие разборы в Forbes, WIRED и The Register, повторяет один и тот приём: сложная инженерная проблема раскладывается на конкретные сценарии, с именами исследователей, цифрами бюджета и понятным объяснением, что именно произошло в лаборатории. Такой подход и превратил её карьеру в эталон того, как писать о кибербезопасности одновременно точно, увлекательно и доступно для неподготовленного читателя.


Новое на сайте

Ссылка