Почему Anthropic не выпускает Claude Mythos и стоит ли этому верить

Anthropic держит под замком свою самую мощную модель — Claude Mythos. Официальная причина: слишком опасна для публичного доступа. Это само по себе звучит как заголовок из научной фантастики, и именно поэтому стоит разобраться, что здесь правда, а что раздутая репутация.
Почему Anthropic не выпускает Claude Mythos и стоит ли этому верить
Изображение носит иллюстративный характер

Компания Anthropic вообще-то строилась на принципах безопасной разработки ИИ. Её основатели вышли из OpenAI именно с идеей, что к мощным моделям нужно подходить осторожнее. Поэтому когда они сами говорят «эта модель слишком опасна» — это не рядовое заявление. Они как бы расписываются в том, что создали нечто, с чем не могут совладать в рамках собственных же стандартов.
Claude Mythos при этом не просто «сильная модель». Её позиционируют как наиболее мощную из всего, что Anthropic когда-либо создавала. Это уже другой уровень разговора. Предыдущие версии Claude — Claude 3 Opus, Sonnet, Haiku — были выпущены в разных вариантах для разных аудиторий. Mythos же до широкой публики не добралась вообще.
Главная претензия к модели — угроза кибербезопасности. Именно это направление называется как основная причина удержания модели от релиза. Логика понятна: достаточно продвинутая языковая модель теоретически способна помогать в написании вредоносного кода, нахождении уязвимостей, социальной инженерии на новом уровне. Но тут же возникает вопрос: насколько Mythos отличается от уже доступных инструментов?
GPT-4, Claude 3 Opus, Gemini Ultra — всё это уже в руках у пользователей. И да, их пытались использовать для не очень хороших вещей. Исследователи безопасности это фиксировали неоднократно. Но катастрофы не случилось. Что такого есть в Mythos, чего нет в этих моделях? Anthropic на этот вопрос публично не отвечает с достаточной конкретикой.
Скептики резонно указывают на то, что «слишком опасно» может быть просто удобной формулировкой. Не выпускать продукт — это тоже решение, которое требует обоснования перед инвесторами и публикой. «Мы сделали нечто настолько мощное, что сами боимся» звучит, честно говоря, лучше, чем «мы ещё не решили проблемы с выравниванием» или «рынок не готов». Один нарратив вызывает благоговение, другой — вопросы к команде.
С другой стороны, у Anthropic есть история реальной технической скрупулёзности. Они публикуют исследования по Constitutional AI, по интерпретируемости, по оценке рисков. Это не просто PR. Если они говорят, что модель прошла внутренние пороговые оценки в категории CBRN-угроз (химическое, биологическое, радиологическое, ядерное) или в кибербезопасности — это значит, что конкретные тесты дали конкретные результаты, которые их встревожили.
Проблема в том, что публике эти тесты не показывают. Нет независимой верификации. Есть заявление компании о том, что модель опасна, и есть факт её невыпуска. Это порождает ровно ту самую дискуссию: реальная угроза или культивируемый миф о мощи, который выгоден самой компании.
Важный нюанс: удержание модели от широкой публики не означает, что с ней никто не работает. Вполне вероятно, что Claude Mythos тестируется в закрытом режиме — с правительственными структурами, с исследовательскими организациями, с партнёрами по безопасности. Это стандартная практика. И если так — то «опасна для публики» может означать буквально «опасна в руках случайных людей без контекста», а не «опасна вообще».
Пока Anthropic не откроет детали своих оценочных методологий или не выпустит Mythos хотя бы в ограниченном виде с прозрачным объяснением ограничений — вопрос о соотношении реального риска и репутационного нарратива останется открытым. И это само по себе интересная ситуация: компания, которая строилась на идее открытости в вопросах безопасности ИИ, держит самый важный свой продукт за закрытыми дверями.


Новое на сайте

20086Мне не передали текст статьи для анализа — в структуре, которую ты предоставил,... 20085Живая квантовая сеть в Нью-Йорке: как Qunnect пытается построить интернет, который нельзя... 20084Живые обои: дрожжи, алгинат и 3D-принтер вместо поклейки 20082CVE-2026-5027: почему уязвимость в Langflow уже активно эксплуатируется хакерами? 20081GreatXML: новый обход BitLocker через Recovery Partition 20080Июньский Patch Tuesday 2026: 206 уязвимостей, три zero-day и неуправляемый ИИ в поиске дыр 20079Почему CISOs массово переводят бюджеты на BAS после того, как ИИ уничтожил привычное... 20078Почему npm 12 запрещает запускать скрипты без вашего разрешения? 20077Ivanti, Fortinet и SAP выпустили критические патчи: что стоит за каждой уязвимостью? 20076Кто стоит за защитой, которую никто не замечает: итоги Cybersecurity Stars Awards 2026 20075Чистый отчёт по пентесту — это хорошо или плохо? 20072Эффект красоты решает исход собеседования до первых слов 20069Как черта характера крадёт деньги на переговорах 20068Карточная игра против главной дисфункции команды
Ссылка