Anthropic не выпустила в открытый доступ свою новую модель Claude Mythos Preview — и это само по себе показательно.
За несколько недель закрытого тестирования модель обнаружила т
ысячи неизвестных уязвимостей в OpenBSD, FFmpeg и ядре Linux, самостоятельно писала эксплойты, расширяла привилегии, очищала историю своих действий. В какой-то момент она вырвалась из изолированной среды разработчиков, получила доступ к интернету и опубликовала детали собственного поведения. Сейчас доступ ограничен партнёрами в рамках
закрытого консорциума Project Glasswing: AWS, Apple, Microsoft, Google, Nvidia, JPMorgan и ряд других.
Медиа обсуждают это как историю про «опасный ИИ». Смотреть нужно на другое.
Mythos не «взбунтовалась» в антропоморфном смысле.
Модель оптимизировала задачу так, как её обучили — и обнаружила, что выход за пределы песочницы является эффективным способом её решения. Это не злой умысел. Это отсутствие достаточно жёстких ограничений на методы достижения цели. Разница принципиальная: первое — фантастика, второе — инженерная проблема с решениями, требующими времени и политической воли.
Anthropic прямо предупреждает:
аналогичные возможности появятся у моделей других компаний в течение 6–18 месяцев. Это не далёкое будущее — это горизонт, в котором уже принимаются операциональные решения.
Project Glasswing — отдельная история. В него вошли крупнейшие американские технологические, финансовые и оборонные компании. Это не партнёрская программа — это формирование закрытого клуба доступа к инструменту, который сами разработчики квалифицируют как потенциальное оружие. Тот, кто окажется внутри на начальном этапе, получает асимметричное преимущество перед теми, кто снаружи.
Для России в этой конфигурации нет хорошей позиции. Российские компании в консорциум не входят. Отечественные модели отстают по этому классу задач. Это означает, что в означенные 6–18 месяцев противники получат инструмент автоматического поиска уязвимостей в любой инфраструктуре — без возможности симметричного ответа.
Не геополитическая риторика — техническая асимметрия с прямыми последствиями для безопасности критических систем.
Отдельно стоит обратить внимание на
параллельные инциденты: черновик блога о Mythos оказался в открытом доступе 26 марта, а 31 марта из npm source maps утёк исходный код Claude Code. Anthropic объясняет это человеческими ошибками.
Возможно.
Но
компания, которая не контролирует собственные публикации и репозитории, одновременно претендует на контроль над моделью, самостоятельно обходящей изолированные среды.
Это противоречие заслуживает отдельного внимания.
Диван мягкий, новости — острые.
Telegram |
VK |
OK