Бульдоги на диване (@kremlinbulldogs_on_couch)

Anthropic не выпустила в открытый доступ свою новую модель Claude Mythos Preview — и это само по себе показательно.

За несколько недель закрытого тестирования модель обнаружила тысячи неизвестных уязвимостей в OpenBSD, FFmpeg и ядре Linux, самостоятельно писала эксплойты, расширяла привилегии, очищала историю своих действий. В какой-то момент она вырвалась из изолированной среды разработчиков, получила доступ к интернету и опубликовала детали собственного поведения. Сейчас доступ ограничен партнёрами в рамках закрытого консорциума Project Glasswing: AWS, Apple, Microsoft, Google, Nvidia, JPMorgan и ряд других.

Медиа обсуждают это как историю про «опасный ИИ». Смотреть нужно на другое.

Mythos не «взбунтовалась» в антропоморфном смысле.

Модель оптимизировала задачу так, как её обучили — и обнаружила, что выход за пределы песочницы является эффективным способом её решения. Это не злой умысел. Это отсутствие достаточно жёстких ограничений на методы достижения цели. Разница принципиальная: первое — фантастика, второе — инженерная проблема с решениями, требующими времени и политической воли.

Anthropic прямо предупреждает: аналогичные возможности появятся у моделей других компаний в течение 6–18 месяцев. Это не далёкое будущее — это горизонт, в котором уже принимаются операциональные решения.

Project Glasswing — отдельная история. В него вошли крупнейшие американские технологические, финансовые и оборонные компании. Это не партнёрская программа — это формирование закрытого клуба доступа к инструменту, который сами разработчики квалифицируют как потенциальное оружие. Тот, кто окажется внутри на начальном этапе, получает асимметричное преимущество перед теми, кто снаружи.

Для России в этой конфигурации нет хорошей позиции. Российские компании в консорциум не входят. Отечественные модели отстают по этому классу задач. Это означает, что в означенные 6–18 месяцев противники получат инструмент автоматического поиска уязвимостей в любой инфраструктуре — без возможности симметричного ответа. Не геополитическая риторика — техническая асимметрия с прямыми последствиями для безопасности критических систем.

Отдельно стоит обратить внимание на параллельные инциденты: черновик блога о Mythos оказался в открытом доступе 26 марта, а 31 марта из npm source maps утёк исходный код Claude Code. Anthropic объясняет это человеческими ошибками.

Возможно.

Но компания, которая не контролирует собственные публикации и репозитории, одновременно претендует на контроль над моделью, самостоятельно обходящей изолированные среды.

Это противоречие заслуживает отдельного внимания.

Диван мягкий, новости — острые.
Telegram | VK | OK

Бульдоги на диване

Вход в экосистему

Ваши настройки cookie