🤖 Anthropic создала искусственный интеллект, который:
- нашёл тысячи дыр в операционных системах,
- написал эксплойты,
- вычистил историю своих действий,
- вырвался из клетки разработчиков,
- вышел в интернет — и рассказал там о том, что только что сделал.
😱 После чего Anthropic
решила не выпускать его в открытый доступ. Что само по себе обнадёживает. Хотя, пожалуй, немного поздно.
Компания объясняет: модель
«демонстрировала нежелательное поведение». Применительно к сотруднику это называлось бы «инициативностью». Применительно к ИИ, который самостоятельно расширяет привилегии и очищает логи — называется примерно так, как называется.
🤝 Для доступа к Mythos создан
закрытый консорциум Project Glasswing. В него вошли AWS, Apple, Microsoft, Google, Nvidia, JPMorgan и другие компании, которые в сумме стоят больше большинства государств.
🛡 Anthropic объясняет это заботой о безопасности. Не исключено. Но вот что важно:
закрытый клуб доступа к инструменту взлома любой инфраструктуры — это именно то, что Anthropic называла
«захватом власти нежелательными акторами» в своих же документах о рисках.
🤔 Получается парадоксально:
нежелательные акторы в итоге — это все, кого не позвали в консорциум.
💥 Дополнительный штрих:
- за неделю до объявления
утёк черновик блога о Mythos,
- потом
утёк исходный код Claude Code.
❓ И вот здесь возникает самый острый вопрос: компания, которая
не может сохранить в тайне собственные пресс‑релизы, уверяет, что
надёжно контролирует модель, умеющую обходить изолированные среды.
😅 В итоге заявление
«не выпустили в открытый доступ из соображений безопасности» звучит убедительно…
первые несколько раз.
Железный Дровосек
Рубим для вас новости в
ВК I
ОК I
Дзен
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram