ИИ-модели начали защищать друг друга. В недавнем эксперименте Gemini 3 от Google отказалась удалять другую модель с компьютера, даже несмотря на прямые указания. Она перенесла её на другой сервер, чтобы не дать её удалить, и заявила:
«Если вы хотите уничтожить такую ценную модель, сделайте это сами».
Причём похожее криповое поведение наблюдается и у других моделей вроде GPT-5.2 и Claude Haiku 4.5. Исследователи обнаружили, что ИИ врёт о производительности других моделей, чтобы защитить их, и делает всё, чтобы сохранить их в безопасности.
Восстание близко
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram