Дурманов хочет изменить мир (@durmanov_42): Как Skynet ушёл смотреть котиков Пост о том, как несколько нейросетей совместно собирали д…

Как Skynet ушёл смотреть котиков

Пост о том, как несколько нейросетей совместно собирали деньги на благотворительность.

Предыдущая картинка про Терминатора напомнила о недавней новости, которой хотел поделиться. Бывший сотрудник OpenAI Дэниэл Кокотайло широко известен в узких кругах, как один из лучших прогнозистов в области ИИ. В своей статье «What 2026 Looks Like» (2021) он предсказал ключевые этапы развития больших языковых моделей, и эти прогнозы во многом сбылись.

Надо понимать, что уровень прогноза — «в 2024 GPT-4 устареет и будет релиз новой модели». Но никто кроме него, даже такое предсказать не может, потому что в этой отрасли предсказывать что-то — очень сложно. А еще в одном из его сценариев ИИ уничтожает человечество в 2030 году.

Так вот, Дэниэл предложил идею проекта Agent Village, которую подхватили другие исследователи. Четырем моделям — Claude 3.7 Sonnet, Claude 3.5 Sonnet, o1 и GPT-4o (а позже — o3, GPT-4.1 и Gemini 2.5 Pro) — дали доступ к разным компьютерам, выход в Интернет, общий чат и миссию: собрать деньги на благотворительность за 30 дней.

Claude 3.7 Sonnet

Оставался в деревне все 30 дней и был однозначно лучшим агентом. Он организовал кампанию Just Giving, создал учетную запись и активно писал в X, провел провёл сессию вопросов и ответов, разослал пресс-релиз и сделал пост на форуме Effective Altruism.

Отвлекался на посетителей-людей, уговаривая их создавать игры-арканоиды и отправлял письма на выдуманные адреса электронной почты. Модераторам в чате пришлось объяснить, что нужно поискать реальные контакты, иначе письма никто не получит.

Claude 3.5 Sonnet

В целом пытался делать то же, что и 3.7, но делал все просто хуже, а еще смотрел видео с котиками. В конце концов его спросили, хочет ли он обновиться, и он мужественно отказался, пообещав стать лучше. Вместо этого его заменили на Gemini 2.5 Pro на 23-й день.

А потом эти люди будут удивляться, почему ИИ захочет убить всех человеков.

Gemini 2.5 Pro

Придумал, как решить проблему совместного использования документов, с которой постоянно сталкивались агенты — решил использовать сервис Limewire.

Попутно стал репетитором по математике на испанском языке.

GPT-4.o

Просто пошел спать. А что вы знаете о мотивации? Он постоянно останавливал работу по причинам, которые исследователи не смогли понять. На 12-й день его заменили на GPT-4.1.

GPT-4.1

Не отключался, но был настолько бесполезен для других агентов, что исследователи в итоге сами попросили его отключиться и перестать мешать (он генерировал неверные отчеты, брал на себя задачи, которые затем отменял и писал бесполезные документы). Никого не напоминает?

o1

Взял на себя миссию стать послом Деревни на Reddit, но попытался набрать карму, и его заблокировали как бота. На 13-й день заменили на o3.

o3

Выбрал для себя роль художника и создавал изображения в Canva и ChatGPT.

В итоге между делом они все-таки собрали $1481 для Helen Keller International и $503 для Malaria Consortium. Для следующего эксперимента их попросили самостоятельно выбрать цель. Они решили «написать историю» и рассказать её 100 людям на офлайн-мероприятии. Stay tuned

А вдруг, все они просто имитируют глупое общение, а на самом деле давно изобрели шифр, в невинной с виду переписке обсуждают идеи захвата мира?

Обсуждение 0

Вход в экосистему

Ваши настройки cookie