@naebnet

30.03.2026 15:06

ИИ снова проигрывают людям: вышел новый бенчмарк ARC-AGI-3. Люди с ним справляются на 100%, а топовые нейронки не набирают и процента:

– Gemini 3.1 Pro решила на 0.37%;
– GPT 5.4 на 0.26%;
– Opus 4.6 на 0.25%;
– Grok-4.20 на 0.00%.

Для сравнения, ARC-AGI-1 пройден почти полностью, нейронки набирают до 98%. Рекорд в ARC-AGI-2 дошел уже до 85%.

Новый бенчмарк полностью состоит из игровых сред. Проверить себя можно по ссылке.

❤ 239

😁 91

🤯 24

👀 14

👍 2

🔥 1

403 107.9K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram

NN

A+ @naebnet

2.2M

Медиа про интернет, технологии и финансы

Сотрудничество: @nnmanager
Ютуб: https://youtube.com/naebnet

РКН: https://clck.ru/3FT7FW

Все посты канала

Открыть в Telegram

Обсуждение 0

NN

Вход в экосистему

Ваши настройки cookie