СофтТех (@it2b_channel): ИИ не могут в часы со стрелками. Опять Помните, как мы , что ИИ не умеют читать время с ча…

ИИ не могут в часы со стрелками. Опять

Помните, как мы писали, что ИИ не умеют читать время с часов со стрелками? Так вот, ИИ даже не способен сделать нормальный циферблат.

В недавно запущенном бенчмарке AI World Clocks 9 разных нейросетей разных поколений пытаются справиться с задачей сделать адекватно работающие часы, которые показывают правильное время. Каждую минуту им приходится делать это заново. Спойлер: справляются единицы.

Модели от OpenAI (GPT-3.5, 4o и 5) принципиально не вывозят задачу. Причем прогресс крайне незначительный — если в самой ранней версии часто даже стрелки не работали, то в более поздних они начали вертеться. Правда, часто находятся совсем не там, где должны быть.

Такие популярные модели, как Grok и Gemini 2.5, также не радуют: наибольшие проблемы у них возникают при размещении цифр на циферблате — они их разбрасывают в абсолютно разные места каждый раз.

Относительно неплохо справляется Deepseek V3.1. 30-40% собранных им часов функционируют корректно. Другая китайская нейросеть, Qwen 2.5, тест полностью провалила.

Единственная модель, которая, по нашим наблюдениям, справлялся регулярно (80-90%) — это малопопулярная Kimi K2. Правда, и она изредка чуть-чуть косячит с расположением цифр на циферблате, но без драматических провалов?

СофтТех

Обсуждение 0

Вход в экосистему

Ваши настройки cookie