Почему Qwen-2.5 Max не повторит фурора DeepSeek R1
Со вчера многие пишут про новую версию Max у Qwen.
Почему считаю, что она не даст эффекта R1?

Нет показа рассуждений, а именно этим R1 эмоционально всех покорил. Давайте признаем, что умиляет смотреть, как он в панике пишет:
"Так, пользователь спросил меня, почему я так ответил. Наверное, я сказал, что-то не то. Надо постараться оставить кожаного мешка пользователя довольным"
⚛️ Эти рассуждения дают обратную связь человеку. Даже обучают нас в сложных задачах. Плюс мы понимаем, когда ИИ в своих рассуждениях свернул не туда и соответственно как надо изменить промпт.
Так мой сын плотно занимается ИИ (проходит сейчас отбор на олимпиаду в Китай). Он с интересом смотрит, как R1 минуту рассуждает над задачей. Образовательный эффект мощный, если ты сам этого хочешь.
Итак, рассуждения выглядят свежо, интересно, полезно и вирально (все постят их до сих пор). Вместо них новый Qwen Max предлагает просто долгую печать ответа. Вероятно, пропускает несколько раз через себя, перепроверяет. Как и o1. Кожаным скучно просто ждать.
Считаю, что сейчас нужны крутые тулзы. У того же Chat GPT есть холст для кодинга.
Пример на скрине. В нем я просто продолжил тест гоночной трассы, который выкладывал выше. Так вот c R1 без холста повторять такое гораздо менее удобно. Чем больше код, тем менее удобно. ��Кто добавит хорошо работающий бесплатный холст, а потом и поддержку многофайловую, и большой контекст, тот точно привлечет внимание
�� Это для веба. А для API Qwen Max очень дорогой. И закрытый (в отличии от R1). Пишут, что получается в 30 раз дороже (!), чем DeepSeek V3, и в 2 раза дороже, чем дорогой Sonnet.
Единственное, на Qwen можно создать видео в диалоге, но я такими вещами редко пользуюсь. Попробовал сгенерировать - очень долго висит на 99%, не дождался ��♂️
В общем, Qwen Max не ответ на R1. Он ответ на 4o / o1. Если бы он вышел хотя бы на неделю раньше, было бы круто, а так он вышел уже в тени R1. Считаю так.
А вы попробовали уже? что думаете?
https://chat.qwenlm.ai - не забудьте сверху слева выбрать модель Max
�� Пытаюсь в стартап: 355 дней
(все-таки буду вести отчет от первого спринта, а не от создания компании)
@it_sabat
Обсуждение 1
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram