Claude Code: проблемы лимитов и качества
В последние недели/месяцы, всё больше и больше людей жалуются на то, что лимиты в Claude Code достигаются слишком быстро, значительно быстрее чем раньше. Плюс кажется, что качество упало.
Бывает сложно понять насколько это объективно: иногда компании реально нерфят модели, иногда людям это просто кажется.
Я собрал три обсуждения с Github, которые, как мне кажется, качественно объясняют эти проблемы:
1. Про качество:
link. В начале марта дефолтное значение thinking effort/budget было уменьшено с high/max до medium. Это прям сильно ударило по качеству, я даже на работе заметил. К счастью, это решается просто: достаточно запускать
claude --effort max или проставить это в настройках.
С лимитами хуже:
Сейчас открыто два issue:
первое и
второе.
Первое говорит, что раньше Cache TTL был 1 час, а теперь всего 5 минут. Это значит, что Clade Code перезагружает контекст каждые 5 минут неактивности. В результате тратится лишнее время, чтобы перезагрузить инфу, а также тратится намного больше токенов, чтобы каждый раз "вспомнить" весь контекст.
Само по себе это уже плохо, но второе issue усугубляет ситуацию: автор заявляет, что скорее всего чтение кэша не со скидкой (1/10), а по полной цене.
Комбинация этих двух проблем даёт очень неприятные результаты - кэш регулярно обновляется и стоит полную стоимость.
Будем надеяться, что это пофиксят
P. S. Если Mythos такой могучий, почему он ещё не пофиксил всё?
#datascience #ai
Обсуждение 20
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram