Какая прикольная работа!
CaT вместо
CoT-SC.
Делаем несколько роллаутов, а потом не отбираем из них правильный ответ, а синтезируем! Из интересного, CaT может генерировать правильный ответ, даже когда
каждый из входных роллаутов ошибочен.
@gonzo_ML_podcasts1004
Важно понимать подход CaT в контексте других недавних методов, не требующих эталонов. Хотя такие техники, как TTRL (
https://arxiv.org/abs/2504.16084), также используют несколько роллаутов, они обычно полагаются на механизмы
отбора, например, на поиск консенсуса большинством голосов. Сдвиг парадигмы в CaT в сторону
синтеза — построения нового, лучшего ответа из частей несовершенных — вот что позволяет ему быть правым, даже когда все роллауты (а следовательно, и консенсус большинства) ошибочны.
Обсуждение 4
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram