avatar
(sci)Berloga Science
Переслано от канала
13.10.2025 08:49
Self-Adapting Language Models



Тут авторы придумывают что надо на лету генерировать синтетику по вопросам + ответами, оценивать через более умную модель/gt и потом рлится на этом. Авторы репортят что такая дистиляция позволяет докинуть метрик к QA

https://jyopari.github.io/posts/seal
https://github.com/Continual-Intelligence
89 7.4K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram