gonzo-обзоры ML статей

@gonzo_ML

05.11.2025 20:43

Сначала рассматривали предобучение в контексте бесконечного компьюта (см. Pre-training under infinite compute, @gonzo_ML4038), теперь инференс. И там, и тут, выводы близкие: в любой непонятной ситуации делай ансамблирование ??

Title: Best-of-? - Asymptotic Performance of Test-Time Compute
Authors: Junpei Komiyama, Daisuke Oba, Masafumi Oyamada
Paper: https://arxiv.org/abs/2509.21091
Review: https://arxiviq.substack.com/p/best-of-asymptotic-performance-of
Code: https://github.com/jkomiyama/BoInf-code-publish

В статье представлен теоретический фреймворк "Best-of-?", определяющий асимптотический предел производительности для стратегии best-of-N (BoN) с голосованием по большинству. Чтобы приблизиться к этому пределу с конечными ресурсами, авторы предлагают два ключевых нововведения: 1) Адаптивный алгоритм сэмплинга, который использует байесовское моделирование (в частности, фактор Байеса), чтобы динамически решать, когда прекратить генерацию ответов, тем самым оптимизируя вычислительные затраты. 2) Метод создания оптимально взвешенных ансамблей из нескольких LLM, который формулирует задачу оптимизации весов в асимптотическом пределе как решаемую задачу смешанного целочисленного линейного программирования (MILP).

Подробнее: @gonzo_ML_podcasts1251

gonzo_ML_podcasts

Best-of-Infinity: Принципиальный подход к максимизации производительности LLM во время инференса Title: Best-of-? - Asymptotic Performance of Test-Time Compute Authors: Junpei Komiyama, Daisuke Oba, Masafumi Oyamada Paper: https://arxiv.org/abs/2509.21091 Review: https://arxiviq.substack.com/p/best-of-asymptotic-performance-of Code: https://github.com/jkomiyama/BoInf-code-publish # TL;DR Что сделано? В статье представлен теоретический фреймворк "Best-of-?", определяющий асимптотический предел производительности для стратегии best-of-N (BoN) с голосованием по большинству. Чтобы приблизиться к этому пределу с конечными ресурсами, авторы предлагают два ключевых нововведения: 1) Адаптивный алгоритм сэмплинга, который использует байесовское моделирование (в частности, фактор Байеса), чтобы динамически решать, когда прекратить генерацию ответов, тем самым оптимизируя вычислительные затраты. 2) Метод создания оптимально взвешенных ансамблей из нескольких LLM, который формулирует задачу оптимизации весов в асимптотическом…

? 4

? 3

? 1

1 25 5.4K

Обсуждение 1

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram

gonzo-обзоры ML статей

@gonzo_ML

24.3K

Авторы:
Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика.
Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

Все посты канала Открыть в Telegram Статистика канала

Обсуждение 1

Вход в экосистему

Ваши настройки cookie