avatar
Институт AIRI
@airi_research_institute
05.08.2025 17:45
Новый фреймворк сократит расходы на сбор и разметку данных для больших языковых моделей в 3 разаemoji

Российская команда разработчиков из R&D-центра Т-Технологий, AIRI, Высшей школы экономики, университета «Иннополис» и Центра практического искусственного интеллекта Сбера создала ATGen — первый комплексный фреймворк, который существенно упрощает и удешевляет обучение больших языковых моделей для задач генерации текста. Он подходит в том числе для небольших команд и делает возможным разметку и сбор данных без больших бюджетов.

Фреймворк использует парадигму активного обучения, при которой сама модель на каждом этапе выбирает, какие новые примеры ей нужны для максимального роста точности. ATGen также предоставляет удобный веб-интерфейс для ручной разметки данных, инструменты для оценки моделей с помощью популярных метрик для генеративных задач, интеграции с большими языковыми моделями-«учителями», включая OpenAI и Anthropic, а также современные методы эффективного обучения и инференса моделей (PEFT, vLLM, Unsloth и других).

Исследование было представлено на конференции ACL 2025, которая прошла в Австрии. Подробнее — в материале ТАСС.

Научная статья | GitHub
? 47
65 5.7K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram