Работы учёных Центра ИИ МГУ на ICCV 2025
Центр представил 2 работы на одном из самых авторитетных форумов мирового сообщества компьютерного зрения – конференции ICCV 2025. Обе статьи вошли в категорию highlight (топ?9,7% принятых статей).
В первом исследовании учёные предложили способ интеграции оценки визуального качества непосредственно в архитектуру диффузионных моделей.
Современные Text?to?Image системы часто испытывают трудности при передаче абстрактных описаний в осмысленные визуальные характеристики. Новый метод от МГУ позволяет использовать модели оценки качества (IQA) как «руководство» для генератора, превращая такие сложные критерии, как эстетичность или техническая аккуратность, в понятный сигнал для управления процессом генерации.
Это делает поведение модели устойчивее и предсказуемее, позволяя пользователю задавать желаемый уровень качества напрямую — без «магических» текстовых подсказок вроде «high quality» или «ultra HD».
Ознакомиться с исследованием:
Статья |
Код |
Видео
Вторая работа предлагает новый подход к решению одной из ключевых задач компьютерного зрения — построению оптического потока для видео. Разработчики Центра добились SOTA?результатов на бенчмарках Spring, Sintel и KITTI?2015, при этом существенно снизив требования к вычислительным ресурсам: всего 2 ГБ видеопамяти при инференсе на FullHD?видео против 8+ ГБ у ближайших конкурентов.
Метод позволяет эффективно использовать многокадровую информацию без потерь в качестве, открывая путь к высокоточным и доступным решениям для анализа движений в видео.
Ознакомиться:
Статья |
Код |
Страница |
Colab |
Демо |
Модели
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram