МГУ имени М.В.Ломоносова (@naukamsu): Работы учёных Центра ИИ МГУ на ICCV 2025 Центр представил 2 работы на одном из самых автор…

Работы учёных Центра ИИ МГУ на ICCV 2025

Центр представил 2 работы на одном из самых авторитетных форумов мирового сообщества компьютерного зрения – конференции ICCV 2025. Обе статьи вошли в категорию highlight (топ?9,7% принятых статей).

В первом исследовании учёные предложили способ интеграции оценки визуального качества непосредственно в архитектуру диффузионных моделей.

Современные Text?to?Image системы часто испытывают трудности при передаче абстрактных описаний в осмысленные визуальные характеристики. Новый метод от МГУ позволяет использовать модели оценки качества (IQA) как «руководство» для генератора, превращая такие сложные критерии, как эстетичность или техническая аккуратность, в понятный сигнал для управления процессом генерации.

Это делает поведение модели устойчивее и предсказуемее, позволяя пользователю задавать желаемый уровень качества напрямую — без «магических» текстовых подсказок вроде «high quality» или «ultra HD».

Ознакомиться с исследованием: Статья | Код | Видео

Вторая работа предлагает новый подход к решению одной из ключевых задач компьютерного зрения — построению оптического потока для видео. Разработчики Центра добились SOTA?результатов на бенчмарках Spring, Sintel и KITTI?2015, при этом существенно снизив требования к вычислительным ресурсам: всего 2 ГБ видеопамяти при инференсе на FullHD?видео против 8+ ГБ у ближайших конкурентов.

Метод позволяет эффективно использовать многокадровую информацию без потерь в качестве, открывая путь к высокоточным и доступным решениям для анализа движений в видео.

Ознакомиться: Статья | Код | Страница | Colab | Демо | Модели

Обсуждение 0

Пожаловаться

Обсуждение 0

Вход в экосистему

Ваши настройки cookie