avatar
МГУ имени М.В.Ломоносова
Переслано от канала
18.12.2025 14:34
Работы учёных Центра ИИ МГУ на ICCV 2025

Центр представил 2 работы на одном из самых авторитетных форумов мирового сообщества компьютерного зрения – конференции ICCV 2025. Обе статьи вошли в категорию highlight (топ?9,7% принятых статей).

В первом исследовании учёные предложили способ интеграции оценки визуального качества непосредственно в архитектуру диффузионных моделей.

Современные Text?to?Image системы часто испытывают трудности при передаче абстрактных описаний в осмысленные визуальные характеристики. Новый метод от МГУ позволяет использовать модели оценки качества (IQA) как «руководство» для генератора, превращая такие сложные критерии, как эстетичность или техническая аккуратность, в понятный сигнал для управления процессом генерации.

Это делает поведение модели устойчивее и предсказуемее, позволяя пользователю задавать желаемый уровень качества напрямую — без «магических» текстовых подсказок вроде «high quality» или «ultra HD».

Ознакомиться с исследованием: Статья | Код | Видео

Вторая работа предлагает новый подход к решению одной из ключевых задач компьютерного зрения — построению оптического потока для видео. Разработчики Центра добились SOTA?результатов на бенчмарках Spring, Sintel и KITTI?2015, при этом существенно снизив требования к вычислительным ресурсам: всего 2 ГБ видеопамяти при инференсе на FullHD?видео против 8+ ГБ у ближайших конкурентов.

Метод позволяет эффективно использовать многокадровую информацию без потерь в качестве, открывая путь к высокоточным и доступным решениям для анализа движений в видео.

Ознакомиться: Статья | Код | Страница | Colab | Демо | Модели
? 15
? 5
5
??? 1
? 1
? 1
? 1
? 1
7 3.2K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram