Блуждающий нерв (@dtulinov): Испытуемый смотрит мульт, с его головы считывают фМРТ, и по данным из мозга языковая модел…

Испытуемый смотрит мульт, с его головы считывают фМРТ, и по данным из мозга языковая модель реконструирует содержание видео, излагая его текстом.

То есть это не video-2-text, а сложнее и интереснее: Video-to-Brain-to-Text.

Суть контента пока улавливает лишь в общих чертах, но оцените сложность задачи, учитывая еще и низкое временное разрешение фМРТ (чудо, что удалось). Как proof of concept весьма впечатляет, причем так же работает еще и с аудио, и с внутренней речью. Генеративный ИИ усиливает возможности ИМК, так как семантику можно выразить по-разному, и не надо мучиться с дословной расшифровкой. Это касается как текста, так и видео.

Вышла, наконец, рецензируемая публикация.

Блуждающий нерв

10.2K

Публикации по нейронаукам, биоинженерии и вокруг, которые привлекли мое внимание. В основном это свежие исследования из научных журналов, но не обязательно.

Зарегистрирован в РКН: gosuslugi.ru/snet/67ac57a375b36e054efe938b

Обсуждение 28

Вход в экосистему

Ваши настройки cookie