Интригующее от MIT & Google Research: массивные модели трансформеры, похожие на LLMs, содержат в скрытых слоях другие модели, как бы меньшие версии самих себя. И
обучают их. Только недавно увидел, и это крайне любопытно в контексте пространства состояний психики, множественных личностей, скрытых состояний мозга и т.п.
Среди авторов
препринта Андреас из MIT CSAIL, о котором я уже
упоминал. Он копает в верном направлении, надо бы присмотреться. [кстати, есть
видео-обзор на эту работу]
Обсуждение 3
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram