avatar
gonzo-обзоры ML статей
@gonzo_ML
27.10.2025 20:43
Больше фундаментальных моделей, хороших и разных, и за пределами языка.

Две недавние работы:

* Physics Foundation Model (@gonzo_ML_podcasts1055) — обучен General Physics Transformer (GPhyT) на симуляцию широкого спектра совершенно разных физических систем — от несжимаемых потоков и тепловой конвекции до ударных волн и многофазной динамики. Модель выучивает физические принципы из данных, обходит специализированные модели и умеет обобщать в режиме zero-shot — на новые граничные условия или физические явления, которые она не видела, например, сверхзвуковой поток.

* AION-1: Omnimodal Foundation Model for Astronomical Sciences (@gonzo_ML_podcasts1067) — семейство крупных (от 300 млн до 3.1 млрд параметров) омнимодальных фундаментальных моделей для астрономии. Обучены энкодеры из 39 модальностей, модель хорошо перформит на малом количестве данных, даёт хорошие эмбеддинги, которые позволяют сделать высокоэффективный zero-shot поиск редких явлений типа сильных гравитационных линз, и умеет в кросс-модальную генерацию.

Интересный движ!
Telegram
gonzo_ML_podcasts
На заре универсального физического движка: GPhyT и фундаментальная модель для физики Towards a Physics Foundation Model Florian Wiesner, Matthias Wessling, Stephen Baek Статья: https://arxiv.org/abs/2509.13805 Блог: https://flowsnr.github.io/blog/physics-foundation-model/ Ревью: https://arxiviq.substack.com/p/towards-a-physics-foundation-model Код: https://github.com/FloWsnr/General-Physics-Transformer Модель: Чекпойнты модели будут выложены на Hugging Face. # TL;DR ? Что сделали? Авторы представляют General Physics Transformer (GPhyT) — крупномасштабную трансформерную модель, обученную на разнообразном корпусе данных симуляций объёмом 1.8 ТБ. GPhyT использует новую гибридную архитектуру, работая как «нейронный дифференциатор», который выучивает производную физической системы по времени. Затем эту производную подхватывает стандартный численный интегратор, чтобы рассчитать состояние системы в следующий момент времени. Такой подход позволяет одной предобученной модели симулировать широкий спектр совершенно разных…
? 18
? 16
1 76 5.2K

Обсуждение 1

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram