🚀
@SBERLOGASCI webinar on data science:
👨🔬 "Прогресс в применение МЛ к теории групп" А.Червов, Е. Урванов, И. Кольцов, В. Замковой, Д. Нагиев, В. Гордей, Р. Гордеев
⌚️ Среда 25 Сентября, 19.00 (по Москве)
Мы достигли стабильной решаемости для группы размера 10ˆ40 (кубик 444) несколькими вариантами нейро-сеток. Главные герои недели - Иван Кольцов и Джалал Нагиев - Иван закодил продвинутый алгоритм beam-seach использующий десяток дополнительных улучшений к классическому beam-search , а также придумал модификацию метрики Хемминга, такую, что она позволяет собирать кубик 333 без МЛ моделек. Джалал написал сетку которая собирает кубик 444 и имеет меньше параметров чем сетка Кирилла Хоружего, а также заметил, что надо исправить в ноутбуке с наиболее простыми вариантом сетки (Алексея Романова) , и теперь у нас есть три сетки которые стабильно собирают кубик 444.
Направление работ - какая архитектура сеток - наиболее оптимальна для данной задачи ? Какое минимальное время тренинга позволит решать кубик 444 - сейчас это 2 часа. Какое минимальное время инференса мы можем достичь для кубика 444 - сейчас это 28.7 секунд. Как качество масштабируется при увеличении а) числа парметров б) размера трейн сета в) измнение архитектуры г) изменение режима обучения - ленинг рейт, его режим изменения д) замена простого beam-search на продвинутые варианты и тд. е) какую наименьшую длину решения можно достигнуть - текущий рекорд 55.1 (Кирилл Хоружий, луч - 1 миллион, 8 миллионов параметров модель). Текущие результаты анализа собраны в таблице в скриншоте.
Другие направления - работа с группами размера 10ˆ75, анализ параметров бим-серча - какие наиболее важны.
========
Мы продолжаем проект по применению МЛ к теории групп, кому интересно присоединиться - пишите
@Alexander_v_c
Zoom link will be in
@sberlogabig just before start. Video records:
https://www.youtube.com/c/SciBerloga - subscribe !
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram