gonzo-обзоры ML статей

@gonzo_ML

29.10.2025 22:27

Краткость — сестра

Адаптация LLM через прунинг весовых матриц. Что надо прунить — определяется по градиенту функции потерь по сингулярным значениям матрицы, что даёт точный, целенаправленный сигнал о том, какие части структуры модели вредны и должны быть подвергнуты прунингу. И для этого достаточно 100 размеченных примеров. Magic.

Подробнее: @gonzo_ML_podcasts1127

gonzo_ML_podcasts

Адаптация LLM за минуты: нужен всего один шаг градиентного спуска Title: Compress to Impress: Efficient LLM Adaptation Using a Single Gradient Step on 100 Samples Authors: Shiva Sreeram, Alaa Maalouf, Pratyusha Sharma, Daniela Rus Paper: https://arxiv.org/abs/2510.20800 Review: https://arxiviq.substack.com/p/compress-to-impress-efficient-llm Code: не указан Models: GPT-J, Roberta # TL;DR Что сделано? В статье представлен чрезвычайно эффективный метод адаптации больших языковых моделей (LLM) к новым доменам, не требующий обучения. Он основан на технике LAyer-SElective-Rank reduction (LASER), но решает её главное узкое место: медленный полный перебор весовых матриц, которые нужно сжать. Авторы заменяют этот перебор одним-единственным обратным проходом всего по 100 размеченным примерам. Градиент сингулярных значений каждой матрицы используется для надёжной оценки и определения компонентов, которые вредят модели и которые следует подвергнуть прунингу. Кроме того, авторы улучшают качество сжатия, вводя многопо…

? 5

? 4

? 2

53 5.3K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram

gonzo-обзоры ML статей

@gonzo_ML

24.3K

Авторы:
Гриша Сапунов, ранее руководитель разработки Яндекс-Новостей, ныне CTO Intento. Области интересов: AI/ML/DL, биоинформатика.
Лёша Тихонов, ранее аналитик в Яндексе, автор Автопоэта, Нейронной Обороны... Области интересов: discrete domain, NLP, RL.

Все посты канала Открыть в Telegram Статистика канала

Обсуждение 0

Вход в экосистему

Ваши настройки cookie