avatar
Хабр
@habr_com
02.04.2026 18:01
Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Предсказание токенов и сжатие данных математически тождественны. Если смотреть на языковые модели как на lossy-кодеки, всё встаёт на свои места. Модель упаковывает терабайты датасетов в гигабайты весов, и при таком сжатии потери информации неизбежны.

Точные факты стираются первыми, как мелкие детали на пережатом JPEG. Наткнувшись на пробел, декодер просто достраивает правдоподобный фрагмент. Эту фундаментальную проблему не решить без внедрения RAG или бесконечного наращивания параметров.

Проанализируем математику этого процесса.
50
👍 29
🤔 15
🔥 8
🤣 6
🤡 4
😎 2
👌 1
😍 1
24 306 22.9K

Обсуждение 24

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram

Хабр

129.4K
НЛО с вами!

№ 5197888779

Хабр Новости → https://t.me/habr_com_news
Хабр Карьера → https://t.me/habr_career
Реклама → adv@habr.team
Открыть в Telegram