Акын из миллионника (@akyn_from_polis): Фундаментальные ограничения современных LLMs В коллаборации с ведущими учеными в LLMs ( и…

Акын из миллионника

Переслано от Spydell_finance

01.12.2025 00:30

Фундаментальные ограничения современных LLMs (продолжение)

В коллаборации с ведущими учеными в LLMs (Ян Лекун и Илья Суцкевер) и на основе собственных концептуальных прототипов (1 и 2).

Нынешний хайп вокруг «AGI - универсального интеллекта», который якобы возникнет сам собой из триллионов транзисторов - это маркетинговый миф. AGI не достигается методом масштабирования, нужна другая архитектура.

Качественные данные конечны. Стратегия «просто добавить больше данных» (Scaling Era – куда бигтехи инвестируют сотни миллиардов) уперлась в потолок доступного человеческого контента.

Модели выходят на плато по эффективности, дальше неизбежная деградация в связи с «заражением» моделей синтетическими данными, сгенерированными нейросетями (обучение на синтетических данных).

Обучение моделей на данных, сгенерированных другими моделями, приводит к потере «хвостов распределения» (редких, но важных знаний) и усреднению реальности. Это математически неизбежная деградация дисперсии, ведущая к «цифровому инцесту» и вшитыми в процесс обучения галлюцинациям.

Убывающая отдача инвестиций. Каждая следующая итерация (после экспоненциального роста в начале) требует несоизмеримо больше ресурсов ради минимального прироста качества. В 2026 году этот застой станет очевидным, кульминация в следующем году.

Дальнейший прогресс только через физический мир. Текст имеет низкую пропускную способность по сравнению с визуальным опытом. LLM изучают статистические корреляции в описаниях мира, а не динамические связи физической реальности.

Современные модели не являются ИИ в широком смысле, т.к. не обладают механизмом самообучения, критерием истинности и необходимым пулом характеристик, проявляющим наличие интеллекта (чисто формально, свыше 90% человеческой популяции также не обладают интеллектом).

Текущие LLM технически можно обвязать внешними «агентами», планировщиками, инструментами и заставить выглядеть более разумными. Но ядро остаётся тем же: статистический предсказатель последовательностей, а не миро-ориентированный разум.

Необходим переход от статических корреляций к казуальным и причинно-следственным связям в условиях динамического мира с неустойчивыми и противоречивыми связями, не поддающимися формализации (переход от статики с замороженными весами к непрерывному дообучению).

Необходима модификация алгоритмов с авторегрессии (генерации следующего токена) к абстрактной симуляции мира и от пассивного наблюдения к активному взаимодействую с окружающим пространством.

Проблема современный нейросетей в том, что нет динамического создания новых связей в ответ на опыт. Нет цикла «действие ? мир ? наблюдение ? обновление».

Отсутствие цикла «действие ? ошибка ? самокоррекция весов» в реальном времени с бесконечным циклом повторов и коррекций ошибок делает текущие модели «умными идиотами», запертыми в статической вселенной своих обучающих данных.

Концепция ИИ агентов неработоспособна. Почему? Без умения эффективно дробить задачи на подмодули и удерживать иерархию приоритетов, без наличия критерия истинности и без функционала самокоррекции, любой автономный агент неизбежно уйдет по неверной траектории в процессе итерации последовательности шагов.

Необходимо помнить про фундаментальные ограничения памяти и контекстного окна у LLMs, проблема стабильности и качества выходных токенов при расширении контекстного окна (склонность к галлюцинациям при перегруженной памяти).

LLM-ядро обеспечивает мощную аппроксимацию распределений и извлечение закономерностей, но без внешнего контура проверки/памяти/действий оно не даёт устойчивых свойств агентности: долговременных целей, причинной идентификации, надёжной самокоррекции.

Все это ставит текущую концепцию развитии ИИ крайне уязвимой с точки зрения способности возврата денежного потока – непропорционально много ресурсов в слишком неустойчивое равновесие и низкий прирост производительности.

На самом деле, восторженная презентация последних моделей оказалась не настолько блестящей, как было показано на рекламных слайдах. Все актуальные проблемы остались, скачка интеллекта не произошло.

Spydell_finance

Фундаментальные ограничения современных LLMs Интересное интервью Ильи Суцкевера (бывшего главного инженера OpenAI, а ныне основателя Safe Superintelligence). Это его первое публичное выступление с декабря 2024, но учитывая, что он является архитектором современного ядра LLM, его взгляд ценен. Идеи Ильи практически полностью пересекаются с моими концепциями, высказанными в нескольких циклах материалов по ИИ в этом году, поэтому перескажу, по сути, собственные идеи словами Ильи, но с более научным обрамлением. Главный тезис Ильи заключается в том, что период с 2012 по 2020 годы был «эпохой исследований», которая сменилась «эпохой масштабирования» (2020–2025), когда доминировал простой рецепт: больше данных + больше вычислений = лучше результат. Дополню от себя: это выражается в экспоненциальном росте капитальных расходов, достигающих 400 млрд в 2025 среди бигтехов США и зеркалировании выручки у производителей оборудования для развертывания ИИ. • Предел данных: предварительное обучение (pre-training) упирается…

$post[...] array (2)

Table (2)
Contents (2)

 hex html count emoji reaction
0 F09F918D <i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/FUTF-8 11 null ?
1 E29DA4 <i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/EUTF-8 3 null ?

0 => array (5)
$post['reactions'][0]
hex => string (8) "F09F918D"
$post['reactions'][0]['hex']
html => string (102) "?
count => integer 11
$post['reactions'][0]['count']
emoji => null
$post['reactions'][0]['emoji']
reaction => string (1) "?"
$post['reactions'][0]['reaction']
1 => array (5)
$post['reactions'][1]
hex => string (6) "E29DA4"
$post['reactions'][1]['hex']
html => string (100) "?
count => integer 3
$post['reactions'][1]['count']
emoji => null
$post['reactions'][1]['emoji']
reaction => string (1) "?"
$post['reactions'][1]['reaction']

	hex	html	count	emoji	reaction
0	F09F918D	<i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/FUTF-8	11	`null`	?
1	E29DA4	<i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/EUTF-8	3	`null`	?

? 11

? 3

11 496

Обсуждение 0

Вход в экосистему

Ваши настройки cookie