avatar
Акын из миллионника
Переслано от Spydell_finance
01.12.2025 00:30
Фундаментальные ограничения современных LLMs (продолжение)

В коллаборации с ведущими учеными в LLMs (Ян Лекун и Илья Суцкевер) и на основе собственных концептуальных прототипов (1 и 2).

Нынешний хайп вокруг «AGI - универсального интеллекта», который якобы возникнет сам собой из триллионов транзисторов - это маркетинговый миф. AGI не достигается методом масштабирования, нужна другая архитектура.

Качественные данные конечны. Стратегия «просто добавить больше данных» (Scaling Era – куда бигтехи инвестируют сотни миллиардов) уперлась в потолок доступного человеческого контента.

Модели выходят на плато по эффективности, дальше неизбежная деградация в связи с «заражением» моделей синтетическими данными, сгенерированными нейросетями (обучение на синтетических данных).

Обучение моделей на данных, сгенерированных другими моделями, приводит к потере «хвостов распределения» (редких, но важных знаний) и усреднению реальности. Это математически неизбежная деградация дисперсии, ведущая к «цифровому инцесту» и вшитыми в процесс обучения галлюцинациям.

Убывающая отдача инвестиций. Каждая следующая итерация (после экспоненциального роста в начале) требует несоизмеримо больше ресурсов ради минимального прироста качества. В 2026 году этот застой станет очевидным, кульминация в следующем году.

Дальнейший прогресс только через физический мир. Текст имеет низкую пропускную способность по сравнению с визуальным опытом. LLM изучают статистические корреляции в описаниях мира, а не динамические связи физической реальности.

Современные модели не являются ИИ в широком смысле, т.к. не обладают механизмом самообучения, критерием истинности и необходимым пулом характеристик, проявляющим наличие интеллекта (чисто формально, свыше 90% человеческой популяции также не обладают интеллектом).

Текущие LLM технически можно обвязать внешними «агентами», планировщиками, инструментами и заставить выглядеть более разумными. Но ядро остаётся тем же: статистический предсказатель последовательностей, а не миро-ориентированный разум.

Необходим переход от статических корреляций к казуальным и причинно-следственным связям в условиях динамического мира с неустойчивыми и противоречивыми связями, не поддающимися формализации (переход от статики с замороженными весами к непрерывному дообучению).

Необходима модификация алгоритмов с авторегрессии (генерации следующего токена) к абстрактной симуляции мира и от пассивного наблюдения к активному взаимодействую с окружающим пространством.

Проблема современный нейросетей в том, что нет динамического создания новых связей в ответ на опыт. Нет цикла «действие ? мир ? наблюдение ? обновление».

Отсутствие цикла «действие ? ошибка ? самокоррекция весов» в реальном времени с бесконечным циклом повторов и коррекций ошибок делает текущие модели «умными идиотами», запертыми в статической вселенной своих обучающих данных.

Концепция ИИ агентов неработоспособна. Почему? Без умения эффективно дробить задачи на подмодули и удерживать иерархию приоритетов, без наличия критерия истинности и без функционала самокоррекции, любой автономный агент неизбежно уйдет по неверной траектории в процессе итерации последовательности шагов.

Необходимо помнить про фундаментальные ограничения памяти и контекстного окна у LLMs, проблема стабильности и качества выходных токенов при расширении контекстного окна (склонность к галлюцинациям при перегруженной памяти).

LLM-ядро обеспечивает мощную аппроксимацию распределений и извлечение закономерностей, но без внешнего контура проверки/памяти/действий оно не даёт устойчивых свойств агентности: долговременных целей, причинной идентификации, надёжной самокоррекции.

Все это ставит текущую концепцию развитии ИИ крайне уязвимой с точки зрения способности возврата денежного потока – непропорционально много ресурсов в слишком неустойчивое равновесие и низкий прирост производительности.

На самом деле, восторженная презентация последних моделей оказалась не настолько блестящей, как было показано на рекламных слайдах. Все актуальные проблемы остались, скачка интеллекта не произошло.
Telegram
Spydell_finance
Фундаментальные ограничения современных LLMs Интересное интервью Ильи Суцкевера (бывшего главного инженера OpenAI, а ныне основателя Safe Superintelligence). Это его первое публичное выступление с декабря 2024, но учитывая, что он является архитектором современного ядра LLM, его взгляд ценен. Идеи Ильи практически полностью пересекаются с моими концепциями, высказанными в нескольких циклах материалов по ИИ в этом году, поэтому перескажу, по сути, собственные идеи словами Ильи, но с более научным обрамлением. Главный тезис Ильи заключается в том, что период с 2012 по 2020 годы был «эпохой исследований», которая сменилась «эпохой масштабирования» (2020–2025), когда доминировал простой рецепт: больше данных + больше вычислений = лучше результат. Дополню от себя: это выражается в экспоненциальном росте капитальных расходов, достигающих 400 млрд в 2025 среди бигтехов США и зеркалировании выручки у производителей оборудования для развертывания ИИ. • Предел данных: предварительное обучение (pre-training) упирается…
$post[...] array (2)
  • Table (2)
  • Contents (2)
  • hexhtmlcountemojireaction
    0F09F918D<i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/FUTF-811null?
    1E29DA4<i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/EUTF-83null?
  • 0 => array (5)
    $post['reactions'][0]
    hex => string (8) "F09F918D"
    $post['reactions'][0]['hex']
    html => string (102) "<i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/F0...
    $post['reactions'][0]['html']
    <i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/F09F918D.png')"><b>?</b></i>
    
    count => integer 11
    $post['reactions'][0]['count']
    emoji => null
    $post['reactions'][0]['emoji']
    reaction => string (1) "?"
    $post['reactions'][0]['reaction']
    1 => array (5)
    $post['reactions'][1]
    hex => string (6) "E29DA4"
    $post['reactions'][1]['hex']
    html => string (100) "<i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/E2...
    $post['reactions'][1]['html']
    <i class="emoji" style="background-image:url('//telegram.org/img/emoji/40/E29DA4.png')"><b>?</b></i>
    
    count => integer 3
    $post['reactions'][1]['count']
    emoji => null
    $post['reactions'][1]['emoji']
    reaction => string (1) "?"
    $post['reactions'][1]['reaction']
Called from <ROOT>/local/templates/.default/partials/post_item.php:320 [d()]
  1. <ROOT>/local/classes/tggo/ui/PostRenderer.php:33
  2. <ROOT>/local/classes/tggo/ui/PostRenderer.php:18 [Tggo\UI\PostRenderer::includeTemplate()]
  3. <ROOT>/local/components/tggo/channel.post/templates/.default/template.php:37 [Tggo\UI\PostRenderer::renderHtml()]
  4. <ROOT>/bitrix/modules/main/classes/general/component_template.php:790
  5. <ROOT>/bitrix/modules/main/classes/general/component_template.php:885 [CBitrixComponentTemplate->__IncludePHPTemplate()]
  6. <ROOT>/bitrix/modules/main/classes/general/component.php:791 [CBitrixComponentTemplate->IncludeTemplate()]
  7. <ROOT>/bitrix/modules/main/classes/general/component.php:731 [CBitrixComponent->showComponentTemplate()]
  8. <ROOT>/local/components/tggo/channel.post/class.php:66 [CBitrixComponent->includeComponentTemplate()]
  9. <ROOT>/bitrix/modules/main/classes/general/component.php:675 [TggoChannelPost->executeComponent()]
  10. <ROOT>/bitrix/modules/main/classes/general/main.php:1188 [CBitrixComponent->includeComponent()]
  11. <ROOT>/local/components/tggo/main/templates/.default/post.php:6 [CAllMain->IncludeComponent()]
  12. <ROOT>/bitrix/modules/main/classes/general/component_template.php:790
  13. <ROOT>/bitrix/modules/main/classes/general/component_template.php:885 [CBitrixComponentTemplate->__IncludePHPTemplate()]
  14. <ROOT>/bitrix/modules/main/classes/general/component.php:791 [CBitrixComponentTemplate->IncludeTemplate()]
  15. <ROOT>/bitrix/modules/main/classes/general/component.php:731 [CBitrixComponent->showComponentTemplate()]
  16. <ROOT>/local/components/tggo/main/component.php:63 [CBitrixComponent->includeComponentTemplate()]
  17. <ROOT>/bitrix/modules/main/classes/general/component.php:622
  18. <ROOT>/bitrix/modules/main/classes/general/component.php:699 [CBitrixComponent->__includeComponent()]
  19. <ROOT>/bitrix/modules/main/classes/general/main.php:1188 [CBitrixComponent->includeComponent()]
  20. <ROOT>/username/index.php:5 [CAllMain->IncludeComponent()]
  21. <ROOT>/bitrix/modules/main/include/urlrewrite.php:128
  22. <ROOT>/bitrix/urlrewrite.php:2
? 11
? 3
11 496

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram