Spydell_finance (@spydell_finance): Что из себя представляет Gemini 3 от Google? В конце 2025 можно признать, что Google перех…

Что из себя представляет Gemini 3 от Google?

В конце 2025 можно признать, что Google перехватывает лидерство впервые за всю недолгую историю экспансии LLMs (ровно три года), причем конкурентам пока нечем ответить (все крупные релизы и масштабные модели будут только весной 2026), поэтому в следующие 4 месяца доминировать будет Google.

Формально, по бенчмаркам абсолютное лидерство практически во всех категориях, но ИИ-провайдеры часто калибруют модели специально под бенчмарки (в 2026 все это не так показательно).

В целом, по тестам лучше точность, прогресс в рассуждениях и очень сильный прогресс в многоэтапных, многофазовых агентных проектах и сложные абстрактные визуальные задачи.

▪️Ставка на агентности – центральный нарратив презентации Google

Google Antigravity – как новый интерфейс для разработки приложений, где модель сама планирует, пишет, тестирует, развертывает проект и проверяет работу через браузер, т.е. новое поколение вайб-кодинга, когда нужна только идея, а весь код и архитектура на стороне Google.

Теперь агенты могут автономно планировать и выполнять сложные сквозные программные задачи.

Система генерирует Artifacts: списки задач, планы, скриншоты, записи браузера и т.п., чтобы человек видел, что именно делал агент и на чём основаны решения. Все это создает огромное пространство для творчества.

▪️Единая мультимодальная платформа (изображения, видео, аудио, код, файлы), а не через внешние модули и надстройки с дискретной обработкой, как было раньше, - для снижения латентности, улучшения синхронизации и повышения качества распознавания информации.

Модель лучше распознает интонации, скорость речи и эмоциональный окрас голоса пользователя, подстраивая свой ответ не только по смыслу, но и по тону.

Значительный прогресс в распознавании сложных графических образов и текста в изображении и видео. Прогресс в понимании длинных видео, UI-экранов, графики и таблицы из статей, рукописные схемы и т.д.

Сценариев много: персональный консультант в спорте, кулинарии, в различных хобби, учебе, на производстве и в бизнесе.

Например, инженер показывает неисправный двигатель. Gemini 3 видит вибрацию детали и одновременно слышит специфический низкочастотный гул, далее ищет спецификацию двигатели и инструкции в соответствии с паттерном проблемы, проверяет похожие известные проблемы, создает обобщенное решение неисправности, давая рекомендации по починке или замене.

▪️Контекстное кэширование, что позволяет более эффективно работать на более широком контекстном окне, ускоряя ответы и снижая галлюцинации. Например, если вы загружаете в модель огромную базу знаний (например, 100 книг или весь код проекта), происходит качественная компрессия данных, увеличивая эффективный диапазон контекстного окна, что поддерживает стабильность и точность ответов.

Ранее описывал, что фундаментальная архитектурная проблема LLMs – экспоненциальный рост нагрузки при длинном контекстном окне, что всегда приводит к росту ошибок и потере точности (непрерывные галлюцинации), полностью теряя практический смысл работы на широком контекстном окне из-за непрерывного потока ИИ бреда. Как решение проблемы – фрагментарное кэширование, что и внедряют Google.

На практике это приводит к снижению стоимости примерно в 10 раз и росту производительности в разы на «тяжелом» контексте.

▪️Generative UI (Генерация динамических интерфейсов) - иммерсивные визуальные макеты, интерактивные инструменты и симуляции прямо в строке поиска, которые генерируются полностью «на лету» на основе запроса пользователя. Например, визуализация химических, физических, биологических процессов или автогенерация калькулятора по ипотеке.

▪️Улучшенное логическое мышление через «скрытую рефлексию» - в режиме Deep Think, модель генерирует гипотезу, сама находит в ней логическую ошибку и исправляет её до того, как начать выдавать ответ пользователю. Своего рода спор с самим собой, приближаясь к «критерию истинности», устраняя логические противоречия в длинных текстах, делая модель пригодной для научной работы и юриспруденции без внешних валидаторов.

Обсуждение 31

Spydell_finance

Пожаловаться

Обсуждение 31

Spydell_finance

Вход в экосистему

Ваши настройки cookie