Б
Битубитех от Яндекса
@yab2btech
7 710
Компании, инвестирующие в этичные, человеко-ориентированные ИИ-решения, создают среду, где технологии расширяют возможности людей, а не конкурируют с ними.
К примеру, ИИ-ассистент Patty в Burger King через наушники поддерживает сотрудников в реальном времени: подсказывает меню, помогает с инвентаризацией, предлагает тактики обслуживания. Он не применяется для контроля или оценки персонала, а служит полноценным помощником.
В одной из крупнейших сетей товаров для дома ИИ-ассистент Mylow тоже используется для поддержки персонала и покупателей. Он помогает новым сотрудникам быстрее осваивать знания о продукте, упрощает коммуникацию с клиентами. С момента внедрения Mylow уже удвоил конверсию и повысил удовлетворённость покупателей.
Название сбивает с толку — серверы на самом деле есть, но ответственность за них лежит на облачной платформе. Компания запускает код, контейнеры, базы данных и прикладные сценарии в облаке, но ей не нужно вручную управлять инфраструктурой и планировать вычислительные мощности.
А ещё компания платит лишь за фактически задействованные облачные мощности и не должна держать включённые серверы про запас. Так, немецкая медиагруппа Seven.One Entertainment Group перевела свою платформу с локальной инфраструктуры на бессерверную архитектуру AWS для работы с неравномерным событийным трафиком — и затраты снизились на 60%.
За счёт этого serverless-решения нередко оказываются дешевле и on-premise, и стандартных облачных. К примеру, университет ИТМО развернул приложение с персонализированным расписанием для 9000 студентов по serverless-схеме в Yandex Cloud. Оно оказалось в 11 раз дешевле, чем когда было развёрнуто на инфраструктуре вуза.
В случае простых задач точкой входа служат облачные функции — они запускают выполнение кода в управляемой среде по запросу или событию.
В более сложных сценариях работают контейнеры — приложения, упакованные для работы с облачным сервером. Компания собирает образ контейнера, хранит его в реестре контейнеров и задаёт настройки запуска. Через этот образ облако и запускает контейнер в ответ на запрос.
Данные хранятся в serverless-базе данных — компания просто загружает в неё информацию, а объёмом вычислительных ресурсов под неё управляет облачная платформа.
В результате команде не нужно поднимать и поддерживать серверы. Она тратит меньше времени и трудовых ресурсов на инфраструктурную подготовку и больше — на сам продукт.
Такая модель больше всего подойдёт:
командам, которые выносят в облако несложные функции
компаниям с сильными скачками загрузки, например, где трафик сильно зависит от времени суток или сезона
командам, которым важно быстро проводить эксперименты и запускать пилоты.
Serverless будет не таким удобным вариантом, если в компании:
есть тяжёлые монолитные приложения — переносить их в serverless может быть дорого и неоправданно сложно
высокая и постоянная нагрузка — тогда serverless теряет экономическое преимущество, потому что главный выигрыш этой модели в том, чтобы не держать ресурсы про запас под пиковые нагрузки
реализуются долгоживущие процессы, которые плохо укладываются в модель коротких или ограниченных по времени вызовов
есть потребность в тонком управлении облачным окружением.
Serverless подходит бизнесам разных масштабов. Крупные нередко используют подход для отдельных функций. Так, Fix Price применяет облачные функции для обработки файлов из объектного хранилища и передачи их в управляемый Managed Service for ClickHouse. За счёт этого время загрузки данных в витрины сократилось в 10 раз.
Компания может развернуть serverless в Yandex Cloud через набор serverless-интеграций, где центральную роль играет Yandex Workflows.
Обычно это выглядит так: через API Gateway или облачные функции принимается запрос. Workflows оркестрирует шаги, при необходимости обращается к хранилищам, базам данных или другим сервисам, а результат возвращается дальше по цепочке. Такой подход подходит для автоматизации бизнес-процессов, обработки документов и других сценариев.
Контекст хорошо видно в финансовых результатах Big Tech. Wall Street Journal пишет, что Microsoft, Alphabet, Meta (признана экстремистской организацией и запрещена на территории РФ) и Amazon уже получают заметную выручку от AI и облаков, но платят за это резким ростом капитальных затрат на дата-центры, чипы и инфраструктуру. То есть облако становится не просто способ сократить ИТ-расходы, а базовой платформой для новой волны корпоративного софта и ИИ-сервисов.
Мы ожидаем потепления макроэкономической среды и видим осторожное ускорение бизнес-активности. И прогнозы по году мы строим с аккуратным оптимизмом. Надеемся, что самое сложное для российской экономики время позади и мы вслед за ней вернёмся к хорошему двузначному росту.
У нас были прогнозы, что будет переток использования Поиска в ИИ-ассистентов, но на реальных данных они не подтверждаются. Люди в чате с Алисой AI и другими ассистентами в основном задают другие запросы — не те, с которыми шли в Поиск, а более сложные.
Важно развивать направление транзакционного ИИ. Чтобы прямо в чате с Алисой можно было бы услуги оформить, забронировать путешествие, купить билеты в театр и заказать товары. По нашим оценкам, к 2030 году рынок онлайн-транзакций превысит 30 трлн рублей. Из них по меньшей мере 10% придутся на покупки внутри ИИ-ассистентов.
Человек при помощи нейросети получает значительно более близкий к решению конечной задачи ответ. Да, казалось бы, возможность прорекламироваться в объёмном выражении становится меньше, но каждая из этих возможностей будет просто эффективнее для бизнеса. Она будет дороже стоить, но и давать будет рекламодателю гораздо больше. Грубо говоря, человек не просто перейдёт на один из предложенных сайтов, а с гораздо большей вероятностью сделает какую-то покупку.
Дефицит 2-нм чипов TSMC вынуждает производителей смартфонов переходить на менее мощные процессоры. Производители электроники, такие как Sony и Nintendo, переносят запуск консолей и смартфонов и повышают цены.
Корпорации вроде Tesla, Microsoft, Google, Amazon и Alibaba планируют запустить собственное производство памяти и заключить долгосрочные предоплаченные контракты с производителями, чтобы гарантировать доступ к необходимым объёмам.
Да, это он. Его называют RAMmageddon, или кризис памяти: дефицит чипов из-за взрывного роста ИИ-вычислений приводит к постоянному увеличению цен.
В начале года аналитическое агентство TrendForce резко пересмотрело прогноз цен на чипы. По его оценке, DRAM (Dynamic Random Access Memory, тип энергозависимой оперативной памяти, которую используют в качестве основной в компьютерах, смартфонах и серверах) подорожают на +90–95% квартал к кварталу, а NAND Flash (тип перезаписываемой памяти, которая сохраняет данные без питания) — до +55–60% в первом квартале 2026 года.
В I квартале 2026 года цены на DRAM и SSD уже выросли более чем вдвое и спровоцировали ажиотажный спрос на ПК.
Аналитики TrendForce считают, что кризис затянется минимум до конца 2027 года.
С ними согласен гендиректор крупного производителя чипов Micron Technology Санджай Мехротра: «Мы способны поставлять около 50–66%, или две трети потребностей наших ключевых клиентов».
Другой крупный поставщик — корейская корпорация SK Group — предупреждает, что дефицит DRAM может затянуться до 2030 года, поскольку предложение будет отставать от спроса на HBM и другие ИИ-ориентированные продукты.
Дата-центры для ИИ потребляют до 70% всей выпускаемой памяти, из-за чего для ПК, смартфонов и корпоративного сегмента остаётся меньше объёмов.
Производители переключают мощности на HBM (High Bandwidth Memory, тип высокопроизводительной оперативной памяти для мощных видеокарт, ИИ-ускорителей и суперкомпьютеров) и серверную память для ИИ, а выпуск обычных DRAM и NAND для массовых устройств растёт медленно.
Крупные заказчики (CSP, OEM) конкурируют за ограниченные объёмы серверной памяти, а производители NAND дополнительно сокращают выпуск, перенаправляя ресурсы на DRAM.
Быстро нарастить производство сложно: запуск новых фабрик занимает годы.
Операционный директор OpenAI Брэд Лайткэп назвал дефицит чипов памяти самым узким местом для расширения ИИ-инфраструктуры. Раньше главным барьером считали недостаток электроэнергии.
Руководители ИТ-корпораций предупреждают о глобальном кризисе памяти, который «бьёт по прибыли, срывает планы и раздувает ценники на всё — от ноутбуков до автомобилей».
Рост цен на память уже вынуждает производителей повышать цены на смартфоны и ПК или оптимизировать производство. Это касается не только классических устройств, но и тех, что использует бизнес, например для IoT или облачных серверов.
Хотите больше таких историй? Поддержите наш канал по ссылке.