Google
представил новую модель искусственного интеллекта Gemini, предназначенную для навигации и взаимодействия с вебом через браузер. Это позволит ИИ-агентам выполнять действия в интерфейсах, разработанных для людей, а не роботов. Модель, получившая название Gemini 2.5 Computer Use, использует «возможности визуального понимания и рассуждения» для анализа запроса пользователя и выполнения задачи, например, заполнения и отправки формы. Google заявляет, что его Computer Use модель «превосходит ведущие альтернативы в нескольких веб- и мобильных бенчмарках». В отличие от ChatGPT Agent и инструмента «использования компьютера» от Anthropic, новая модель искусственного интеллекта Google имеет доступ только к браузеру, а не ко всей компьютерной среде. Google отмечает, что она «пока не оптимизирована для управления ОС» и в настоящее время поддерживает только 13 действий, включая открытие веб-браузера, ввод текста и перетаскивание элементов.
Разработка
•
Google выпустил Gemini 2.5 Computer Use для работы с браузером
•
Your Best Mobile Developer Is the “Slow” One
•
Solving Double Booking at Scale: System Design Patterns from Top Tech Companies
Маркетинг
•
Apple запрещает бесплатную раздачу приложений
•
Доход х5 с помощью микроинфлюенсеров
Кроссплатформа
•
Rijksmuseum — музей на Kotlin Multiplatform
•
The Flutter Architecture That Saved Our Team 6 Months of Rework
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram