avatar
Mobile Development by AppTractor
@apptractor
08.10.2025 21:21
Google представил новую модель искусственного интеллекта Gemini, предназначенную для навигации и взаимодействия с вебом через браузер. Это позволит ИИ-агентам выполнять действия в интерфейсах, разработанных для людей, а не роботов. Модель, получившая название Gemini 2.5 Computer Use, использует «возможности визуального понимания и рассуждения» для анализа запроса пользователя и выполнения задачи, например, заполнения и отправки формы. Google заявляет, что его Computer Use модель «превосходит ведущие альтернативы в нескольких веб- и мобильных бенчмарках». В отличие от ChatGPT Agent и инструмента «использования компьютера» от Anthropic, новая модель искусственного интеллекта Google имеет доступ только к браузеру, а не ко всей компьютерной среде. Google отмечает, что она «пока не оптимизирована для управления ОС» и в настоящее время поддерживает только 13 действий, включая открытие веб-браузера, ввод текста и перетаскивание элементов.

Разработка

Google выпустил Gemini 2.5 Computer Use для работы с браузером
Your Best Mobile Developer Is the “Slow” One
Solving Double Booking at Scale: System Design Patterns from Top Tech Companies

Маркетинг

Apple запрещает бесплатную раздачу приложений
Доход х5 с помощью микроинфлюенсеров

Кроссплатформа

Rijksmuseum — музей на Kotlin Multiplatform
The Flutter Architecture That Saved Our Team 6 Months of Rework
AppTractor
Google выпустил Gemini 2.5 Computer Use для работы с браузером
Модель, получившая название Gemini 2.5 Computer Use, использует «возможности визуального понимания и рассуждения» для анализа запроса пользователя и выполнения задачи, например, заполнения и отправки формы.
? 1
? 1
6 2K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram