Mobile Development by AppTractor (@apptractor): Google новую модель искусственного интеллекта Gemini, предназначенную для навигации и вза…

Google представил новую модель искусственного интеллекта Gemini, предназначенную для навигации и взаимодействия с вебом через браузер. Это позволит ИИ-агентам выполнять действия в интерфейсах, разработанных для людей, а не роботов. Модель, получившая название Gemini 2.5 Computer Use, использует «возможности визуального понимания и рассуждения» для анализа запроса пользователя и выполнения задачи, например, заполнения и отправки формы. Google заявляет, что его Computer Use модель «превосходит ведущие альтернативы в нескольких веб- и мобильных бенчмарках». В отличие от ChatGPT Agent и инструмента «использования компьютера» от Anthropic, новая модель искусственного интеллекта Google имеет доступ только к браузеру, а не ко всей компьютерной среде. Google отмечает, что она «пока не оптимизирована для управления ОС» и в настоящее время поддерживает только 13 действий, включая открытие веб-браузера, ввод текста и перетаскивание элементов.

Разработка

• Google выпустил Gemini 2.5 Computer Use для работы с браузером
• Your Best Mobile Developer Is the “Slow” One
• Solving Double Booking at Scale: System Design Patterns from Top Tech Companies

Маркетинг

• Apple запрещает бесплатную раздачу приложений
• Доход х5 с помощью микроинфлюенсеров

Кроссплатформа

• Rijksmuseum — музей на Kotlin Multiplatform
• The Flutter Architecture That Saved Our Team 6 Months of Rework

Обсуждение 0

Вход в экосистему

Ваши настройки cookie