Трое в лодке, не считая человека: как новые ИИ-агенты для программирования меняют правила игры
Еще вчера мы спорили, способен ли ИИ без ошибок дописать пару строк кода, а сегодня он уже сам разрабатывает целые фичи и пишет тесты. На рынок почти одновременно вышли три агента для кодинга: OpenAI Codex, GitHub Copilot Coding Agent от Microsoft и Google Jules. Разбираемся, что они умеют и какие инсайты появились у меня после использования.
OpenAI Codex
• Агент внутри ChatGPT;
• Разворачивает среду, клонирует репозиторий, прогоняет тесты, открывает PR и пишет логи;
• Работает на базе модели codex-1;
• Доступен подписчикам ChatGPT Pro/Team/Enterprise;
GitHub Copilot Coding Agent
• Надстройка над Copilot’ом прямо в GitHub;
• Достаточно назначить задачу - агент создает среду, коммитит в отдельную ветку и ждет ревью;
• Используется модель GPT-4, заточенная под GitHub;
• Открытое превью на тарифах Copilot Pro Plus/Enterprise;
Google Jules
• Асинхронный агент из Google Labs в публичной бете;
• Клонирует код в репозиторий на виртуальной машине, генерирует тесты, чинит баги, обновляет зависимости;
• Под капотом Gemini 2.5 Pro;
• Показывает пошаговый план и дает аудио-дайджест изменений (Codecast);
В целом, все три агента берут задачу и кодят без постоянных уточнений, изменения всегда приходят через PR-ветку - это безопасно, а код крутится не на вашей машине.
Что я отметил после использования:
•
Task engineering вместо prompt engineering. В Codex, Copilot Agent и Jules уже не нужно общаться с моделью правильными промптами - важнее сформулировать задачу так, чтобы агент сам нашел оптимальный план.
•
Появление функции AIOps/
AgentOps. Кто-то должен следить за сессиями, лимитами, токенами, расходами и безопасностью агентов. Это не совсем классический DevOps, а скорее оператор мультиагентных ИИ-систем - в больших командах такая функция уже появляется.
• Артефакт-driven разработка. Агенты генерируют не только код, но и логи, планы, тесты, даже аудио-дайджесты. Умение быстро просматривать эти артефакты и понимать суть становится важным навыком.
• Ценность интеграционных тестов. Чем богаче система тест-кейсов, тем смелее можно пускать агента «гулять» по проекту. Инвестировать в тесты сегодня = ускорять работу агентов завтра.
• Риск «снежного кома зависимостей». Агенты любят обновлять зависимости до свежих версии. Через пару месяцев можно обнаружить зоопарк несовместимых библиотек. Нужен оператор (человек или другой агент), который смотрит на общую архитектуру.
• Безопасность = изоляция + детерминизм. В продакшн-репозитории все чаще требуют, чтобы агент работал в воспроизводимой виртуальной среде с задокументированным скриптом поведения. Это уже новое требование в ряде крупных финтех-компаний.
• Новая метрика производительности - review-latency. Скорость, с которой человек успевает проверить и смержить PR агента, становится бутылочным горлышком в процессе разработки.
Главный же вывод такой: отдача от агентов растет не линейно, а ступенчато - с каждым слоем зрелости процессов (тесты, CI/CD и т.д.) вы открываете новый уровень автоматизации. Чем больше в проекте порядка, тем лучше будет результат.
Куда все идет? OpenAI сначала представили
ИИ-оператора для браузера, затем
ИИ-исследователя, а теперь и ИИ-программиста. Вместе они образуют мультиагентную систему, способную автономно провести исследование рынка, сформулировать требования к продукту, разработать и развернуть веб-приложение - а затем самостоятельно протестировать его прямо в браузере.
Такой подход становится новым стандартом в разработке продуктов. Меняются ожидания от продактов и разработчиков - теперь ценится способность охватить весь цикл разработки от идеи до прода. В новой реальности выигрывают те, кто умеет не просто писать код или ставить задачи, а мыслить о продукте целиком на уровне ценности и архитектуры - формулировать гипотезы и быстро превращать в работающие решения с помощью ИИ-агентов.
#новости
Обсуждение 1
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram