🤖 Датаист (@andre_dataist): Трое в лодке, не считая человека: как новые ИИ-агенты для программирования меняют правила …

Трое в лодке, не считая человека: как новые ИИ-агенты для программирования меняют правила игры

Еще вчера мы спорили, способен ли ИИ без ошибок дописать пару строк кода, а сегодня он уже сам разрабатывает целые фичи и пишет тесты. На рынок почти одновременно вышли три агента для кодинга: OpenAI Codex, GitHub Copilot Coding Agent от Microsoft и Google Jules. Разбираемся, что они умеют и какие инсайты появились у меня после использования.

OpenAI Codex

• Агент внутри ChatGPT;
• Разворачивает среду, клонирует репозиторий, прогоняет тесты, открывает PR и пишет логи;
• Работает на базе модели codex-1;
• Доступен подписчикам ChatGPT Pro/Team/Enterprise;

GitHub Copilot Coding Agent

• Надстройка над Copilot’ом прямо в GitHub;
• Достаточно назначить задачу - агент создает среду, коммитит в отдельную ветку и ждет ревью;
• Используется модель GPT-4, заточенная под GitHub;
• Открытое превью на тарифах Copilot Pro Plus/Enterprise;

Google Jules

• Асинхронный агент из Google Labs в публичной бете;
• Клонирует код в репозиторий на виртуальной машине, генерирует тесты, чинит баги, обновляет зависимости;
• Под капотом Gemini 2.5 Pro;
• Показывает пошаговый план и дает аудио-дайджест изменений (Codecast);

В целом, все три агента берут задачу и кодят без постоянных уточнений, изменения всегда приходят через PR-ветку - это безопасно, а код крутится не на вашей машине.

Что я отметил после использования:

• Task engineering вместо prompt engineering. В Codex, Copilot Agent и Jules уже не нужно общаться с моделью правильными промптами - важнее сформулировать задачу так, чтобы агент сам нашел оптимальный план.

• Появление функции AIOps/AgentOps. Кто-то должен следить за сессиями, лимитами, токенами, расходами и безопасностью агентов. Это не совсем классический DevOps, а скорее оператор мультиагентных ИИ-систем - в больших командах такая функция уже появляется.

• Артефакт-driven разработка. Агенты генерируют не только код, но и логи, планы, тесты, даже аудио-дайджесты. Умение быстро просматривать эти артефакты и понимать суть становится важным навыком.

• Ценность интеграционных тестов. Чем богаче система тест-кейсов, тем смелее можно пускать агента «гулять» по проекту. Инвестировать в тесты сегодня = ускорять работу агентов завтра.

• Риск «снежного кома зависимостей». Агенты любят обновлять зависимости до свежих версии. Через пару месяцев можно обнаружить зоопарк несовместимых библиотек. Нужен оператор (человек или другой агент), который смотрит на общую архитектуру.

• Безопасность = изоляция + детерминизм. В продакшн-репозитории все чаще требуют, чтобы агент работал в воспроизводимой виртуальной среде с задокументированным скриптом поведения. Это уже новое требование в ряде крупных финтех-компаний.

• Новая метрика производительности - review-latency. Скорость, с которой человек успевает проверить и смержить PR агента, становится бутылочным горлышком в процессе разработки.

Главный же вывод такой: отдача от агентов растет не линейно, а ступенчато - с каждым слоем зрелости процессов (тесты, CI/CD и т.д.) вы открываете новый уровень автоматизации. Чем больше в проекте порядка, тем лучше будет результат.

Куда все идет? OpenAI сначала представили ИИ-оператора для браузера, затем ИИ-исследователя, а теперь и ИИ-программиста. Вместе они образуют мультиагентную систему, способную автономно провести исследование рынка, сформулировать требования к продукту, разработать и развернуть веб-приложение - а затем самостоятельно протестировать его прямо в браузере.

Такой подход становится новым стандартом в разработке продуктов. Меняются ожидания от продактов и разработчиков - теперь ценится способность охватить весь цикл разработки от идеи до прода. В новой реальности выигрывают те, кто умеет не просто писать код или ставить задачи, а мыслить о продукте целиком на уровне ценности и архитектуры - формулировать гипотезы и быстро превращать в работающие решения с помощью ИИ-агентов.

#новости

Обсуждение 1

Вход в экосистему

Ваши настройки cookie