Вайбкодинг мертв. На смену пришло агентное роевое программирование

Во время недавнего трансатлантического перелёта Марк Раддок, предприниматель-резидент в GALLOS Technologies, решил задействовать свою команду ИИ-агентов. На высоте 34 тысяч футов над Атлантикой у него оставалось меньше 48 часов до важнейшей демонстрации продукта для ключевого клиента, а его программная платформа всё ещё была не готова.

Дисклеймер: это вольная адаптция статьи издания VentureBeat. Перевод подготовила редакция «Технократии». Чтобы не пропустить анонс новых материалов подпишитесь на «Голос Технократии» — мы регулярно рассказываем о новостях про AI, а также делимся полезными мастридами и актуальными событиями.

Если у вас стоит задача интеграции ИИ в бизнес-процессы, то напишите нам.

К тому моменту, как самолёт пересёк Исландию, его «рой Claude Code», как он позже рассказал в интервью VentureBeat, создал более 50 React-компонентов, набор макетов API для трёх корпоративных интеграций и полноценный административный интерфейс. То, на что у команды из людей ушло бы 18 рабочих дней, уложилось в шестичасовой перелёт. Причём результатом стал не прототип, а полноценный программный каркас: задокументированный, протестированный и защищённый, с готовыми к продакшену Docker-конфигурациями и CI/CD-пайплайном.

«Я больше никогда не буду строить софтверную компанию по-старому, обещаю вам», — сказал Раддок в интервью на следующий день.

Опыт Раддока, о котором он впервые написал в LinkedIn на прошлой неделе, не единичен. Это лишь отражение значительного скачка возможностей ИИ, случившегося этим летом. За считанные месяцы способность систем выполнять сложную инженерную работу выросла с головокружительной скоростью, нелинейно. Прогресс зафиксирован сразу в нескольких направлениях, и в совокупности он означает фундаментальное изменение в том, как создаётся софт. Изменение настолько радикальное, что прошлогодние подходы уже выглядят устаревшими.

Эпоха «вайбкодинга» — разговорной, во многом исследовательской практики, когда ИИ пишешь код по подсказкам «на лету» (термин ввел ИИ-исследователь Андрей Карпатый), — уходит. На смену приходит новая, более строгая парадигма: агентное роевое программирование.

(Конечно, для большинства разработчиков-энтузиастов «вайбкодинг» ещё жив. Но когда речь идёт о серьёзной корпоративной разработке, наш фокус смещается именно туда.)

Лето, когда AGI стало реальным для разработчиков

«Даже термин вайбкодинг уже стал наследием. Он устарел», — сказал мне Вал Берковичи, директор по ИИ в компании WEKA. — «Его вытеснила концепция агентного роевого программирования, где несколько агентов в координации создают очень функциональные MVP и полноценные приложения первой версии».

И это говорит человек с весомым бэкграундом: Берковичи — ветеран инфраструктуры, бывший CTO NetApp и один из основателей CNCF, которая курирует Kubernetes.

Идея «роев» не нова — SDK от OpenAI изначально назывался Swarm, когда в прошлом году вышел в экспериментальном режиме. Но именно этим летом возможности роев достигли точки перегиба.

Сам Берковичи, ранее скептик AGI, признался, что теперь верит в её неизбежное появление. Его переубедили летние успехи в области генерации кода и трансформация его собственной команды. Даже самый циничный инженер, известный под прозвищем «Принц Тьмы», изменил своё мнение, впечатлённый качеством и скоростью, с которыми современные агентные системы работают.

Для разработчиков с десятилетиями опыта это похоже на научную фантастику. «Опытные программисты видят, как всё наше ремесло за 30–40 лет меняется радикально всего за несколько месяцев», — отметил Берковичи.

Разбор скачка: как работают роевые агентные системы

Взрывной прогресс обеспечило слияние трёх факторов:

  1. новая генерация базовых моделей,

  2. зрелость агентных архитектур,

  3. стремительное развитие навыков у людей, управляющих агентами.

Основываясь на разговорах с Раддоком и другими пионерами, можно выделить три ключевых столпа ускорения.

1. Более умные базовые модели

Интеллект самих моделей этим летом резко вырос. OpenAI (GPT-5), Anthropic (Claude 4) и xAI (Grok 4) сделали большой шаг вперёд. На эталонном тесте SWE-bench (способность ИИ закрывать реальные GitHub-issues) новые модели побили все рекорды. GPT-5 показал 74,9% успешных решений против 58,4% у модели o3 в июле. Claude Opus 4.1 в августе достиг 74,5% против 72,4% в мае.

2. Сложные агентные архитектуры

Ещё важнее, чем сама модель, — то, как она организована. «Рой» — это архитектура, где задача разбивается на части и распределяется между несколькими специализированными агентами. В отчёте организации METR, изучающей передовые системы ИИ, опубликованном в марте, говорится, что «длина задач, которые способен выполнять ИИ, удваивается каждые 7 месяцев». Однако Амджад Масад, CEO Replit, написал в Twitter в среду, что это «сильно недооценивает» реальные показатели: за тот же период их софтверный агент показал десятикратный рост производительности благодаря оркестрации, включая мультиагентную архитектуру (см. диаграмму выше и ниже). Для справки: именно решение Replit использовал Марк Раддок из GALLOS.

Новое поколение агентных систем освоило несколько ключевых структурных возможностей:

  • Перепланирование: агенты динамически корректируют список задач, если шаг неудачен или появляется лучший путь. Это позволило, например, Warp достичь рекордных 75,8% на SWE-bench.

  • Мультиагентная специализация: вместо того чтобы один ИИ пытался делать всё сразу, рои агентов распределяют роли. Агент-«планировщик» разбивает задачу на части, агенты-«кодеры» пишут код, а агент-«критик» проверяет результат. Такая схема повторяет работу человеческой команды разработчиков и лежит в основе фреймворков вроде Claude Flow, созданного в Торонто Реувеном Коэном. Берковичи описывает это как систему, где «десятки экземпляров Claude Code работают параллельно, выполняя задачи по спецификациям, документации… охватывая весь цикл CI/CD и DevOps». Именно этот механизм лежит в основе роевого подхода: он сжимает месяцы работы команды в один час.

  • Переключение моделей: системы направляют подзадачи лучшей модели — Claude для рассуждений, GPT-5 для кода, Grok 4 для быстрых итераций.

  • Интеграция инструментов: Это, пожалуй, главное изменение правил игры. Агенты больше не пишут код «в вакууме». Теперь они встроены в реальную среду разработчика и используют ключевые инструменты: grep для поиска по кодовой базе, pytest для запуска тестов, утилиты сборки вроде make или pip для компиляции и настройки проектов, а также git diff для управления изменениями. Такой подход замыкает цикл между генерацией кода и его проверкой в реальных условиях.

  • Длительная автономность: Ранние версии агентов часто «терялись» или выходили за рамки контекста при работе со сложными задачами. Как отметил в Twitter в среду основатель Y Combinator Пол Грэм, ключевым тестом для ИИ является то, насколько долго он может «продуктивно продолжать размышлять над задачей». Этим летом этот показатель вырос в разы. Так, Agent 3 от Replit теперь способен работать автономно до 200 минут, выполняя задачу от начала до конца, — резкий скачок по сравнению с февральским Agent 2, который справлялся лишь с 20 минутами непрерывной работы.

3. Рост роли «агентного инженера»

Финальное звено — человек. Самые успешные разработчики не пассивно «промптят» ИИ, а становятся архитекторами-кураторами.

Процесс Раддока, например, включает:

  • генерацию агентами подробного PRD (Product Requirements Document),

  • рецензию этого кода агентом с «персоной скептика»,

  • собственный финальный обзор.

«Нужно быть предельно намеренным, — пояснил он. — Я теперь знаю, как задавать вопросы, что просить, какие рамки ставить, чтобы агент сам проверял свои результаты».

От прототипа к продакшену

Самое убедительное свидетельство летнего скачка в том, что результат работы роев агентов давно перешагнул границы прототипов, которые ещё недавно считались потолком агентного программирования. Сегодня агенты создают фундамент приложений, готовых к промышленной эксплуатации. Это опровергает распространённую критику о том, что код, сгенерированный ИИ, — «сырой мусор», непригодный для реального использования.

Раддок особенно подчёркивает этот момент. Приложение, созданное им во время перелёта, было «готово к Docker, готово к Kubernetes, проходило все проверки безопасности, которые вы ожидаете… ещё до того, как я приземлился». И это не случайность, а результат методики. Он всегда начинает проект с «канонического шаблона» в GitHub, где уже встроены пайплайны для проверок безопасности и качества кода.

Здесь критически важной становится специализация агентов для нужд бизнеса. Раддок назначает своим агентам особые «персоны», чтобы обеспечить дисциплину. Например, один агент работает в роли «ветерана безопасности с 15-летним стажем» и глубокой экспертизой в анализе кода на уязвимости. Его задача — проверка работы разработчиков, что создаёт систему сдержек и противовесов, имитирующую ревью старших инженеров.

Опыт Берковичи подтверждает это. Он отмечает, что рои агентов теперь создают приложения с «аудитами безопасности, red team-тестами, документацией по комплаенсу и корпоративной аутентификацией» — всем тем, что отличает демонстрацию от продукта, готового к развёртыванию. По его словам, рой автоматизирует весь строгий жизненный цикл CI/CD и DevOps.

Это сдвиг огромного масштаба. Разговор сместился от вопроса «может ли ИИ написать функцию или наколдовать прототип» к вопросу «может ли команда агентов построить, протестировать, защитить и развернуть полноценное приложение». Ответ всё чаще — да. С одним большим «но».

Реальность: хорошие и плохие дни

Однако новая парадигма всё ещё сопряжена с трудностями. Производительность роев агентов бывает непостоянной. «Бывают дни, когда появляются блестящие агенты, и я поражён их работой, тщательно её проверяю, — признался Раддок. — А бывают дни, когда приходит агент, ведущий себя как… полный идиот». Он отметил, что никогда не знает заранее, какой результат получит. Чтобы обойти это, он запускает параллельно несколько версий одного и того же продукта и затем выбирает ту, что показала себя лучше остальных.

Главная проблема, впрочем, заключается в огромной когнитивной нагрузке при управлении такими системами. Узким местом становится не скорость написания кода, а скорость его проверки. Это тормозит и раздражает людей. Недавнее исследование Metr.org показало, что на сложных задачах инструменты ИИ могут даже замедлять работу опытных разработчиков: выгода от быстрой генерации кода теряется из-за долгих циклов ревью и отладки.

Вопреки философии «vibe coding», предполагающей, что ИИ работает сам по себе без глубокого вмешательства, опытные инженеры, напротив, хотят большего контроля. Они становятся всё более открыты к использованию LLM, но не принимают идею системы, которая строит всё полностью без плотного диалога и обратной связи. Настоящий вызов для агентных платформ — предоставить мощную автоматизацию, не лишая разработчика возможности вмешиваться, задавать вопросы и направлять процесс.

Это подводит к ещё одной важной мысли: агентное роевое программирование — это не замена разработчиков, а усиление самых квалифицированных из них. Их роль трансформируется: от человека, который сам пишет код, к архитектору и валидатору работы команды, управляемой ИИ.

Цикл «хайпа» обгоняет реальность. Шесть месяцев назад CEO Anthropic предсказывал, что к этому моменту ИИ будет «писать 90% кода». Очевидно, мы ещё далеко от этого рубежа. Да, прогресс идёт экспоненциально, что подтверждают графики METR и Replit, но путь к полностью автономной и надёжной разработке ПО остаётся сложным и тернистым.

На недавнем мероприятии DeepMind кто-то спросил CEO компании Джеффа Дина, можно ли доверить ПО, написанное LLM, управление самолётом. После долгой паузы, как сообщают очевидцы, он ответил: «А люди в самолёте есть?» Эта полушутливая реплика подчеркнула, какие серьёзные вызовы верификации ещё предстоит решить. Дин добавил, что, хотя в реализации нужно быть крайне осторожным, скорость развития технологий такова, что в недалёком будущем он действительно ожидает: большая часть софта будет писаться LLM.

Новый «ров» для бизнеса

Стремительное развитие изменило рынок навсегда. Демократизация агентных воркфлоу и доступных инструментов вроде Claude Code Interpreter разрушает барьеры для создания сложных систем.

Это создаёт новую реальность. Как сказал Раддок, сегодня «защитный ров» для компании — это не код, который можно построить за дни или часы, а уникальное понимание проблемной области и способность воплощать решения с невероятной скоростью.

Для лидеров и технических директоров лето 2025-го войдёт в историю как момент старта новой гонки — гонки, которую выиграют те, кто лучше всего научится управлять интеллектом агентных систем.

Источник: https://habr.com/ru/companies/technokratos/articles/947152/

Опубликовано в категории: Статьи