WorkTeam: новый мультиагентный фреймворк для автоматизации сложных бизнес-процессов

В стремительно меняющемся мире бизнеса автоматизация процессов перестала быть роскошью — сегодня это жизненная необходимость. Представьте, что вы можете переводить даже самые сложные инструкции на привычном человеческом языке напрямую в готовый бизнес-процесс, обходясь без десятков часов ручной разработки и без узкоспециализированных экспертов. Звучит как фантастика? Новая мультиагентная платформа WorkTeam претендует на то, чтобы воплотить это в реальность.

Почему это важно

Автоматизация построения процессов помогает бизнесу экономить ресурсы и повышать эффективность. Традиционные подходы требуют ручного проектирования процессов, что предполагает наличие узкоспециализированных знаний и значительных временных затрат. Это ограничивает их применение в реальных условиях.

Последние достижения в области больших языковых моделей (LLM) позволяют создавать процессы напрямую из текстовых промтов, однако использование одного LLM-агента для решения сложных задач часто приводит к ошибкам из-за нехватки специализированных знаний и трудностей с переключением между разными задачами.

Авторы исследования «WorkTeam: Constructing Workflows from Natural Language with Multi-Agents» предлагают использовать несколько специализированных агентов, каждый из которых отвечает за отдельную часть задачи. Это позволяет разгрузить модель, повысить качество результата и обеспечить стабильность работы системы.

Цель исследования

Главная задача — разработать мультиагентную систему WorkTeam, способную эффективно преобразовывать промты на естественном языке в корректные бизнес-процессы, избегая недостатков подходов на основе одного LLM-агента.

Пример генерации процесса в JSON-формате по текстовому промту

Пример генерации процесса в JSON-формате по текстовому промту

Конкретные цели исследования

  • Создать специализированных агентов (супервизор, оркестратор и агент заполнения), каждый из которых решает отдельную подзадачу.
  • Разработать новый набор данных HW-NL2Workflow, включающий более 3600 реальных бизнес-примеров, для обучения и оценки системы.
  • Провести сравнительные эксперименты, чтобы подтвердить эффективность предложенного подхода в сравнении с существующими методами (например, прямое использование LLM и подход RAG).

Методы исследования

Архитектура мультиагентной системы WorkTeam состоит из трех агентов, которые взаимодействуют друг с другом:

  • Супервизор: воспринимает инструкции пользователя, планирует задачи, координирует работу других агентов и проверяет итоговый результат;
  • Оркестратор: выбирает подходящие компоненты процесса с помощью модели SentenceBERT и упорядочивает их, используя LLM;
  • Агент заполнения (Filler): заполняет параметры каждого компонента процесса, используя шаблоны и LLM.
Общая архитектура фреймворка WorkTeam

Общая архитектура фреймворка WorkTeam

Используемые инструменты и модели

  • Для фильтрации компонентов используется модель SentenceBERT, обученная на новом датасете HW-NL2Workflow.
  • Для оркестрации и заполнения параметров используются LLM (например, LLaMA3-8B-Instruct, Qwen2.5-72B-Instruct).
  • В качестве базовых методов для сравнения используются GPT-4 и подход RAG.

Метрики оценки качества

Качество работы системы оценивается по трем метрикам:

  • EMR (Exact Match Rate) — полное совпадение с эталонным процессом.
  • AA (Arrangement Accuracy) — точность расположения компонентов.
  • PA (Parameter Accuracy) — точность заполнения параметров компонентов.

Результаты исследования

Авторы сравнивают предложенную мультиагентную систему с подходами, использующими одного LLM-агента и метод RAG, также оценивается вклад каждого агента в итоговый результат.

WorkTeam значительно превосходит базовые подходы по всем метрикам:

  • EMR: 52.7% (WorkTeam) против 18.1% (GPT-4) и 12.7% (Qwen2.5-72B).
  • AA: 88.9%, PA: 73.2%.
  • Предложенный подход также превосходит метод RAG (Ayala and Bechard, 2024).

Удаление любого из агентов (оркестратора, агента заполнения или супервизора) снижает точность работы системы. Это подтверждает важность каждого агента в мультиагентной архитектуре.

Авторы демонстрируют работу системы на реальном примере: создание процесса для мониторинга электронной почты, обработки платежей и обновления финансовой информации. Также представлен прототип коммерческого продукта на основе WorkTeam, что подтверждает практическую ценность подхода.

Выводы

  • Мультиагентная архитектура позволяет преодолеть ограничения подходов с одним LLM-агентом;
  • Разделение задач между агентами повышает точность и стабильность генерации процесса;
  • Новый датасет HW-NL2Workflow станет полезным ресурсом для дальнейших исследований в области автоматизации workflow;
  • В более сложных сценариях возможны сложности с координацией агентов;
  • Масштабирование системы для поддержки новых типов процессов требует дальнейших исследований.

Какие перспективы? Интеграция WorkTeam с различными корпоративными инструментами расширит область применения (особенно интересно попробовать с MCP), а улучшение механизмов динамического планирования и адаптации агентов к новым задачам повысит универсальность системы.

Источник: https://habr.com/ru/articles/903660/

Опубликовано в категории: Статьи