동적 서브에이전트 생성으로 에이전트 오케스트레이션 혁신

동적 서브에이전트 생성으로 에이전트 오케스트레이션 혁신
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

AOrchestra는 에이전트를 ⟨Instruction, Context, Tools, Model⟩ 네 튜플로 추상화하고, 오케스트레이터가 필요에 따라 서브에이전트를 실시간으로 생성·배치한다. 이를 통해 복잡하고 장기적인 작업에서 컨텍스트 손실을 방지하고, 도구·모델 선택을 최적화해 비용‑성능 트레이드오프를 조절한다. GAIA, SWE‑Bench, Terminal‑Bench에서 Gemini‑3‑Flash와 결합했을 때 최고 베이스라인 대비 16.28% 향상을 달성했다.

상세 분석

AOrchestra는 기존 서브에이전트‑as‑tools 접근법이 갖는 두 가지 한계를 명확히 지적한다. 첫째, 서브에이전트를 단순히 컨텍스트 격리 스레드로 취급하면 특화된 능력을 활용하지 못한다. 둘째, 정적 역할(예: 코더, 리뷰어 등)로 미리 정의하면 새로운 서브태스크에 대응하기 어렵고 인간이 직접 설계해야 하는 비용이 크게 증가한다. 이를 극복하기 위해 저자들은 “동적 특화”라는 개념을 도입한다. 모든 에이전트를 ⟨Instruction, Context, Tools, Model⟩ 네 요소로 구성된 튜플로 표현함으로써, 오케스트레이터가 각 서브태스크마다 최적의 조합을 실시간으로 생성한다. Instruction은 목표와 성공 기준을, Context는 현재 서브태스크에 필요한 최소 정보만을, Tools는 허용된 도구 집합을, Model은 해당 도구와 작업 난이도에 맞는 LLM을 지정한다. 이러한 설계는 (1) 컨텍스트 로테이션을 최소화하고, (2) 서브에이전트마다 정확히 필요한 능력만 부여해 실행 정확도를 높이며, (3) 프레임워크에 종속되지 않아 다양한 모델·툴 체인을 플러그인 방식으로 교체할 수 있게 한다. 오케스트레이터 자체는 환경 행동을 직접 수행하지 않고 Delegate와 Finish 두 가지 액션만을 사용한다. Delegate가 호출될 때마다 지정된 튜플에 따라 새로운 서브에이전트 인스턴스가 생성되고, 해당 인스턴스는 제한된 툴과 모델로 작업을 수행한 뒤 구조화된 결과(요약, 아티팩트, 오류 로그)를 반환한다. 이러한 구조는 서브에이전트의 실행 로그를 오케스트레이터가 쉽게 통합·재활용할 수 있게 하며, 비용‑성능 목표를 위한 강화학습이나 인‑컨텍스트 학습도 자연스럽게 적용 가능하도록 만든다. 실험에서는 학습‑프리 설정에서 세 가지 벤치마크 모두 기존 최고 성능을 앞섰으며, 특히 Gemini‑3‑Flash와 결합했을 때 16.28%의 상대적 개선을 기록했다. 추가로, 감독 미세조정으로 서브태스크 분해와 튜플 합성을 개선하면 GAIA에서 pass@1이 11.51% 상승하고, 비용 인식 라우팅을 인‑컨텍스트 학습으로 최적화하면 평균 비용을 18.5% 절감하면서 성능을 3.03% 끌어올렸다. 전체적으로 AOrchestra는 서브에이전트를 “동적, 플러그인 가능한 특수화 유닛”으로 재정의함으로써, 복잡한 장기 작업에서 인간 설계 부담을 크게 낮추고, 프레임워크 독립적인 확장성을 제공한다는 점에서 의미가 크다.


댓글 및 학술 토론

Loading comments...

의견 남기기