동적 스폰을 통한 장기 코드 생성 멀티에이전트 협업 프레임워크

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

AgentSpawn은 실행 중 복잡도 지표를 기반으로 에이전트를 동적으로 스폰하고, 메모리 슬라이싱으로 필요한 컨텍스트만 전달하며, 동시 수정 시 충돌을 해결하는 프로토콜을 제공한다. 실험 결과 SWE‑bench 등에서 정적 멀티에이전트 대비 34% 높은 완료율과 메모리 사용량 42% 감소를 달성했다.

상세 분석

본 논문은 장기 코드 생성 작업에서 발생하는 “컨텍스트 폭발”, “복잡도 급증”, “전문화된 스킬 요구” 등 5가지 핵심 문제를 명확히 정의하고, 기존 정적 워크플로우가 이러한 상황에 적응하지 못한다는 한계를 지적한다. 이를 해결하기 위해 제안된 AgentSpawn 아키텍처는 다섯 개의 모듈(메모리 매니저, 스킬 라이브러리, 스폰 컨트롤러, 리주메 코디네이터, 코히어런스 매니저)로 구성된다.

메모리 슬라이싱 알고리즘은 키워드 매치, 의존성 점수, 시간 가중치, 의미적 유사도 네 가지 요소를 가중합하여 토큰 수준에서 relevance threshold를 초과하는 항목만 선택한다. α,β,γ,δ 가중치는 실험적으로 0.3,0.3,0.2,0.2 로 설정돼, 전체 메모리의 약 42%를 절감하면서도 작업 성공률을 유지한다.
스킬 상속 프로토콜은 프롬프트 템플릿과 파라미터(θs) 형태의 스킬을 정의하고, 스폰 시 해당 서브태스크와의 relevance score가 임계값 τ를 넘는 스킬만 전이한다. 성공적인 자식 에이전트의 스킬은 부모의 라이브러리로 승격돼 재사용성을 높인다.
적응형 스폰 정책은 파일 상호 의존도(I_f), 사이클로매틱 복잡도(C_c), 테스트 실패 연쇄(F_c), 메모리 오버플로우(O_c), 에이전트 불확실도(U_c) 다섯 지표를 정규화 후 가중합(S_spawn)한다. 가중치는 w1=0.3, w2=0.2, w3=0.25, w4=0.15, w5=0.1 로 설정돼, S_spawn이 0.7을 초과하면 스폰이 트리거된다. 지표별 우선순위에 따라 리팩터, 코드 단순화, 테스트·디버깅, 컨텍스트 압축, 연구·분석 에이전트 중 하나가 선택된다.
동시 스폰 시 메모리 일관성 관리는 락프리 옵티미스틱 컨커런시 모델을 채택한다. 각 자식은 부모의 스냅샷을 기반으로 독립 실행하고, 결과물 간 파일 라인 겹침을 탐지한다. 겹침이 없으면 자동 병합, 라인 레벨 겹침이 있으면 LLM 기반 의미적 병합(성공률 73%), 해결 불가 시 부모에게 에스컬레이션한다.

실험에서는 SWE‑bench(300개 멀티파일 이슈)와 Defects4J(200개 멀티파일 버그) 등에서 정적 멀티에이전트(예: MetaGPT, ChatDev) 대비 34% 높은 태스크 완료율을 기록했으며, 메모리 슬라이스 적용으로 평균 토큰 사용량이 87K→51K 로 42% 감소했다. 또한 스폰 깊이 제한(최대 3단계)과 동시 스폰 수 제한(최대 4)으로 무한 재귀와 과도한 병렬성을 방지했다.

한계점으로는 스폰 가중치와 임계값을 사전 튜닝해야 하는 점, 복잡도 지표가 도메인에 따라 다르게 작용할 가능성, 그리고 의미적 병합에 LLM 의존도가 높아 모델 오류 시 품질 저하 위험이 있다. 향후 연구에서는 메트릭 자동 학습, 스킬 자동 생성, 그리고 분산 환경에서의 일관성 보장을 위한 프로토콜 확장이 제안된다.

동적 스폰을 통한 장기 코드 생성 멀티에이전트 협업 프레임워크

초록

상세 분석

댓글 및 학술 토론

의견 남기기