자기진화 멀티에이전트 코드 생성 프레임워크 SEMAG

SEMAG는 작업 난이도에 따라 계획·코딩·디버깅·토론 단계를 동적으로 조정하고, 실시간으로 최신 LLM을 선택·교체하는 자기진화 에이전트를 도입해 기존 멀티에이전트 코딩 시스템의 고정 워크플로와 모델 의존성을 극복한다. 인간 코딩 프로세스를 모방한 계층형 프롬프트와 토론‑결정 모듈을 통해 복잡한 문제에서도 높은 Pass@1 성능을 달성했으며, GPT‑4o 기반 실험에서 CodeContests 52.6%까지 도달했다.

저자: Yulin Peng, Haowen Hou, Xinxin Zhu

자기진화 멀티에이전트 코드 생성 프레임워크 SEMAG
본 논문은 대형 언어 모델(LLM)의 코딩 능력이 급격히 향상된 현 상황에서, 기존 멀티에이전트 기반 코드 생성 파이프라인이 “고정된 워크플로”와 “단일 백본 모델”에 의존한다는 구조적 한계를 지적한다. 이를 해결하기 위해 제안된 SEMAG(Self‑Evolutionary Multi‑Agent Code Generation)는 인간 프로그래머가 수행하는 ‘계획‑코딩‑디버깅‑토론’ 과정을 네 단계로 구분하고, 각 단계마다 적절한 에이전트를 배치한다. 1. **Adaptive Hierarchical Prompting** - **Level 1 (Direct Generation)**: 가장 간단한 문제는 별도 계획 없이 바로 코더(CODER)에게 입력한다. - **Level 2 (Planning & Verification)**: 실패 시 플래너(PLANNER)가 문제를 구조화된 계획(π)으로 변환하고, 검증기(VERIFIER)가 I/O 시뮬레이션을 통해 계획의 타당성을 반복적으로 점검한다. - **Level 3 (Trace‑Guided Debugging)**: 계획이 검증을 통과하지 못하면 실행 트레이스(EMBEDTRACE)와 코드 설명(EXPLAINER)을 활용해 디버깅 제안(SUGGESTOR)을 생성하고, 디버거(DEBUGGER)가 이를 적용한다. 트레이스 유사도 ρ와 동적 임계값 δ(t,T)를 이용해 디버깅 반복 횟수를 조절한다. - **Level 4 (Multi‑Agent Collaborative Refinement)**: 디버깅이 교착 상태에 이르면 N개의 디베이터(DEBATER)가 현재 트레이스와 코드, 토론 히스토리를 바탕으로 대안 코드를 제시하고, 디시디케이터(DECIDER)가 가중 합의(η 기반 가중치)를 통해 최종 코드를 선택한다. 전이 메커니즘은 정규화 편집 거리 기반 유사도와 복잡도‑의존적 감쇠 함수(δ₀·exp(−λ·t·complexity(T)))를 결합해, 과도한 연산을 방지하면서도 충분히 깊은 추론을 보장한다. 2. **Self‑Evolutionary Model Selection** - N개의 셀렉터 에이전트가 작업 설명을 기반으로 키워드(K)와 최신 웹·논문·레포지터리(L)를 검색한다. - 필터링·요약 후, 각 후보 모델(m_i)에 대해 샘플 작업(T_sample)에서 성능(s_i)을 측정하고, 가중 투표(Σ s_i·I

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기