자기진화 멀티에이전트 코드 생성 프레임워크 SEMAG

본 논문은 대형 언어 모델(LLM)의 코딩 능력이 급격히 향상된 현 상황에서, 기존 멀티에이전트 기반 코드 생성 파이프라인이 “고정된 워크플로”와 “단일 백본 모델”에 의존한다는 구조적 한계를 지적한다. 이를 해결하기 위해 제안된 SEMAG(Self‑Evolutionary Multi‑Agent Code Generation)는 인간 프로그래머가 수행하는 ‘계획‑코딩‑디버깅‑토론’ 과정을 네 단계로 구분하고, 각 단계마다 적절한 에이전트를 배치한다. 1. **Adaptive Hierarchical Prompting** - **Level 1 (Direct Generation)**: 가장 간단한 문제는 별도 계획 없이 바로 코더(CODER)에게 입력한다. - **Level 2 (Planning & Verification)**: 실패 시 플래너(PLANNER)가 문제를 구조화된 계획(π)으로 변환하고, 검증기(VERIFIER)가 I/O 시뮬레이션을 통해 계획의 타당성을 반복적으로 점검한다. - **Level 3 (Trace‑Guided Debugging)**: 계획이 검증을 통과하지 못하면 실행 트레이스(EMBEDTRACE)와 코드 설명(EXPLAINER)을 활용해 디버깅 제안(SUGGESTOR)을 생성하고, 디버거(DEBUGGER)가 이를 적용한다. 트레이스 유사도 ρ와 동적 임계값 δ(t,T)를 이용해 디버깅 반복 횟수를 조절한다. - **Level 4 (Multi‑Agent Collaborative Refinement)**: 디버깅이 교착 상태에 이르면 N개의 디베이터(DEBATER)가 현재 트레이스와 코드, 토론 히스토리를 바탕으로 대안 코드를 제시하고, 디시디케이터(DECIDER)가 가중 합의(η 기반 가중치)를 통해 최종 코드를 선택한다. 전이 메커니즘은 정규화 편집 거리 기반 유사도와 복잡도‑의존적 감쇠 함수(δ₀·exp(−λ·t·complexity(T)))를 결합해, 과도한 연산을 방지하면서도 충분히 깊은 추론을 보장한다. 2. **Self‑Evolutionary Model Selection** - N개의 셀렉터 에이전트가 작업 설명을 기반으로 키워드(K)와 최신 웹·논문·레포지터리(L)를 검색한다. - 필터링·요약 후, 각 후보 모델(m_i)에 대해 샘플 작업(T_sample)에서 성능(s_i)을 측정하고, 가중 투표(Σ s_i·I

자기진화 멀티에이전트 코드 생성 프레임워크 SEMAG

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기