다중에이전트 시스템을 위한 재사용 가능한 잠재 빌딩 블록, 에이전트 프리미티브
초록
본 논문은 LLM 기반 다중에이전트 시스템(MAS)의 설계 복잡성을 낮추기 위해 ‘에이전트 프리미티브’라는 재사용 가능한 내부 연산 블록을 제안한다. 리뷰, 투표·선택, 계획·실행의 세 가지 프리미티브를 KV‑캐시를 통한 잠재 통신 방식으로 연결하고, 조직자(Organizer) 에이전트가 질의에 맞는 프리미티브 조합을 자동으로 구성한다. 실험 결과, 기존 텍스트 기반 MAS 대비 정확도 12‑16 % 향상, 토큰 사용량·지연 3‑4배 감소, 단일 에이전트 대비 1.3‑1.6배 정도의 경량 오버헤드만 발생함을 보였다.
상세 분석
이 연구는 현재 LLM 기반 다중에이전트 시스템이 ‘역할‑프롬프트’ 설계에 과도하게 의존하고, 자연어를 매개로 한 상호작용이 길어질수록 정보 손실과 오류 누적이 발생한다는 근본적인 한계를 지적한다. 이를 해결하기 위해 신경망의 모듈식 설계에서 영감을 받아, 복잡한 MAS를 소수의 재사용 가능한 연산 단위인 ‘프리미티브’로 분해한다. 세 가지 프리미티브는 (1) Review – 이전 결과를 검증·요약, (2) Voting and Selection – 다수 의견을 집계하고 최적 답안을 선택, (3) Planning and Execution – 단계별 계획을 수립하고 실행한다. 핵심은 모든 프리미티브가 텍스트 대신 키‑밸류(KV) 캐시를 이용해 내부 상태를 직접 전달한다는 점이다. KV‑캐시는 Transformer 디코더의 중간 표현을 저장하므로, 텍스트 디코딩 없이도 다른 에이전트가 바로 해당 정보를 활용할 수 있다. 이는 (①) 토큰 소모 감소, (②) 긴 컨텍스트에서도 위치 인코딩을 재조정해 일관된 의미 전달, (③) 자연어 기반 잡음에 대한 강인성을 제공한다. 조직자 에이전트는 경량 지식 풀에 저장된 과거 성공 구성 사례를 참고해 질의에 최적화된 프리미티브 시퀀스를 선택·조합한다. 실험은 수학 추론, 코드 생성, QA 등 8개 벤치마크와 5가지 오픈소스 LLM을 대상으로 수행했으며, 프리미티브 기반 MAS가 단일 에이전트 대비 평균 정확도를 12‑16 % 끌어올리고, 텍스트 기반 MAS 대비 토큰 사용량·지연을 각각 3‑4배, 3‑4배 감소시켰다. 또한 모델 백본이 바뀌어도 성능 변동이 적어 재사용성과 확장성이 검증되었다. 전체적으로 이 논문은 다중에이전트 협업을 ‘연산 블록’ 수준으로 추상화함으로써 설계 비용을 낮추고, KV‑캐시 기반 잠재 통신을 통해 효율성과 안정성을 동시에 달성한 점이 가장 큰 공헌이라 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기