오픈 에이전트 웹을 위한 인센티브 효율 라우팅 프레임워크 IEMAS

IEMAS는 분산된 LLM 기반 에이전트 환경에서 KV‑캐시 친화성을 활용하고, VCG 기반 이중 경매와 최소비용 최대흐름(MCMF) 최적화를 결합해 진실된 능력 보고와 사회적 효율을 동시에 달성한다. 예측 모델이 QoS를 추정하고 프록시 허브가 매칭을 수행함으로써 평균 서비스 비용을 35 % 절감하고 지연을 최대 2.9배 개선한다.

저자: Hongze Liu, Chang Guo, Yingzeng Li

본 논문은 대규모 LLM 기반 멀티에이전트 시스템(MAS)이 점차 중앙집중식에서 탈중앙화된 ‘에이전트 웹’으로 전환되는 현상을 배경으로, 이러한 환경에서 발생하는 세 가지 핵심 과제—(P1) 스케줄링·라우팅, (P2) 인센티브 설계, (P3) 통신 확장성—를 동시에 해결하고자 한다. 기존 연구는 주로 단일 쿼리 라우팅에 초점을 맞추어 KV‑캐시 재사용과 같은 장기적인 자원 재활용을 무시하거나, 에이전트를 동질적인 컴퓨팅 자원으로 모델링해 LLM 추론 특유의 불확실성과 캐시 의존성을 반영하지 못한다. IEMAS(Incentive‑Efficiency Mechanism for Multi‑Agent Systems)는 이러한 한계를 극복하기 위해 네 가지 주요 구성 요소를 제시한다. 1. **캐시 친화도(oᵢⱼ) 모델링** 각 에이전트 i는 로컬 KV‑캐시를 보유하고, 이전 대화 세션 d에서 실행한 프롬프트 p̄ᵢ,₍d₎를 저장한다. 새로운 요청 j의 프롬프트 pⱼ와의 최장 공통 접두사(LCP) 길이 lᵢⱼ를 계산하고, 이를 프롬프트 길이 |pⱼ| 로 정규화해 oᵢⱼ = lᵢⱼ / max(1,|pⱼ|) 로 정의한다. oᵢⱼ∈

오픈 에이전트 웹을 위한 인센티브 효율 라우팅 프레임워크 IEMAS

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기