멀티에이전트 LLM을 위한 정체성 인식 프로토콜 LDP
초록
본 논문은 모델 정체성, 추론 프로파일, 품질·비용 힌트 등을 프로토콜 수준에서 노출하는 LLM Delegate Protocol(LDP)을 제안한다. LDP는 풍부한 아이덴티티 카드, 단계적 페이로드 협상, 지속 세션, 구조화된 프루버넌스, 신뢰 도메인 등 5가지 메커니즘을 제공한다. JamJet 런타임 플러그인 구현과 로컬 Ollama 모델·Gemini 판정자를 활용한 실험에서, 정체성 기반 라우팅이 쉬운 작업에서 12배 낮은 지연을 보였으며, 의미 프레임 페이로드가 토큰 사용량을 37% 감소시켰다. 그러나 프루버넌스 메타데이터는 검증 없이 사용될 경우 품질 저하를 초래한다. 시뮬레이션에서는 신뢰 도메인과 페이로드 폴백이 보안·복구 측면에서 큰 이점을 보였다.
상세 분석
LDP는 기존 A2A와 MCP가 간과한 “모델‑레벨 메타데이터”를 프로토콜 기본 요소로 만든 점이 가장 큰 혁신이다. 아이덴티티 카드에 모델 패밀리, 파라미터 수, 컨텍스트 윈도우, 비용·지연 힌트, 추론 프로파일(예: deep‑analytical, fast‑practical) 등을 20여 개 필드로 명시함으로써 라우터가 작업 난이도와 비용 제약을 동시에 고려한 최적 매칭이 가능해졌다. 실험에서는 qwen3‑8b(고품질, 고지연)와 qwen2.5‑coder(중간 품질, 저지연) 등 이질적인 모델 풀을 구성하고, “쉬운” 과제에 저비용 모델을, “어려운” 과제에 고성능 모델을 자동 할당함으로써 평균 지연이 12배 감소했다. 다만, 작은 풀(3대 모델)에서는 전체 품질(Quality‑Score) 향상이 나타나지 않았는데, 이는 라우팅 이득이 모델 다양성에 크게 의존한다는 점을 시사한다.
페이로드 협상 메커니즘은 6단계 모드(텍스트 → 의미 프레임 → 임베딩 힌트 → 의미 그래프 → 라턴트 캡슐 → 캐시 슬라이스)로 구성되며, 현재는 모드 0·1만 평가했다. 의미 프레임(JSON) 사용 시 토큰 수가 평균 37% 감소했으며(p=0.031, d=‑0.7) 품질 저하가 관측되지 않았다. 이는 LLM이 구조화된 입력을 효율적으로 파싱할 수 있음을 보여준다.
세션 관리 측면에서 LDP는 “거버넌드 세션”을 도입해 서버‑측 컨텍스트를 유지한다. 다중 라운드 대화에서 매 라운드마다 전체 대화 기록을 재전송하는 A2A와 달리, LDP는 토큰 오버헤드를 39% 절감했다. 이는 특히 복잡한 워크플로우에서 비용 절감과 응답 시간 단축에 기여한다.
프루버넌스 메타데이터는 결과에 self‑reported confidence와 verification status를 부착한다. 실험에서는 검증이 수행되지 않은 경우(노이즈 프루버넌스) 품질이 오히려 감소했으며, 메타데이터가 신뢰성 판단에 쓰이려면 별도의 검증 파이프라인이 필요함을 보여준다.
보안·복구 시뮬레이션에서는 신뢰 도메인 경계가 공격 탐지율을 6%에서 96%로, 페이로드 폴백이 실패 시 작업 완료율을 35%에서 100%로 향상시켰다. 이는 프로토콜 수준에서 정책·인증을 일관되게 적용할 수 있음을 증명한다. 전반적으로 LDP는 AI‑네이티브 프로토콜 설계가 라우팅 효율, 통신 비용, 보안·거버넌스 측면에서 실질적 이점을 제공한다는 근거를 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기