AI 기반 네트워크 진단을 위한 결정적 프로토콜 아키텍처 MCPDiag

AI 기반 네트워크 진단을 위한 결정적 프로토콜 아키텍처 MCPDiag
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

**
본 논문은 LLM을 네트워크 운영에 적용할 때 발생하는 ‘번역 격차’와 ‘거버넌스 격차’를 해결하기 위해 Model Context Protocol 기반의 MCPDiag 아키텍처를 제안한다. 표준 유틸리티(dig, ping, traceroute)의 stdout을 jc 라이브러리로 JSON 스키마에 강제 변환하고, 프로토콜 수준에서 인간‑인‑루프(HITL) 승인 절차를 반드시 거치게 함으로써 100 % 엔터티 추출 정확도와 0.9 % 미만의 레이턴시 오버헤드를 달성하였다.

**

상세 분석

**
MCPDiag은 기존 LLM‑기반 자동화 도구가 직면한 두 가지 근본적 문제, 즉 ‘번역 격차(Translation Gap)’와 ‘거버넌스 격차(Governance Gap)’를 동시에 해소한다. 번역 격차는 ping·traceroute·dig 같은 전통적인 네트워크 진단 툴이 인간이 읽기 쉬운 자유형 텍스트를 출력하도록 설계돼 있어, LLM이 정규식이나 프롬프트에 의존해 파싱할 경우 일관성 없는 출력 형식, 운영체제별 차이, 비정형 오류 메시지 등에 의해 hallucination이 발생한다는 점이다. MCPDiag은 서버‑사이드에 ‘Deterministic Grounding Layer’를 두어, 각 툴의 stdout을 바로 파이프라인으로 jc 라이브러리에게 전달한다. jc는 사전에 정의된 JSON 스키마와 타입 검증을 수행해, LLM이 받는 입력은 언제나 구조화된 객체이며, 스키마 불일치 시 오류를 즉시 반환한다. 따라서 LLM은 텍스트 해석이 아니라 객체 기반 추론을 수행하게 되며, 엔터티 추출 정확도가 100 %에 도달한다.

거버넌스 격차는 LLM이 직접 쉘에 접근해 명령을 실행할 경우 발생하는 보안 위험을 의미한다. 기존 솔루션은 클라이언트‑사이드 프롬프트나 ‘y/n’ 확인에 의존하지만, 프롬프트는 프롬프트 인젝션 공격에 취약하고, 자동화 파이프라인에서 인간 개입을 놓치기 쉽다. MCPDiag은 Model Context Protocol의 ‘Elicitation Primitive’를 활용해, 모든 툴 호출이 프로토콜 수준에서 ‘BLOCK’ 상태로 전환되고, 서버는 암호화된 승인 토큰을 수신하기 전까지 실행을 보류한다. 이 과정은 인간이 UI 혹은 API를 통해 명시적으로 승인해야 하며, 승인 메시지는 JSON‑RPC 2.0 형식으로 전송돼 무결성과 인증이 보장된다.

통신 구조는 ‘Hybrid Transport Layer’를 도입해 제어 평면은 기존 MCP의 동기식 RPC(HTTP/STDIO)로, 데이터 평면은 Server‑Sent Events(SSE)로 비동기 스트리밍한다. 이는 ping·traceroute와 같이 장시간 실행되는 툴의 실시간 출력을 사용자에게 지연 없이 전달하면서도, 기본 RPC 타임아웃에 얽매이지 않게 만든다.

성능 평가에서는 500개의 글로벌 도메인에 대해 traceroute 3hop IP 추출 작업을 수행했다. Baseline(LLM이 직접 명령 문자열을 생성·정규식 파싱) 대비 MCPDiag은 0.4 %의 파싱 실패를 완전히 제거했고, 평균 레이턴시 오버헤드는 311 ms(전체 34 s 작업 대비 0.9 %)에 불과했다. 토큰 사용량은 JSON 스키마 삽입으로 3.7배 증가했지만, LLM이 토큰을 병렬 처리하므로 TTFT(Time‑to‑First‑Token) 지연에는 큰 영향을 주지 않았다. 시스템 자원 측면에서도 메모리 증가가 15 MB, CPU 피크가 1.1 % 상승하는 수준으로, 엣지 디바이스에서도 충분히 배포 가능함을 보여준다.

전반적으로 MCPDiag은 ‘신경‑기호 혼합(Neuro‑Symbolic)’ 접근법을 통해 LLM의 확장성을 유지하면서도, 네트워크 진단이라는 고신뢰성·고보안 도메인에 필요한 결정적 데이터 흐름과 인간‑중심 거버넌스를 제공한다는 점에서 의미가 크다. 향후 복잡한 패킷 캡처(tshark)와 멀티‑스텝 자동 진단 워크플로우, 대규모 동시 실행을 위한 분산 오케스트레이션 등으로 확장될 가능성이 높다.

**


댓글 및 학술 토론

Loading comments...

의견 남기기