분산 도메인에서 비용 효율적인 그래프‑RAG 탐색: SCOUT‑RAG
초록
SCOUT‑RAG는 중앙집중형 그래프가 없는 환경에서 대규모 도메인 간 지식 그래프를 효율적으로 탐색하도록 설계된 에이전트 기반 프레임워크이다. 도메인 관련성 추정, 전역·국부 탐색 전환, 깊이·폭 적응, 그리고 답변 종합이라는 네 가지 전문 에이전트를 순차적으로 운영해 검색 비용(시간·토큰·API 비용)을 최소화하면서도 답변 품질을 중앙집중형 기준에 가깝게 유지한다. 실험 결과 1~40개 국가·도메인에 걸친 89개 질의에서 중앙집중형 DRIFT와 비슷한 정확도를 보이면서 토큰 사용량을 4배 이상 절감하고 지연 시간을 크게 단축하였다.
상세 분석
SCOUT‑RAG는 “분산 그래프‑RAG”라는 새로운 문제 정의에서 출발한다. 각 도메인은 자체적인 지식 그래프 (G_i=(V_i,E_i,X_i)) 를 보유하고 외부에 원본 데이터를 공개하지 않으며, 도메인 간 호출은 비용(시간·API 토큰)과 프라이버시 제약을 동반한다. 이러한 환경에서는 전통적인 중앙집중형 그래프 탐색이 불가능하므로, 시스템은 부분 관측과 점진적 효용 추정을 기반으로 탐색 정책을 동적으로 조정해야 한다.
논문은 이를 위해 네 개의 협업 에이전트를 설계한다.
- Domain Relevance Assessment Agent (DRAA) – 쿼리와 도메인 메타데이터(임베딩 기반 의미 유사도, 데이터 풍부도, 과거 성능)를 결합해 도메인을 HIGH, MODERATE, POTENTIAL, IRRELEVANT 네 단계로 분류하고, 각 도메인에 대한 자연어 근거를 제공한다. 이 단계는 라벨이 없는 상황에서도 훈련‑프리 방식으로 동작한다.
- Partial Answer Generation Agent (PAGA) – DRAA가 부여한 티어에 따라 탐색 깊이를 달리한다. HIGH‑티어는 전역(그래프‑요약) 검색, MODERATE‑티어는 로컬(엔티티·관계) 검색, POTENTIAL‑티어는 필요 시 나중에 활성화한다. 이렇게 계층화된 검색은 불필요한 호출을 억제하고 비용을 절감한다.
- Overall Answer Synthesis Agent (OASA) – 각 도메인에서 얻은 부분 답변을 소스 attribution과 일관성 검증을 거쳐 초기 응답 (A^{(0)}) 로 결합한다. 여기서는 단순 문자열 결합이 아니라 그래프 기반 증거 연결을 고려한다.
- Quality Assessment & Iterative Refinement Loop – 답변 품질(정확도, 근거 충실도)과 남은 예산을 모니터링하며, 필요 시 POTENTIAL 도메인을 활성화하거나 HIGH‑티어 도메인의 탐색 깊이를 늘린다. 이 루프는 검색 후회(minimum regret) 를 최소화하도록 설계되었으며, 시간·예산 제한을 초과하지 않도록 자동 종료 조건을 포함한다.
수식적으로는 목표 함수 ( \max_A Qual(A|q,{\pi_i}) ) 를 예산 제약 ( \sum_i c_i \le C_{max} ) 하에 해결한다. SCOUT‑RAG는 탐색 정책 ({\pi_i}) 를 점진적 정책 재정비(도메인 관련성 → 초기 부분 답변 → 품질 기반 재탐색) 로 구현함으로써 전통적인 일괄 탐색보다 효율성을 확보한다.
실험 설계는 89개의 복합 질의(다국가·다도메인)와 1~40개의 도메인 조합을 사용했으며, 비교 대상으로는 중앙집중형 DRIFT, 전역 전역 탐색, 그리고 단순 도메인 라우터가 있다. 주요 지표는 정답 정확도(F1/EM), 토큰 사용량, 응답 지연, 그리고 크로스‑도메인 호출 횟수이다. 결과는 SCOUT‑RAG가 DRIFT와 거의 동일한 정확도(56 vs. 63) 를 보이면서 토큰 사용량을 4배 이상 절감하고, 평균 지연을 30 % 이상 단축함을 보여준다. 또한, 라우터 기반 방법에 비해 라우팅 오류에 강인하고, 라벨이 없는 새로운 도메인에서도 빠르게 적응한다는 점이 강조된다.
한계점으로는 (1) 도메인 메타데이터가 충분히 풍부하지 않을 경우 DRAA의 정확도가 떨어질 수 있다, (2) 현재 구현은 동기식 병렬 호출에 의존해 네트워크 지연이 큰 환경에서는 성능 저하가 예상된다, (3) 비용 모델이 토큰·시간 외에 프라이버시 위험을 정량화하지 않아 실제 규제 환경 적용에 추가적인 설계가 필요하다. 향후 연구에서는 프라이버시‑보호 메커니즘(예: 차등 프라이버시)과 비동기식 스케줄링, 그리고 도메인 간 증거 연쇄 추적을 통한 설명 가능성을 강화할 계획이다.
댓글 및 학술 토론
Loading comments...
의견 남기기