딥 그래프RAG: 계층적 검색과 적응형 통합을 위한 균형 잡힌 접근법

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

딥 그래프RAG는 대규모 계층형 지식 그래프에서 전역 탐색과 지역 탐색 사이의 효율성-포괄성 트레이드오프를 해소한다. 3단계의 전역‑지역 검색(커뮤니티 필터링 → 커뮤니티 정제 → 엔티티 세부 검색)과 빔 서치 기반 동적 재랭킹을 결합하고, 동적 가중치 보상 강화학습(DW‑GRPO)으로 신뢰성·관련성·간결성을 균형 있게 최적화한다. 1.5 B 소형 모델이 70 B 대형 모델 수준의 성능을 달성하며, Natural Questions와 HotpotQA에서 정확도와 지연 시간 모두 크게 향상된다.

상세 분석

딥 그래프RAG는 기존 GraphRAG이 직면한 “전역 탐색의 포괄성 vs. 지역 탐색의 효율성” 딜레마를 구조적으로 해결한다. 먼저, 원시 텍스트를 600 토큰 슬라이딩 윈도우와 100 토큰 오버랩으로 청크화하고, Qwen2.5‑72B‑Instruct를 이용해 엔티티와 방향성 관계를 추출한다. 여기서 일반적인 삼중항(triple) 대신 자연어 서술형 엣지를 생성해 복합 의미를 보존한다는 점이 혁신적이다.

엔티티 해소 단계에서는 bge‑m3 임베딩 기반 코사인 유사도(τ > 0.95)와 LLM 디스크리미네이터를 결합한 이중 검증을 적용해 동일 개념 병합을 고정밀로 수행한다. 이렇게 정제된 베이스 그래프 G에 대해 가중치 루오뱅 알고리즘을 3단계(레벨 0~2)로 재귀 적용해 커뮤니티 계층 C를 만든다. 각 커뮤니티는 하위 커뮤니티 임베딩의 평균 풀링으로 표현되고, 엔티티는 자체 임베딩과 상위 커뮤니티 임베딩을 concat해 컨텍스트 인식 표현 D_ctx(v)를 만든다.

검색 프로세스는 알고리즘 1에 명시된 4단계 파이프라인을 따른다. ① 최상위 커뮤니티를 재랭커(quick cross‑encoder)로 빠르게 스코어링하고 top‑k(=3)만 남긴다. ② 선택된 커뮤니티를 하위 커뮤니티로 확장해 bge‑reranker‑v2‑m3로 정교히 재랭킹한다. ③ 최종 엔티티 후보를 상위 커뮤니티와 결합된 컨텍스트 임베딩으로 코사인 유사도 계산 후 top‑m을 추출한다. ④ 추출된 엔티티 집합을 Knowledge Integration Module에 전달한다.

핵심은 빔 서치와 동적 재랭킹을 결합해 탐색 폭을 제한하면서도 중요한 서브그래프를 놓치지 않는 것이다. 빔 폭 k=3은 실험적으로 전역 탐색 비용을 80% 이상 절감하면서도 글로벌 질문(GQ)에서 기존 베이스라인을 크게 앞선다.

통합 단계에서는 DW‑GRPO라는 새로운 강화학습 프레임워크를 도입한다. 기존 GRPO는 고정 가중치(w)로 relevance, faithfulness, conciseness 세 보상을 결합해 “시소 효과”가 발생한다. DW‑GRPO는 각 보상의 변화율 α_j(t) = slope_j/Δr_j를 실시간으로 추정하고, 소프트맥스(온도 T)로 가중치를 재조정한다. 즉, 성장 속도가 느린 보상(예: relevance, faithfulness)에 더 높은 가중치를 부여해 정책이 쉽게 수렴하지 않게 만든다. 수식 (5)–(7)에 따라 advantage를 보정하고, 선형 회귀를 통해 slope_j를 추정한다.

실험에서는 1.5 B 모델에 DW‑GRPO를 적용했을 때, 70 B 모델 대비 94% 수준의 EM‑Total을 유지하면서도 파라미터와 연산량을 크게 절감했다. 특히 HotpotQA에서 다중 홉 추론이 요구되는 GQ에서 56.25% EM을 기록, 기존 Drift Search(38.75%)를 크게 앞섰다. 또한, 지연 시간 측면에서 Local Search 대비 86%, Global Search 대비 81.6% 감소를 보였다.

한계점도 존재한다. Comprehensive Question(CQ)에서는 일부 베이스라인(Local Search with DeepSeek‑R1)이 더 높은 EM‑CQ를 기록했으며, 이는 계층적 요약 과정에서 미세한 로컬 사실이 희석될 가능성을 시사한다. 향후 연구에서는 로컬 사실 보존을 위한 하이브리드 재랭킹 혹은 커뮤니티 내부의 세밀한 서브샘플링 기법을 도입할 여지가 있다.

전반적으로 딥 그래프RAG는 (1) 계층적 그래프 구축·해소 파이프라인, (2) 전역‑지역 빔 서치 재랭킹, (3) 동적 가중치 강화학습이라는 세 축을 결합해, 대규모 지식 그래프 기반 RAG의 효율·정확도 트레이드오프를 실질적으로 완화한다는 점에서 의미가 크다.

딥 그래프RAG: 계층적 검색과 적응형 통합을 위한 균형 잡힌 접근법

초록

상세 분석

댓글 및 학술 토론

의견 남기기