복잡도에 따라 그래프를 활용하는 효율적 적응형 RAG
초록
본 논문은 질문의 구문적 복잡도를 정량화하여 단순 질의는 전통적인 밀집(RAG) 검색으로, 복합 질의는 그래프 기반 검색(GraphRAG)으로 자동 라우팅하는 EA‑GraphRAG 프레임워크를 제안한다. 구문 특징 추출기, 경량 복잡도 스코어러, 스코어 기반 라우팅 정책을 결합해 정확도와 지연시간을 동시에 개선했으며, 단일·다중 홉 QA 벤치마크에서 최첨단 성능을 달성하였다.
상세 분석
EA‑GraphRAG는 기존 GraphRAG가 모든 질의에 무조건 그래프 검색을 적용해 발생하는 효율성 저하와 단순 질의에서의 정확도 감소 문제를 근본적으로 해결한다. 핵심 아이디어는 “질문의 구문적 복잡도”를 정량화하는데 있다. 이를 위해 저자는 Stanza 기반의 구문 트리와 SpaCy 의존 구문 분석기를 활용해 9가지 기본 구문 단위(단어, 문장, 절, 종속절, T‑unit, 복합 T‑unit, 좌표구, 복합 명사, 동사구)를 Tregex 패턴으로 추출하고, 각 단위의 평균 길이, 절‑문장 비율, 종속절‑절 비율 등 다양한 비율형 특징을 계산한다. 또한 의존 거리, 장거리 의존, 주‑동사·목‑동사 관계 수, 트리 불균형 지표 등 구조적 특징을 추가한다. 의미적·어휘적 측면에서는 엔티티 종류와 밀도, 의미역(주체, 객체, 시간·장소) 표시, 고유 토큰 비율, 기능어 대비 내용어 비율, 부정·수동태·연결어 사용 여부 등을 포함한다. 마지막으로 트리 깊이·폭, 분기 계수, 깊이‑폭 비율 등 전역 트리 특성을 추출하고, 토큰·절·엔티티 등 여러 차원을 결합한 상호작용 특징을 만든다. 이렇게 구성된 수백 차원의 원시 피처는 차원 축소와 중요도 기반 선택 과정을 거쳐 최종 𝑑′ 차원 벡터 𝜙(q) 로 압축된다.
복잡도 스코어러는 이 피처 벡터에 가벼운 MLP 어댑터(특징 어텐션 및 잔차 연결 포함)를 적용해 0‑1 사이의 연속 점수 s(q)를 출력한다. 두 개의 임계값 τ_L, τ_H 를 사전에 정의하거나 검증 데이터로 튜닝하여, s(q) < τ_L이면 밀집(RAG) 검색, s(q) ≥ τ_H이면 그래프(GraphRAG) 검색, τ_L ≤ s(q) < τ_H 구간에서는 가중 역순 순위 융합(wRRF)으로 두 경로의 결과를 혼합한다. 이 라우팅 메커니즘은 질의당 최적의 검색 전략을 자동 선택함으로써, 복잡한 다중 홉 추론이 필요한 경우 그래프의 구조적 이점을 살리고, 단순 질의에서는 고속 밀집 검색으로 지연을 최소한다.
시스템 구현 측면에서 저자는 기존 GraphRAG와 동일한 이질적 그래프 인덱스를 사용한다. 노드 집합 V는 명사구·엔티티와 원문 패시지를 포함하고, 관계 엣지는 OpenIE 삼중항, 출현 엣지, 동의어 엣지로 구성된다. 이렇게 구축된 그래프는 기존 GraphRAG와 동일한 구조적 검색 파이프라인을 활용하되, 라우팅 모듈만 추가함으로써 구현 복잡도는 크게 증가하지 않는다.
실험에서는 Natural Questions, TriviaQA 등 단일 홉 데이터와 HotpotQA, ComplexWebQuestions 등 다중 홉 데이터 두 쌍을 사용해 비교하였다. EA‑GraphRAG는 전체 평균 정확도에서 기존 GraphRAG 대비 79%p 상승, RAG 대비 35%p 상승을 기록했으며, 평균 응답 지연은 RAG 수준에 가깝게 유지되었다. 특히 복합 질의 비중이 높은 설정에서는 GraphRAG 대비 30% 이상 속도 개선을 보였다. 복합·단순 질의가 혼합된 실제 서비스 시나리오에서도 라우팅 정책이 정확도와 효율성 사이의 트레이드오프를 효과적으로 조정한다는 점을 입증하였다.
전체적으로 EA‑GraphRAG는 “복잡도 기반 적응형 라우팅”이라는 새로운 패러다임을 제시함으로써, 그래프 기반 추론의 장점을 유지하면서도 시스템 전반의 효율성을 크게 향상시킨다. 구문적 복잡도 측정이 비교적 저비용이며, 라우팅 정책이 경량 MLP 하나로 구현될 수 있다는 점은 실제 대규모 서비스에 적용하기에 실용적이다. 향후 연구에서는 복합성 스코어러에 메타러닝이나 대규모 LLM 기반 프롬프트를 결합하거나, 그래프 구조 자체를 동적으로 재구성하는 방법을 탐색할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기