적응형 에이전트 그래프 검색으로 비용 효율적이고 신뢰성 높은 추론 구현

적응형 에이전트 그래프 검색으로 비용 효율적이고 신뢰성 높은 추론 구현
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

A2RAG는 질문 난이도에 따라 검색 비용을 조절하고, 그래프 추출 손실을 보완하기 위해 그래프 구조를 탐색 지표로 활용하면서 원문 텍스트에서 정밀한 근거를 회수하는 두 단계 적응형·에이전트 기반 프레임워크이다. HotpotQA와 2WikiMultiHopQA에서 Recall@2를 각각 9.9%·11.8% 향상시키고, 토큰 사용량과 지연 시간을 절반 수준으로 감소시켰다.

상세 분석

본 논문은 멀티홉 질문응답 시스템에서 두 가지 실무적 병목, 즉 “혼합 난이도 워크로드에 대한 일괄 검색”과 “그래프 추출 손실(Extraction loss)”을 핵심 문제로 규정한다. 첫 번째 문제는 질의가 쉬운 경우에도 복잡한 전역 그래프 탐색을 수행하면 불필요한 연산 비용과 지연이 발생하고, 반대로 복잡한 질의에 대해 단순 로컬 탐색만 수행하면 정확한 답변을 도출하지 못한다는 점이다. 기존 연구들은 질의 난이도를 사전에 추정하거나 텍스트 기반 적응형 검색을 제안했지만, 그래프 구조를 활용한 단계적 확장 메커니즘을 제공하지 못한다. 두 번째 문제는 정보 추출 파이프라인이 주어‑객체‑관계 삼중항만을 보존하고, 수치·시간·조건 등 세부 수식어를 누락함으로써 그래프가 원문 텍스트보다 정보가 빈약해지는 현상이다. 이러한 손실은 특히 금융·법률 등 정밀한 근거가 요구되는 도메인에서 치명적이다.

A2RAG는 이러한 문제를 해결하기 위해 두 개의 상호 보완적인 모듈을 설계한다. 첫 번째는 “Adaptive Control Loop”으로, 질의가 들어오면 요약된 KB와의 유사도 기반 가벅을 적용해 범위 외 질의를 사전 차단한다. 이후 경량 LLM을 이용해 초기 답변을 생성하고, Triple‑Check(관련성·근거·충분성) 검증을 수행한다. 검증이 실패하면 질의를 재작성하고, 사전에 정의된 예산 한도 내에서 제한된 재시도를 수행한다. 이 과정은 질의‑답변 수준에서 증거 충분성을 판단하므로, 검색 단계에서 과도한 탐색을 방지한다.

두 번째는 “Agentic Retriever”이다. 이 에이전트는 상태를 유지하며 로컬‑퍼스트 전략으로 그래프를 탐색한다. 초기 단계에서는 쿼리와 직접 연결된 엔티티 주변의 1‑hop 이웃만을 확장하고, 증거 충분성 검사를 통해 충분하면 즉시 종료한다. 부족하면 “Bridge Discovery” 단계로 넘어가, 로컬 서브그래프 사이를 연결하는 잠재적 중간 노드를 탐색한다. 최종적으로도 충분치 않을 경우 Personalized PageRank 기반 전역 확산을 수행한다. 핵심은 그래프 노드·서브그래프가 높은 점수를 획득하면, 해당 노드와 연관된 원문 청크를 π 함수(맵‑백)로 역추적해 정밀한 수치·조건·시간 정보를 회수한다. 따라서 그래프는 “네비게이션 지도” 역할을 하고, 최종 근거는 원문 텍스트에서 확보함으로써 Extraction loss에 강인한 시스템을 구현한다.

실험에서는 공개 멀티홉 QA 데이터셋인 HotpotQA와 2WikiMultiHopQA, 그리고 실제 외환(FX) 트레이딩 플랫폼에서 수집한 프로덕션 질의 집합을 사용했다. A2RAG는 기존 GraphRAG 기반 로컬 탐색(LightRAG) 및 전역 요약(Microsoft GraphRAG) 대비 Recall@2에서 각각 9.9%·11.8% 절대 향상을 보였으며, 토큰 소비와 전체 응답 지연을 약 50% 감소시켰다. 특히 비용‑효율성 측면에서, 쉬운 질의에 대해서는 로컬 탐색만으로 평균 1.2개의 토큰 집합을 사용했으며, 복잡한 질의에 대해서도 단계적 확장으로 전체 검색 비용을 2배 이하로 억제했다.

이러한 설계는 (1) 증거 충분성을 실시간으로 판단해 검색 비용을 동적으로 조절하는 적응형 제어, (2) 그래프 구조를 활용한 단계적 탐색과 원문 회수를 결합한 에이전트형 검색, (3) 추출 손실에 대한 복원 메커니즘을 제공한다는 점에서 기존 연구와 차별화된다. 또한, 컨트롤 루프와 에이전트가 명확히 분리돼 있어 시스템 유지보수와 모듈 교체가 용이하고, 인간‑인‑루프 검증을 옵션으로 삽입해 고신뢰 환경에서도 안전하게 적용할 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기