원자 정보 흐름: RAG 시스템에서 도구 귀속을 위한 네트워크 흐름 모델

원자 정보 흐름: RAG 시스템에서 도구 귀속을 위한 네트워크 흐름 모델
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 도구 기반 Retrieval‑Augmented Generation(RAG) 시스템에서 최종 응답을 개별 도구와 LLM 호출에 정확히 연결하기 위한 그래프 기반 네트워크 흐름 모델인 Atomic Information Flow(AIF)를 제안한다. 정보를 원자(atom)라는 최소 단위로 분해하고, 흐름을 최대‑최소 절단 이론에 매핑해 중요한 정보 절단을 학습한다. 경량 Gemma‑3 4B 모델을 AIF 신호로 사전학습시켜 HotpotQA에서 정확도를 54.7%에서 82.71%로 끌어올리고, 87.52%의 컨텍스트 압축률을 달성했다.

상세 분석

AIF 모델은 RAG 파이프라인을 정점 V와 방향성 간선 E로 구성된 유향 그래프 G = (V, E)로 형식화한다. 여기서 정점은 사용자 질의(슈퍼‑소스 s₀), 도구 호출 노드 V_tool, 중간 LLM 호출 노드 V_llm, 최종 응답(슈퍼‑싱크 t₀)으로 구분된다. 핵심 개념은 ‘원자(atom)’이다. 원자는 의미적으로 더 이상 분해할 수 없는 최소 정보 단위이며, 각 정점 v 에서 생성된 원자 집합 Atoms(v) 는 다중집합으로 표현된다. 공급 노드 v는 Atoms(v) ≠ ∅ 인 경우이며, 이는 도구 출력이나 중간 LLM 생성에 해당한다. 흐름 f : E → ℕ₀은 각 간선에 전달되는 원자 수를 나타내며, 정점 v 에 대한 보존식은 ∑{(u,v)∈E} f(u,v) + s(v) ≥ ∑{(v,w)∈E} f(v,w) 이다. 여기서 s(v) = |Atoms(v)| 는 외부 공급량을 의미한다. LLM 노드는 ‘활성 노드’로 간주되어, 공급 s(v) 와 흐름 사이에 슬랙 δ(v) ≥ 0을 허용한다. 슬랙은 LLM이 질의에 따라 불필요한 원자를 걸러내는 역할을 수량화한다.

AIF는 흐름을 ‘다중상품 흐름(Multicommodity Flow)’으로 해석한다. 각 원자는 구별 가능한 상품이며, 전체 흐름은 정수 다중상품 흐름 문제에 귀속된다. 이는 NP‑hard 문제이지만, 최대‑흐름 최소‑절단 정리를 이용해 정보 병목(최소 절단)을 근사한다. 논문에서는 정책 π(q, T) 를 SFT(슈퍼바이즈드 파인‑튜닝)로 학습시켜, 실제 추론 시에는 복잡한 최적화 대신 사전 학습된 모델이 최소 절단을 예측하도록 설계했다.

실험 파이프라인은 세 단계로 구성된다. ① ‘원자 분해’ 단계에서는 GPT‑5‑Nano 기반 디컴포저 D 를 이용해 도구 출력 텍스트를 원자 집합으로 변환한다. 대용량 출력은 맵‑리듀스 방식으로 청크화·병렬 처리한다. ② ‘원자 신호 주입’ 단계에서는 의미적 관련성 스코어러 S 를 통해 각 원자에 스칼라 메타데이터 S(a,q) 를 부여한다. 이는 신뢰도, 최신성, 불확실성 등 다양한 가중치를 반영할 수 있다. ③ ‘응답 원자 할당’ 단계에서는 최종 LLM 응답을 원자 R_resp 로 분해하고, 전역 후보 원자 U_flat 와 매칭함으로써 각 응답 원자가 어떤 도구 원자로부터 유래했는지 다중 귀속 집합 Φ 을 만든다. 매칭은 전역 풀을 순회하는 맵‑리듀스 전략으로 구현돼, 도구 순서에 편향되지 않는다.

이후 정의된 흐름 휴리스틱(표 1)은 원자 수준의 기여도, 고관련성 비율, 도구별 사용량 등을 정량화한다. 예를 들어 AR,T 은 응답 원자 중 도구에 의해 제공된 비율, RAP 은 고관련성 원자 비율을 나타낸다. 이러한 메트릭은 ‘진실’과 ‘거짓’ 세그먼트 간 차이를 분석해, 올바른 답변이 높은 도구 기여와 높은 관련성 원자 비율을 보임을 확인한다.

핵심 실험은 HotpotQA, MS MarcoV2, Musique, Wiki Multihop QA 등 다중 컨텍스트 QA 데이터셋에서 수행됐다. 각 데이터셋은 인간이 라벨링한 도구 귀속 정보를 제공한다. 베이스 Gemma‑3 4B 모델은 HotpotQA에서 54.7% 정확도(베이스라인 BM25와 근소 차)였으나, AIF 신호로 사전 학습한 후 82.71%(+28.01점)로 크게 향상되었다. 동시에 컨텍스트 토큰 압축률은 87.52%(+1.85점)로, 파라미터 7배 큰 Gemma‑3 27B와 거의 동등한 성능을 달성했다. 또한, 흐름 기반 귀속 메트릭은 ALCE 벤치마크와 비교해 동등하거나 약간 우수한 정밀도·재현율을 기록했으며, 기존 단일‑샷 인용 방식이 제공하지 못하는 도구‑레벨 디버깅 정보를 제공한다.

결론적으로 AIF는 RAG 시스템 내 정보 흐름을 정량화·시각화함으로써, (1) 미세한 도구 귀속 분석, (2) 병목 원자 식별을 통한 컨텍스트 압축, (3) 다중‑에이전트 오케스트레이션 디버깅을 가능하게 한다. 향후 연구에서는 검색 흐름(리트리벌 엣지)까지 확장하고, 더 복잡한 멀티‑에이전트 시나리오에 적용해 전체 시스템 효율성을 최적화할 계획이다.


댓글 및 학술 토론

Loading comments...

의견 남기기