동적 지식 그래프와 설명 가능한 RAG로 강화된 텔레콤 LLM

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 텔레콤 분야의 복잡한 표준과 전문 용어에 대응하기 위해, 지식 그래프(KG)와 검색 강화 생성(RAG)을 결합한 KG‑RAG 프레임워크를 제안한다. LLM이 문서에서 엔터티와 관계를 추출해 동적으로 KG를 구축하고, KG 기반 필터링·프로베넌스와 함께 최신 텔레콤 문서를 검색해 LLM 프롬프트에 제공함으로써 사실 정확도와 설명 가능성을 크게 향상시킨다. 실험 결과, 기존 LLM 단독 모델 대비 평균 정확도가 21.6 % 상승하고, 전통 RAG 대비 14.3 % 개선되었다.

상세 분석

KG‑RAG는 텔레콤 도메인의 특수성을 고려한 세 가지 핵심 설계 요소를 갖는다. 첫째, LLM 기반 엔터티 추출 파이프라인은 사전 학습된 대형 모델을 활용해 3GPP, O‑RAN 등 표준 문서에서 네트워크 장비, 프로토콜, KPI 등 도메인‑특화 용어를 자동으로 식별하고, 관계 추론 모듈과 결합해 트리플을 생성한다. 이 과정에서 프롬프트 엔지니어링과 규칙 기반 보조를 적용해 신뢰성을 높인다. 둘째, 구축된 트리플은 동적 KG로 유지된다. 실시간 텔레콤 로그, 텔레메트리, 구성 변경 이벤트가 스트리밍 파이프라인을 통해 KG에 삽입·수정되며, 최신 네트워크 상태를 반영한다. 이렇게 업데이트된 KG는 RAG 단계에서 전통적인 텍스트 패시지 대신 스키마에 정렬된 구조화된 사실을 제공한다. 셋째, 설명 가능성을 위해 검색된 트리플은 인간이 이해하기 쉬운 문장 형태로 변환되고, 온톨로지‑기반 유사도 점수에 따라 순위가 매겨진다. 생성 단계에서 LLM은 이러한 정제된 컨텍스트와 사용자 질의를 결합해 답변을 생성하고, 각 답변 조각은 원본 KG 노드·문서·로그와 연결된 메타데이터를 함께 반환한다. 실험에서는 5G 슬라이스 관리, 서비스 영향 분석, 표준 준수 검증 등 3가지 벤치마크 데이터셋을 사용했으며, KG‑RAG는 기존 LLM‑only와 전통 RAG 대비 각각 21.6 %·14.3 %의 정확도 향상을 기록했다. 특히, 오류 원인 추적과 규격 인용이 필요한 시나리오에서 hallucination 비율이 현저히 낮아졌으며, 제공된 근거가 자동으로 검증 가능하도록 설계된 점이 큰 강점으로 평가된다.

동적 지식 그래프와 설명 가능한 RAG로 강화된 텔레콤 LLM

초록

상세 분석

댓글 및 학술 토론

의견 남기기