동적 스키마 유도와 진화 의도 평가를 통한 스키마 프리 증분 지식 그래프 구축
초록
**
DIAL‑KG는 메타‑지식 베이스를 중심으로 삼 단계(이중 트랙 추출, 거버넌스 심사, 스키마 진화)를 순환하며, 사전 정의된 스키마 없이 스트리밍 데이터에 대해 증분적으로 지식 그래프를 구축한다. 복잡한 사건은 이벤트 형태로, 단순 사실은 삼중항으로 자동 전환해 정확도와 최신성을 유지한다. 실험 결과 기존 스키마‑프리 LLM 기반 방법보다 F1 점수가 최대 4.7% 향상되고, 스키마 중복이 15% 감소하는 등 전반적인 성능이 우수함을 입증한다.
**
상세 분석
**
본 논문은 기존 지식 그래프(KG) 구축 방식이 정적 코퍼스와 사전 정의된 스키마에 의존해 동적 데이터 흐름에 취약하다는 점을 정확히 짚어낸다. DIAL‑KG는 이러한 한계를 극복하기 위해 ‘메타‑지식 베이스(MKB)’라는 중앙 관리 레이어를 도입한다. MKB는 엔티티 프로파일, 관계 스키마, 이벤트 스키마를 지속적으로 업데이트하며, 이후 배치 처리 시 컨텍스트로 활용한다. 핵심 기법은 ‘이중 트랙 추출(Dual‑Track Extraction)’이다. 입력 문장을 사전 판단 기준에 따라 단순 삼중항(정적 트랙)과 복합 이벤트(동적 트랙)로 라우팅함으로써, 불필요한 이벤트 구조화를 피하고 동시에 시간·상태 정보를 보존한다. 이 과정에서 LLM은 few‑shot 프롬프트와 MKB‑기반 스키마 검색을 결합해, 스키마가 없는 상황에서도 높은 정밀도를 유지한다.
거버넌스 단계는 ‘Evidence Verification’, ‘Logical Verification’, ‘Evolutionary‑Intent Verification’ 세 가지 서브모듈로 구성된다. Evidence Verification은 추출된 사실에 대한 원본 증거를 검증해 hallucination을 억제하고, Logical Verification은 MKB에 저장된 스키마와의 일관성을 체크한다. 특히 Evolutionary‑Intent Verification은 기존 사실의 ‘버전’과 ‘폐기 의도’를 판단해, 오래된 사실을 물리적으로 삭제하지 않고 ‘soft deprecation’ 상태로 전환한다. 이는 지식의 역사적 연속성을 보존하면서도 최신성을 확보하는 설계이다.
스키마 진화 단계에서는 검증된 사실을 기반으로 새로운 관계·이벤트 스키마를 자동 유도한다. 여기서는 클러스터링 기반 엔티티 정규화와 이벤트 역할 추출을 활용해, 기존 스키마와 중복되지 않는 파라미터를 최소화한다. 결과적으로 스키마 수가 15% 감소하고, 중복 관계가 크게 줄어들어 메모리와 추론 비용이 절감된다.
실험에서는 정적 벤치마크와 자체 구축한 스트리밍 데이터셋을 사용해, 기존 스키마‑프리 LLM 기반 방법 대비 F1 점수가 최대 4.7% 상승하고, 증거 기반 폐기 정확도가 98%에 달한다는 실증적 결과를 제시한다. 특히 이벤트 중심의 복합 지식에 대해 높은 재현율을 보이며, 증분 업데이트 시 전체 그래프를 재구성하지 않아도 되는 효율성을 입증한다.
종합적으로 DIAL‑KG는 (1) 스키마‑프리이면서도 구조화된 지식 표현을 가능하게 하는 이중 트랙 설계, (2) 메타‑지식 베이스를 통한 지속적인 거버넌스와 버전 관리, (3) 자동 스키마 진화 메커니즘이라는 세 축을 통해, 동적 환경에서의 KG 구축에 새로운 패러다임을 제시한다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기