불완전 추론기의 완전성 보장: 이론과 실천

초록

본 논문은 특정 쿼리와 온톨로지에 대해, 일반적으로 불완전한 OWL 2 추론기가 실제로는 완전하게 동작하는지를 검증하는 논리 기반 프레임워크를 제시한다. 또한 두 추론기의 완전성 수준을 비교해, 응용 프로그램에 가장 적합한 추론기를 선택하도록 돕는다.

상세 분석

이 연구는 온톨로지 기반 정보 시스템에서 확장성을 확보하기 위해 흔히 사용되는 불완전 OWL 2 추론기의 ‘완전성’ 문제를 체계적으로 다룬다. 핵심 아이디어는 “쿼리 Q와 온톨로지 T가 고정된 상황에서, 모든 데이터셋 A에 대해 추론기 R이 Q에 대한 모든 정답을 반환하는가?”를 논리적으로 검증하는 것이다. 이를 위해 저자들은 (1) 추론기의 동작을 모델 이론적 의미론으로 형식화하고, (2) 완전성을 판단하기 위한 ‘완전성 테스트 셋’(completeness test suite)을 구성한다. 테스트 셋은 온톨로지 T와 쿼리 Q에 의해 유도된 제한된 패턴의 ABox들로 이루어지며, 이들에 대해 R이 놓치는 답이 없으면 모든 가능한 A에 대해 완전함을 보장한다는 정리를 증명한다.

또한, 두 추론기 R₁, R₂가 각각 ‘정답 보존’와 ‘답변 확대’라는 두 가지 가정을 만족한다면, 동일한 Q와 T에 대해 R₁이 R₂보다 더 많은 답을 산출하는지를 결정하는 비교 알고리즘을 제시한다. 이 알고리즘은 차이점이 존재할 경우 구체적인 반례 A를 생성해 개발자가 직접 검증할 수 있게 한다.

실험 부분에서는 대표적인 불완전 추론기인 OWL RL 엔진과 ELK, HermiT 등을 대상으로 프레임워크를 적용하였다. 결과는 특정 도메인(예: 의료, 군사)에서 흔히 사용되는 복합 클래스 정의와 역할 체인에 대해, 일반적으로 불완전하다고 알려진 엔진도 실제 데이터에선 완전성을 유지함을 보여준다. 이는 온톨로지와 쿼리가 사전에 고정된 상황이라면, 불완전 추론기의 위험성을 크게 낮출 수 있음을 의미한다.

이 논문의 의의는 이론적 완전성 보장을 실용적인 도구로 전환함으로써, 개발자가 성능과 정확성 사이의 트레이드오프를 정량적으로 판단하도록 돕는 데 있다. 특히, 보건·국방 등 누락된 답변이 치명적인 분야에서, 기존에 포기했던 고성능 추론기를 다시 검토할 근거를 제공한다.