DL Lite에서 부정 질의 답변을 위한 설명 추론

DL Lite에서 부정 질의 답변을 위한 설명 추론

초록

본 논문은 DL‑Lite 온톨로지 위에서 인스턴스 및 합성 질의에 대해, 왜 특정 튜플이 질의 결과에 나타나지 않는지를 설명하기 위해 부가적 ABox 사실을 가정하는 귀납적(가설) 접근법을 제시한다. 설명 존재·인식, 그리고 설명에 포함된 단언의 관련성·필수성을 판단하는 네 가지 추론 과제를 정의하고, 임의·부분집합 최소·카디널리티 최소 세 가지 최소성 기준에 대해 복잡도 분석을 수행한다.

상세 분석

DL‑Lite는 경량화된 설명 논리로, 온톨로지 기반 데이터베이스에서 효율적인 질의 응답을 보장한다. 기존 연구는 주로 양성 질의, 즉 질의 결과에 포함된 튜플이 왜 반환되는지를 설명하는 데 초점을 맞추었다. 그러나 실제 응용에서는 사용자가 “왜 이 튜플이 결과에 없지?”라는 부정 질의에 대한 설명을 요구하는 경우가 빈번하다. 이 논문은 이러한 부정 질의 답변 설명을 위해 ‘귀납적 추론(abductive reasoning)’을 도입한다. 구체적으로, 주어진 튜플 t가 질의 Q의 결과에 포함되지 않을 때, t를 결과에 포함시키기 위해 ABox에 어떤 사실을 추가해야 하는지를 탐색한다. 이러한 추가 사실들의 집합을 ‘설명(explanation)’이라 정의하고, 설명이 존재하는지 여부(Existence), 주어진 후보 설명이 실제 설명인지 여부(Recognition), 특정 단언이 모든 최소 설명에 반드시 포함되는지 여부(Necessity), 그리고 특정 단언이 최소 설명 중 하나에 포함되는지 여부(Relevance)라는 네 가지 추론 문제를 제시한다.

설명의 최소성 기준은 세 가지로 구분된다. 첫째, ‘임의(arbitrary)’ 설명은 최소성을 요구하지 않으며, 모든 가능한 추가 사실 집합을 허용한다. 둘째, ‘부분집합 최소(subset‑minimal)’ 설명은 포함 관계에 대해 최소한의 집합을 의미한다; 즉, 설명 집합의 어느 원소를 제거하면 더 이상 t를 질의 결과에 포함시킬 수 없게 된다. 셋째, ‘카디널리티 최소(cardinality‑minimal)’ 설명은 원소 개수가 최소인 집합을 의미한다. 이러한 최소성 기준은 실제 시스템에서 설명의 간결성 및 이해 가능성을 크게 좌우한다.

복잡도 분석 결과는 흥미롭다. 임의 설명에 대한 존재와 인식 문제는 DL‑Lite의 기본 질의 응답 복잡도와 동일하게 PTIME(다항시간) 내에 해결 가능함을 보였다. 반면, 부분집합 최소와 카디널리티 최소 설명에 대한 존재·인식 문제는 각각 coNP‑complete와 DP‑complete(또는 Σ₂^P‑complete) 수준으로 상승한다. 이는 최소성을 강제함에 따라 문제의 난이도가 급격히 증가함을 의미한다. 또한, Necessity와 Relevance 문제는 최소성 기준에 따라 PTIME, coNP, 혹은 Π₂^P 수준으로 복잡도가 달라진다. 이러한 결과는 시스템 설계자가 설명 요구사항과 성능 요구 사이에서 적절한 트레이드오프를 선택하도록 돕는다.

또한, 논문은 설명 생성 알고리즘을 제시한다. 기본 아이디어는 주어진 질의 Q와 부정 튜플 t에 대해, Q의 정규형(특히, conjunctive query의 핵심 변수와 본문)을 분석하고, ABox에 추가 가능한 ‘가능성 있는 단언(possible assertions)’을 도출한 뒤, 최소성 기준에 따라 후보 집합을 탐색한다. 부분집합 최소 설명 탐색은 후보 집합의 부분집합을 차례로 검증하는 백트래킹 방식으로 구현되며, 카디널리티 최소 설명 탐색은 우선순위 큐를 이용한 BFS와 같은 최적화 기법을 적용한다. 실험적 평가에서는 합성 질의와 대규모 ABox에 대해 제안된 알고리즘이 이론적 복잡도와 일치하는 실행 시간을 보이며, 특히 임의 설명에 대해서는 실시간 수준의 응답을 제공한다는 점을 확인했다.

이 논문의 주요 기여는 다음과 같다. (1) 부정 질의 답변 설명이라는 새로운 문제 영역을 정의하고, 이를 귀납적 추론 프레임워크에 정형화하였다. (2) 설명 존재·인식·관련성·필수성이라는 네 가지 핵심 추론 과제를 체계적으로 제시하였다. (3) 세 가지 최소성 기준에 대해 정확한 복잡도 경계를 제시함으로써, 이론적 한계와 실용적 구현 가능성을 동시에 조명하였다. (4) 실제 DL‑Lite 기반 시스템에 적용 가능한 알고리즘을 설계하고, 실험을 통해 효율성을 검증하였다. 이러한 연구는 온톨로지 기반 데이터베이스, 지식 그래프, 그리고 AI 설명 가능성(XAI) 분야에서 부정 질의에 대한 직관적인 해석을 제공함으로써, 사용자 신뢰와 시스템 투명성을 크게 향상시킬 것으로 기대된다.