거리 기반 신뢰 함수로 온톨로지 매칭 불확실성 해결

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 온톨로지 매칭 과정에서 발생하는 불확실성을 다루기 위해, 여러 유사도 측정기의 결과를 믿음 함수(Theory of Belief Functions)로 모델링하고, 결합된 믿음 질량과 각 후보 매핑의 범주형 질량 사이의 Jousselme 거리를 최소화하는 새로운 의사결정 규칙을 제안한다. 이를 통해 1:1 및 1:n 매핑을 포함한 복합 매핑을 효과적으로 선택한다.

상세 분석

이 연구는 온톨로지 매칭을 불확실성 이론과 결합함으로써 기존의 단일 유사도 기반 접근법이 갖는 한계를 극복하고자 한다. 먼저, 저자들은 Levenshtein, Jaro, Hamming 등 서로 다른 문자열 기반 유사도 측정기를 독립적인 정보원(source)으로 간주하고, 각 측정값을 기본 믿음 할당(basic belief assignment, bba)으로 변환한다. 이때, 유사도 값은 해당 매핑에 대한 질량으로 직접 사용되고, 남은 질량은 전체 무지(Θ)로 할당한다. 이렇게 구성된 여러 bba는 Dempster의 결합 규칙을 통해 하나의 통합 bba로 합쳐지며, 이는 각 후보 매핑에 대한 종합적인 신뢰도를 제공한다.

핵심 기여는 결합된 bba와 후보 매핑을 나타내는 범주형 bba 사이의 거리 측정을 의사결정 기준으로 삼는 점이다. 저자들은 Jousselme 거리를 선택했는데, 이는 믿음 함수의 특성을 반영하여 집합 간의 카디널리티와 겹침 정도를 고려한다. 구체적으로, Θ의 파워셋 2^Θ에서 원소의 카디널리티가 2 이하인 경우만을 대상으로 범주형 bba를 구성함으로써 계산 복잡성을 제한한다. 각 후보 원소 X에 대해 m_X(X)=1인 단일 질량을 정의하고, 결합 bba와 m_X 사이의 거리 d(m, m_X)를 계산한다. 최소 거리값을 갖는 X가 최종 매핑 후보가 되며, 이는 “가장 신뢰할 수 있는 복합 가설”을 선택한다는 의미이다.

또한, 저자들은 거리 기반 규칙이 기존의 신뢰도, 가능도, 피그니스틱 확률 등 단일값 기반 의사결정 방식보다 복합 가설을 직접 다룰 수 있다는 장점을 강조한다. 실험에서는 회의 조직 도메인의 온톨로지를 대상으로 세 가지 문자열 유사도 측정기를 적용하고, Dempster 결합 후 거리 규칙을 사용해 최종 매핑을 도출하였다. 결과는 θ1∪θ2와 같은 1:n 매핑이 최소 거리를 보이며, 이는 기존 방법이 놓칠 수 있는 복합 매핑을 효과적으로 포착함을 보여준다.

이 논문의 한계는 파워셋의 크기가 커질 경우 후보 원소 선택 기준(카디널리티 ≤2)이 강제된다는 점이며, 이는 매핑 후보가 제한될 위험이 있다. 또한, Jousselme 거리 외 다른 거리 척도와의 비교 실험이 부족하여 일반화 가능성을 평가하기 어렵다. 향후 연구에서는 후보 원소 선택을 동적으로 조정하거나, 거리 기반 규칙을 다른 불확실성 이론(예: Possibility Theory)과 결합하는 방안을 모색할 수 있다.

거리 기반 신뢰 함수로 온톨로지 매칭 불확실성 해결

초록

상세 분석

댓글 및 학술 토론

의견 남기기