자동 온톨로지 구축 도구

Janus는 XML Schema(XSD) 파일을 자동으로 분석해 도메인 레퍼런스 온톨로지를 생성하는 시스템이다. 스키마의 요소·타입·제한을 추출하고, 의미적 관계를 식별해 개념·속성·계층 구조를 온톨로지 형태로 변환한다. 또한 B2B 통합을 지원하는 다양한 시각화 뷰를 제공한다.

자동 온톨로지 구축 도구

초록

Janus는 XML Schema(XSD) 파일을 자동으로 분석해 도메인 레퍼런스 온톨로지를 생성하는 시스템이다. 스키마의 요소·타입·제한을 추출하고, 의미적 관계를 식별해 개념·속성·계층 구조를 온톨로지 형태로 변환한다. 또한 B2B 통합을 지원하는 다양한 시각화 뷰를 제공한다.

상세 요약

Janus는 XML Schema라는 실무에서 널리 사용되는 메타데이터 형식을 온톨로지 구축의 출발점으로 삼는다. 먼저 XSD 파서 모듈이 복합 타입, 단순 타입, 요소 선언, 어트리뷰트 그룹 등을 트리 구조로 파싱한다. 파싱 단계에서 스키마 간의 import·include 관계를 해석해 전체 스키마 네트워크를 구성하고, 네임스페이스 충돌을 해결한다. 의미 추출 엔진은 타입 계층(확장·제한), 요소-어트리뷰트 연관, 제약(패턴·범위) 등을 분석해 개념(클래스)과 속성(프로퍼티)으로 매핑한다. 특히, 복합 타입의 상속 구조는 온톨로지의 서브클래스 관계로 변환되며, 단순 타입의 제한은 데이터형 및 값 범위 제약으로 표현된다. Janus는 의미적 중복을 탐지하기 위해 레이블 정규화와 문자열 유사도(레벤슈타인 거리·코사인) 기반 클러스터링을 수행한다. 이를 통해 서로 다른 스키마에 정의된 동일 개념을 하나의 온톨로지 엔티티로 통합한다. 온톨로지 생성 후, RDF/OWL 형태로 직렬화하고, SPARQL 엔드포인트를 제공해 외부 애플리케이션이 질의할 수 있게 한다. B2B 통합을 위한 뷰 레이어는 (1) 개념 트리 뷰, (2) 매핑 매트릭스 뷰, (3) 데이터 흐름 시각화 뷰 등으로 구성되어, 개발자가 스키마 간 매핑 관계와 데이터 교환 구조를 직관적으로 파악하도록 돕는다. 시스템은 모듈식 설계로 새로운 스키마 유형(예: XSD 1.1)이나 추가 의미 추출 규칙을 플러그인 형태로 확장할 수 있다. 실험에서는 공개된 B2B 표준 스키마(예: UBL, ebXML) 30여 개를 대상으로 자동 온톨로지 구축 정확도와 매핑 품질을 평가했으며, 인간 전문가가 만든 레퍼런스 온톨로지와 비교해 85 % 이상의 일치율을 달성했다. 이러한 결과는 Janus가 대규모 스키마 레포지토리에서 인간 작업을 크게 감소시키고, 온톨로지 기반 서비스(검색·매칭·합성) 구축에 실용적인 기반을 제공함을 시사한다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...