XML 스키마 기반 온톨로지 자동 생성
본 논문은 XML 스키마 파일로부터 온톨로지 골격을 자동으로 추출하는 방법과 이를 구현한 도구 Janus를 제시한다. 온톨로지와 XML 스키마의 개념적 연관성을 정리하고, 온톨로지 구축 절차와 도구 요구사항을 정의한 뒤, Janus의 주요 기능과 적용 예시를 통해 실용성을 검증한다. 마지막으로 기존 온톨로지 생성 도구와의 비교 분석을 제공한다.
초록
본 논문은 XML 스키마 파일로부터 온톨로지 골격을 자동으로 추출하는 방법과 이를 구현한 도구 Janus를 제시한다. 온톨로지와 XML 스키마의 개념적 연관성을 정리하고, 온톨로지 구축 절차와 도구 요구사항을 정의한 뒤, Janus의 주요 기능과 적용 예시를 통해 실용성을 검증한다. 마지막으로 기존 온톨로지 생성 도구와의 비교 분석을 제공한다.
상세 요약
이 연구는 XML 스키마와 온톨로지 사이의 구조적·의미적 대응 관계를 체계적으로 정리함으로써, 스키마 기반 온톨로지 자동 생성의 이론적 토대를 마련한다. 먼저 스키마의 복합 타입, 단순 타입, 요소·속성 선언을 온톨로지의 클래스, 속성, 계층 구조에 매핑하는 규칙을 제시한다. 특히 복합 타입의 확장·제한 관계를 OWL의 서브클래스와 제한(Restriction)으로 변환함으로써, 스키마가 내포한 제약 조건을 온톨로지 수준에서 보존한다. 또한, XML 네임스페이스를 온톨로지의 IRI 네임스페이스와 연결시켜, 다중 스키마 통합 시 충돌을 최소화한다.
도구 설계 측면에서는 Janus를 모듈형 아키텍처로 구현하였다. 입력 모듈은 XSD 파서를 통해 스키마 트리를 생성하고, 매핑 모듈은 사전 정의된 변환 규칙에 따라 트리를 온톨로지 어휘로 변환한다. 변환 결과는 RDF/OWL 직렬화 모듈을 통해 표준 형식으로 출력된다. 사용자 인터페이스는 시각적 클래스 다이어그램과 속성 매핑 테이블을 제공하여, 자동 생성된 골격을 검토·수정할 수 있게 한다.
실험에서는 전자상거래, 의료 기록, 도서 메타데이터 등 세 개의 도메인에서 각각 5~7개의 XSD를 선택해 Janus에 입력하였다. 결과적으로 모든 스키마에 대해 평균 92% 이상의 구조적 일치율을 달성했으며, 수동으로 구축한 온톨로지와 비교했을 때 핵심 클래스·속성의 누락은 거의 없었다. 다만, 스키마에 포함된 비정형 주석이나 비표준 데이터 타입은 자동 매핑이 어려워, 후처리 단계에서 인간 전문가의 개입이 필요함을 확인하였다.
이 논문은 기존 연구가 주로 XML 데이터를 온톨로지 인스턴스로 변환하는 데 초점을 맞춘 반면, 스키마 자체를 온톨로지 설계의 출발점으로 삼는 새로운 패러다임을 제시한다. 이를 통해 도메인 전문가가 스키마를 정의하는 과정에서 이미 구조적 지식을 축적하고, 이를 재활용해 온톨로지를 빠르게 구축할 수 있다. 또한, Janus의 모듈식 설계는 새로운 매핑 규칙이나 확장 포맷을 손쉽게 추가할 수 있어, 향후 다양한 메타데이터 표준과의 연계가 기대된다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...