DDI 3 데이터 문서화를 위한 온톨로지 설계

DDI 3 데이터 문서화를 위한 온톨로지 설계

초록

본 논문은 DDI 3 데이터 모델을 RDF 기반 온톨로지로 변환하기 위한 설계 과정을 제시한다. 최신 온톨로지 엔지니어링 방법론을 적용해 메타데이터와 통계 데이터를 표준 웹 교환 형식인 RDF로 표현하고, 이를 통해 DDI 커뮤니티가 Linked Open Data(LOD) 클라우드에 참여할 수 있는 기반을 마련한다.

상세 분석

논문은 먼저 DDI 3의 구조적 특성을 상세히 분석하고, 기존 온톨로지 설계 프레임워크(예: METHONTOLOGY, Ontology 101)를 비교한다. 그 결과, DDI의 복합적인 설문, 변수, 코드북, 데이터 파일 등 다중 계층 구조를 정확히 포착하려면 클래스 계층화와 속성 매핑을 동시에 고려해야 함을 확인한다. 설계 단계에서는 요구사항 정의, 개념 추출, 계층화, 관계 정의, 제약조건 명시, 검증 순으로 진행되며, 특히 RDF/OWL의 표현력을 활용해 DDI의 복합키와 버전 관리 메커니즘을 온톨로지 수준에서 모델링한다. 매핑 과정에서는 DDI XML 스키마와 RDF 트리플 간의 1:1, 1:다 매핑 규칙을 정의하고, XSLT와 SPARQL CONSTRUCT를 이용한 자동 변환 파이프라인을 구축한다. 검증 단계에서는 SHACL와 OWL DL 규칙을 적용해 논리적 일관성을 검사하고, 실제 DDI 데이터셋을 대상으로 변환 정확도와 성능을 평가한다. 결과적으로, 설계된 온톨로지는 기존 DDI 툴과의 호환성을 유지하면서도, SPARQL 엔드포인트를 통한 질의, 링크드 데이터 연결, 그리고 시맨틱 웹 애플리케이션 개발을 가능하게 한다. 또한, LOD 클라우드에 공개된 DDI 온톨로지는 사회과학 연구 데이터의 재사용과 메타데이터 상호운용성을 크게 향상시킬 것으로 기대된다.