생물학적 데이터 접근을 위한 온톨로지 기반 AberOWL 프레임워크
초록
**
AberOWL는 생물학 분야의 다양한 OWL 온톨로지를 저장·관리하고, ELK와 같은 자동 추론기를 이용해 클래스 계층을 실시간으로 계산한다. 웹 서비스와 인터페이스를 통해 온톨로지 기반 질의(Mannchester OWL Syntax)를 수행하고, 그 결과를 PubMed 텍스트 검색이나 SPARQL 엔드포인트에 직접 연계한다.
**
상세 분석
**
본 논문은 생물학·의학 데이터에 대한 온톨로지 기반 접근(ontology‑based data access, OBDA) 패러다임을 구현한 AberOWL 인프라스트럭처를 상세히 제시한다. 핵심 구성요소는(1) OBO·OWL 형식의 온톨로지를 자동으로 수집·저장하는 리포지터리, (2) OWL API와 ELK 추론기를 활용해 각 온톨로지를 EL 프로파일에 맞게 분류하고, 서브·슈퍼·동등 클래스 관계를 실시간으로 계산하는 백엔드, (3) Manchester OWL Syntax 질의를 OWL 클래스 표현으로 변환하고, 추론 결과를 JSON 형태로 반환하는 웹 서비스, (4) 라벨 검색을 위한 트라이 자료구조와 Lucene 기반 텍스트 인덱스를 결합한 PubMed 검색 모듈, (5) SPARQL 쿼리 확장을 지원하는 OWL‑SPARQL 브리지이다. 특히 트라이를 이용한 라벨 자동완성과 ELK의 다항식 시간 추론은 대규모 바이오 온톨로지(수천 개 클래스)에서도 높은 응답성을 보장한다. 서비스는 온톨로지 URI가 지정되지 않으면 리포지터리 전체에 질의를 전파하고, 외부 URI가 주어지면 실시간으로 다운로드·분류 후 결과를 제공한다. SPARQL 확장은 VALUES와 FILTER 구문에 OWL 질의 결과를 삽입하도록 설계돼, 다양한 Linked Data 엔드포인트(GO, UniProt 등)와의 URI 매핑 문제도 프리픽스 변환 기능으로 해결한다. 전체 시스템은 오픈소스로 제공되며, 사용자는 자체 서버에 HermiT·Pellet 등 다른 추론기를 플러그인할 수 있다. 이러한 설계는 온톨로지 메타데이터와 추론 결과를 데이터베이스·문헌·링크드 데이터에 일관되게 연결함으로써, 기존의 메타데이터 검색을 넘어 의미론적 통합 검색을 가능하게 한다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기