다국어 온톨로지 서버를 통한 웹 서비스 자동 탐색
초록
본 논문은 언어가 서로 다른 사용자가 UDDI 레지스트리에서 제공되는 WSDL 기반 웹 서비스를 자동으로 검색·선택할 수 있도록 지원하는 다국어 온톨로지 서버(MOS)를 제안한다. MOS는 언어 감지, 다국어 온톨로지 매핑, 의미 기반 매칭 엔진 등을 결합해 요청자의 질의를 온톨로지 기반 개념으로 변환하고, 해당 개념에 매핑된 다국어 WSDL 메타데이터를 찾아 반환한다. 이를 통해 인간의 수작업을 최소화하고, 이질적인 언어 환경에서도 서비스 재사용성을 높인다.
상세 분석
논문은 웹 서비스 검색이 기존에 UDDI 레지스트리와 WSDL 파일에 의존하면서 발생하는 두 가지 근본적인 문제를 지적한다. 첫째, 레지스트리 검색은 키워드 기반이며, 서비스의 기능적 의미를 충분히 반영하지 못한다. 둘째, 서비스 설명서(WSDL)가 특정 언어(주로 영어)로 작성되어 있기 때문에, 다른 언어를 사용하는 요청자는 의미적 매칭이 어려워진다. 이러한 한계를 극복하기 위해 저자는 ‘다국어 온톨로지 서버(MOS)’라는 중간 계층을 설계한다. MOS는 크게 네 개의 핵심 모듈로 구성된다. ① Language Detector는 사용자의 질의문을 자동으로 감지하고, 해당 언어 코드를 반환한다. ② Multilingual Ontology Repository는 OWL/RDF 기반의 도메인 온톨로지를 여러 언어로 표현한 형태로 저장한다. 여기서는 개념, 속성, 관계를 언어별 라벨과 주석으로 매핑한다. ③ Query Translator는 감지된 언어와 온톨로지 라벨을 이용해 사용자의 자연어 질의를 온톨로지 개념(클래스·프로퍼티)으로 변환한다. ④ Semantic Matcher는 변환된 온톨로지 개념과 레지스트리 내 메타데이터(서비스 이름, 설명, 입력·출력 타입 등)를 의미적으로 비교한다. 매칭 과정에서는 서브클래스·슈퍼클래스 관계, 동의어 사전, 그리고 언어 간 라벨 매핑을 활용해 정확도를 높인다.
특히 저자는 온톨로지 매핑 단계에서 SKOS(Simple Knowledge Organization System)를 이용해 다국어 라벨을 연결하고, OWL DL의 논리적 일관성을 유지함으로써 자동 매칭의 신뢰성을 확보한다. 또한, 서비스 메타데이터를 RDFa 형태로 변환해 온톨로지와 동일한 트리플 스토어에 저장함으로써 SPARQL 기반 질의가 가능하도록 설계하였다. 이로써 사용자는 “날씨 예보 서비스”와 같이 자연어로 질의하면, MOS는 해당 질의를 ‘WeatherForecastService’라는 OWL 클래스에 매핑하고, 언어가 다른 WSDL(예: 프랑스어 ‘ServiceMétéo’)를 찾아 반환한다.
성능 평가에서는 3개 언어(영어, 한국어, 스페인어)로 구성된 테스트 셋을 이용해 기존 키워드 기반 검색과 비교했을 때 정밀도·재현도가 각각 평균 23%·31% 향상되었음을 보고한다. 또한, 질의 변환 및 매칭에 소요되는 평균 응답 시간은 1.8초로, 실시간 서비스 검색에 충분히 적용 가능함을 입증한다.
이러한 설계는 온톨로지의 확장성을 활용해 새로운 도메인(예: 의료, 금융)으로 쉽게 확장할 수 있다는 장점도 갖는다. 다만, 온톨로지 구축 비용과 다국어 라벨링 작업이 초기 진입 장벽으로 작용할 수 있다는 한계점도 언급한다.