제어된 발트어 언어로 온톨로지 서술하기

제어된 발트어 언어로 온톨로지 서술하기

초록

본 논문은 시도된 Attempto Controlled English(ACE)를 기반으로 라트비아어와 리투아니아어에 적용 가능한 제어된 자연어(CNL)를 설계·구현하고, 이를 OWL 온톨로지 작성에 활용하는 방법을 사례와 함께 제시한다.

상세 분석

제어된 자연어(CNL)는 인간이 이해하기 쉬운 문장을 사용하면서도 기계가 정확히 해석할 수 있도록 엄격한 문법과 어휘 제약을 두는 기술이다. 현재까지 대부분의 연구는 영어 기반 ACE에 집중했으며, 비영어권 언어에 대한 적용은 제한적이었다. 이 논문은 라트비아어를 대상으로 ACE와 동등한 제어 수준을 달성하기 위해 언어학적 특성을 면밀히 분석하고, 문법 규칙을 재정의하였다. 라트비아어는 풍부한 굴절 형태와 자유 어순을 갖고 있어, ACE의 고정된 주어‑동사‑목적어(SVO) 구조를 그대로 적용하기 어렵다. 저자들은 이를 해결하기 위해 명사·동사의 격 변화를 명시적으로 표시하고, 한정사와 관계절을 전치사적 구조로 변환하는 규칙을 도입하였다. 예를 들어, “Every person who owns a car drives it”와 같은 문장을 라트비아어 CNL에서는 “Katrs cilvēks, kurš īpašumā ir automašīna, to vadīs”와 같이 명시적 격 표시와 관계절 삽입을 통해 표현한다. 이러한 변환 규칙은 자동으로 OWL 트리플로 매핑될 수 있도록 설계되었으며, 클래스, 속성, 개체, 서브클래스 관계 등을 정확히 표현한다. 또한, 라트비아어와 병행으로 설계 중인 리투아니아어 CNL과의 상호 운용성을 고려해 어휘와 문법 템플릿을 공유 가능한 형태로 모듈화하였다. 실험에서는 전문가와 비전문가 두 그룹에게 CNL 문장을 제시하고, OWL 변환 정확도와 이해도 설문을 진행했으며, 평균 92% 이상의 정확도와 85% 이상의 이해도를 기록했다. 이는 제어된 라트비아어가 실제 온톨로지 작성에 충분히 활용 가능함을 입증한다. 논문은 또한 언어별 특수성을 반영한 CNL 설계 시 고려해야 할 점—예를 들어, 격표시의 일관성, 복합명사의 처리, 부정문과 양화사의 표현—을 정리하고, 향후 다중언어 CNL 프레임워크 구축을 위한 로드맵을 제시한다.