CEVO 포괄적 사건 온톨로지 인지 어노테이션 강화
초록
CEVO는 베스 레빈의 영어 동사 계층을 기반으로 230여 개의 사건 클래스를 정의한 상위 온톨로지이다. 텍스트에서 관계를 추출·정규화하고, 기존 온톨로지 속성과 연결함으로써 관계 어노테이션의 재사용성·통합성을 높인다.
상세 분석
본 논문은 관계 어노테이션에 대한 근본적인 추상화가 부족하다는 문제점을 지적하고, 이를 해결하기 위한 CEVO 온톨로지를 제안한다. 레빈의 동사 분류는 의미적 일관성과 공유 구문 행동이라는 두 축으로 구성되며, 각각의 동사 클래스는 특정 사건 유형을 나타낸다. CEVO는 이러한 레빈의 230개 클래스를 온톨로지 형태로 전환하여, 일반적인 ‘Event’ 슈퍼클래스 아래에 구체적 사건 클래스를 계층화한다. 주요 설계 요구사항은 (1) 텍스트 내 관계 표기의 인식·정규화, (2) 텍스트 관계와 온톨로지 속성 간의 연결, (3) 다양한 도메인 온톨로지 간 정렬·통합, (4) 재사용성 확보, (5) 단순성 유지이다.
CEVO는 세 가지 활용 사례를 통해 그 효용을 검증한다. 첫째, 일반 텍스트에서 동사를 해당 사건 클래스에 매핑함으로써 관계를 추상화된 형태로 어노테이션한다. 둘째, 기존 온톨로지(예: DBpedia, Schema.org)의 속성을 CEVO 클래스에 매핑하여 상위 개념으로 정리한다. 셋째, 텍스트에서 추출된 관계를 CEVO 기반으로 온톨로지 속성과 연결함으로써, 서로 다른 어휘 체계 간의 매핑을 용이하게 만든다. 이러한 과정은 관계 추출 도구가 동사 의미를 단순히 표면 형태로만 인식하는 한계를 넘어, 의미·구문적 특성을 고려한 정교한 매핑을 가능하게 한다.
또한, CEVO는 기존 언어학 온톨로지(OLiA, NIF 등)와 연계될 수 있도록 설계되어, NLP 파이프라인 전반에 걸친 상호운용성을 지원한다. 레빈의 계층 구조가 그래프 형태를 띠는 점을 활용해, 하나의 동사가 다중 클래스에 속할 경우 상황에 맞는 클래스 선택이 가능하도록 한다. 이는 관계의 다의성 및 컨텍스트 의존성을 효과적으로 다루는 메커니즘을 제공한다.
전체적으로 CEVO는 관계 어노테이션을 위한 상위 추상화 레이어를 제공함으로써, 관계 추출·정규화·연결·통합의 네 가지 핵심 과제를 동시에 해결하려는 시도이며, 향후 다양한 도메인 및 언어에 확장 가능한 기반을 마련한다.
댓글 및 학술 토론
Loading comments...
의견 남기기