일상 언어와 상식 온톨로지를 결합한 의미론

이 논문은 순수 통계·기계학습 접근만으로는 자연어의 복합 의미를 충분히 설명할 수 없다고 주장한다. 저자는 인간의 상식적 세계관을 반영한 강타입 온톨로지를 논리 의미론에 도입하고, ‘두드러지는 속성·관계’를 형식화함으로써 은유, 전위, 공동술어, 복합명사 등 다양한 언어 현상을 통일적으로 처리할 수 있음을 보인다.

저자: ** - **Walid S. Saba** – American Institutes for Research, Washington, DC

일상 언어와 상식 온톨로지를 결합한 의미론
이 논문은 자연어 처리(NLP) 분야에서 지난 20년간 통계·머신러닝 기반 방법이 주류를 차지해 온 현상을 비판적으로 검토한다. 저자는 순수 양적 접근이 어휘·구문 수준의 성능 향상에는 기여했지만, 의미론적 구성성, 추론, 그리고 일상 언어에서 나타나는 복합 현상—예를 들어 은유, 전위, 공동술어, 복합명사 등—을 포괄적으로 설명하기엔 부족하다고 주장한다. 이를 뒷받침하기 위해 (1) ‘Pass that car will you.’와 같은 문장에서 화자가 암시적으로 ‘그 차를 운전하는 사람’과 ‘그 차에 타고 있는 사람’이라는 두 다른 의미를 추론하는 과정을 제시한다. 이러한 추론은 명시적인 학습 데이터 없이도 인간이 상식적 세계관을 활용해 수행한다는 점에서, 순수 통계 모델이 재현하기 어렵다. 논문은 이러한 한계를 극복하기 위한 대안으로 ‘강타입 온톨로지’를 제시한다. Sommers(1963)의 타입 이론을 확장해, 객체가 속한 타입은 그 객체에 대해 의미 있게 적용 가능한 단일 술어 집합이 비어 있지 않은 경우에 정의된다. 타입 간 포함 관계는 한 타입의 술어 집합이 다른 타입의 술어 집합을 포함함으로써 결정된다. 이를 통해 ‘old cat’과 ‘black cat’은 모두 ‘Cat’이라는 동일 타입에 속한다는 점을 형식화한다. 다음으로 저자는 ‘두드러지는 속성(salient property)’과 ‘두드러지는 관계(salient relation)’라는 개념을 도입한다. 예시 (2)에서 ‘Simon is a rock’은 ‘Simon is solid’로, ‘The ham sandwich wants a beer’는 ‘The person eating the sandwich wants a beer’로 해석된다. 여기서 ‘solid’, ‘eat’, ‘want’ 등은 해당 명사와 가장 흔히 연관되는 속성·관계로 간주된다. 이러한 두드러지는 요소를 명시적으로 모델링하면, 문장에 내재된 ‘누락된 텍스트’를 복원할 수 있다. 핵심 연산인 ‘타입 통합(type unification)’은 변수에 여러 타입이 동시에 할당될 때 작동한다. 두 타입 사이에 서브타입 관계가 존재하면 상위 타입으로 축소하고, 그렇지 않을 경우 두 타입을 연결하는 두드러지는 관계를 도입한다. 예를 들어 ‘Sheba is a teacher’에서 ‘Sheba’는 ‘Human’이라는 온톨로지 타입을 갖고, ‘Teacher’는 ‘Human’ 위에 정의된 논리 개념이다. 타입 통합 과정을 거치면 ‘Sheba는 인간이며, 교육 활동의 에이전트이다’라는 두 단계 의미 구조가 도출된다. 논문은 또한 ‘proper noun’(고유명사)의 형식화 방식을 제시한다. 고유명사는 어떤 타입에도 속할 수 있는 개체로, 존재를 보장하는 존재론적 전제와 함께 해당 타입에 대한 술어 적용 가능성을 명시한다. 이를 통해 ‘Sheba is a teacher’와 같은 문장을 형식 논리식으로 변환하고, 필요한 경우 타입 통합을 적용해 의미를 정교화한다. 마지막으로 저자는 이러한 온톨로지 기반 의미론이 기존 통계·머신러닝 접근과 결합될 때 기대되는 시너지 효과를 논한다. 대규모 코퍼스로부터 학습된 통계적 패턴은 얕은 수준의 의미 추론에 유용하지만, 상식 온톨로지는 깊은 의미 구조와 추론 규칙을 제공한다. 두 접근을 통합하면, 데이터 부족 상황에서도 인간과 유사한 의미 해석을 구현하고, 복합 현상에 대한 일관된 이론적 설명을 제공할 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기