ASP 기반 CCG 파싱: 계획 문제로의 새로운 접근

본 논문은 조합형 범주문법(CCG) 파싱을 답집합 프로그래밍(ASP)으로 모델링하여, 파싱 과정을 자동 계획 문제로 전환하고 ASP 솔버를 이용해 모든 의미적으로 구별되는 파싱 트리를 생성하는 방법을 제안한다. 구현된 도구 AspCcgTk는 C&C 슈퍼태거와 연동해 광범위한 어휘 범주를 제공하며, 스푸리어스 파싱 억제와 정규화 기법을 포함한다.

저자: Yuliya Lierler (University of Kentucky), Peter Sch"uller (Technische Universit"at Wien)

ASP 기반 CCG 파싱: 계획 문제로의 새로운 접근
논문은 조합형 범주문법(Combinatory Categorial Grammar, CCG)이 자연어 파싱에 널리 사용되는 이유와, 기존 파싱 시스템이 갖는 한계점을 먼저 제시한다. 기존 시스템인 OPENCCG와 TCCG는 차트 기반 알고리즘을 사용하지만, 복잡한 범주와 전용 어휘 사전이 필요하고, 스푸리어스 파싱을 완전히 제거하지 못한다. 반면, C&C 파서는 머신러닝 기반 슈퍼태거와 차트 파서를 결합해 넓은 적용 범위를 제공하지만, 파싱 결과가 단일 최적 트리로 제한된다. 이러한 배경에서 저자들은 CCG 파싱을 선언적 프로그래밍 패러다임인 답집합 프로그래밍(ASP)으로 재구성한다는 새로운 아이디어를 제시한다. 먼저, 파싱을 계획 문제로 모델링한다. 상태는 ‘추상 문장 표현(ASR)’이라 불리는, 각 단어에 범주와 고유 식별자를 부여한 시퀀스로 정의된다. 행동은 ‘주석이 달린 조합자 인스턴스’이며, 이는 전제 시퀀스와 결과 범주를 명시한다. 예를 들어, 전제

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기