통합 접근법으로 유추 동의어 반의어 연관성 해결
본 논문은 유추, 동의어, 반의어, 연관성이라는 네 가지 의미 관계를 별개의 과제로 다루던 기존 연구와 달리, 이들을 모두 ‘유사 관계’라는 하나의 프레임워크로 통합한다. 대규모 웹 코퍼스를 이용해 자동 생성된 패턴을 특징으로 하는 지도학습 SVM 모델(PairClass)을 제안하고, SAT 유추 문제, TOEFL 동의어 문제, ESL 동·반의어 문제, 그리고 인지심리학에서 사용된 유사·연관·동시 라벨링 문제에 적용해 경쟁력 있는 정확도를 보인…
저자: ** Peter D. Turney (National Research Council of Canada, Institute for Information Technology) **
논문은 의미 관계를 네 가지 별도 작업(유추, 동의어, 반의어, 연관성)으로 분리해 온 기존 NLP 연구의 한계를 지적한다. 저자는 이들 관계를 모두 ‘유사 관계(analogy)’라는 하나의 프레임워크 아래 통합함으로써, 하나의 지도학습 모델로 모든 작업을 해결하고자 한다. 이를 위해 먼저 ‘유사 관계’를 정의한다. 두 단어 X와 Y가 ‘black:white’와 같은 관계를 가질 때는 반의어, ‘levied:imposed’와 같은 관계를 가질 때는 동의어, ‘doctor:hospital’과 같은 관계를 가질 때는 연관성으로 본다. 이렇게 하면 네 가지 작업을 모두 ‘단어쌍 분류’ 문제로 변환할 수 있다.
알고리즘은 크게 네 단계로 구성된다. 첫째, 입력된 단어쌍에 대해 형태소 분석기와 생성기를 이용해 변형 형태(복수형, 어미 변형 등)를 만든다. 둘째, 대규모 웹 코퍼스(5 × 10¹⁰ 단어, 280 GB)에서 “
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기