가능성 이론 기반 적합성 피드백과 의미망을 이용한 목표 추출

초록

본 논문은 의미망에서 목표와 객체를 추출하고, 사용자가 직접 확인한 적합성을 피드백으로 활용하는 가능성 이론 기반 적합성 피드백 기법을 제안한다. 기존 확률 기반 방법보다 오류에 강인하며, 초보 사용자의 질의 처리 효율을 크게 향상시킨다.

상세 분석

이 연구는 지식 추출 시스템(Knowledge Extraction System, KES)의 핵심 문제인 불확실성과 모호성을 다루기 위해 퍼지 이론과 의미망(Semantic Network) 접근법을 통합한다. 의미망은 객체와 목표 사이의 관계를 그래프 형태로 표현함으로써, 사용자가 제시한 질의가 직접적인 키워드 매칭을 넘어 연관된 개념까지 탐색할 수 있게 한다. 그러나 초보 사용자는 자연어 질의를 입력할 때 목표 인식 오류가 빈번히 발생한다. 이러한 오류는 전통적인 확률 기반 적합성 피드백(Pertinence Feedback)에서 크게 누적되어 시스템 성능을 저하시킨다.

논문은 이를 해결하기 위해 가능성 이론(possibility theory)을 도입한다. 가능성 이론은 사건이 발생할 가능성의 상한과 하한을 별도로 정의함으로써, 불확실성을 보다 유연하게 모델링한다. 구체적으로, 시스템은 초기 질의에 의해 추출된 목표와 객체에 대해 사용자가 ‘적합함’ 혹은 ‘비적합함’으로 표시한 정보를 가능도(distribution)와 필요도(necessity)로 변환한다. 이 변환 과정에서 퍼지 집합을 활용해 각 목표에 대한 가능도 함수를 구축하고, 피드백이 누적될수록 해당 목표의 필요도가 상승한다.

가능성 기반 피드백은 두 가지 주요 장점을 제공한다. 첫째, 오류가 포함된 초기 질의라도 가능도 함수가 넓은 구간을 차지하므로, 잘못된 판단이 전체 시스템에 미치는 영향을 제한한다. 둘째, 피드백이 진행될수록 필요도는 점진적으로 수렴하여, 최종적으로 높은 확신을 가진 목표만을 선택하게 된다. 실험에서는 동일한 데이터셋과 질의 환경에서 확률 기반 피드백과 비교했을 때, 평균 정밀도와 재현율이 각각 약 12%와 9% 향상되었으며, 특히 오류율이 30% 이상인 경우 가능성 기반 방법이 확률 기반보다 두 배 이상 높은 안정성을 보였다.

또한, 논문은 가능성 피드백과 확률 피드백을 혼합한 하이브리드 모델도 탐색한다. 초기 단계에서는 가능성 이론을 적용해 넓은 탐색 범위를 확보하고, 피드백이 충분히 축적된 후에는 확률 모델로 전환해 정밀한 순위를 매긴다. 이 전략은 초기 탐색의 포괄성과 후반 정밀도의 균형을 맞추어, 전체 시스템 효율성을 극대화한다.

결과적으로, 이 연구는 의미망과 가능성 이론을 결합한 적합성 피드백이 초보 사용자의 불완전한 질의를 보정하고, 목표 추출 정확도를 크게 향상시킬 수 있음을 실증한다. 향후 연구에서는 실시간 인터랙션 인터페이스와 대규모 온톨로지를 결합해, 다양한 도메인에 적용 가능한 범용 KES 프레임워크를 구축하는 방향을 제시한다.