복잡한 시간 질문 처리를 통한 QA 시스템 강화

초록

본 논문은 복합적인 시간 질문을 단순 질문으로 분해하고, 답변을 재조합하는 다계층 구조를 제안한다. 최소한의 언어 자원을 사용해 영어와 스페인어에 적용했으며, 기존 일반 QA 시스템 대비 F‑measure에서 현저히 높은 성능을 보였다.

상세 분석

이 연구는 현재 QA 시스템이 시간적 관계를 정확히 파악하지 못하는 한계를 극복하기 위해, 질문 분해·재구성이라는 두 단계의 전용 레이어를 설계하였다. 질문 분해 단계에서는 자연어 처리 파이프라인을 통해 시간 표현(예: “이전”, “다음”, “1990년 이후”)을 식별하고, 이를 기반으로 논리적 연산자를 삽입해 여러 개의 단순 질문으로 전환한다. 이때 사용된 규칙 기반 모듈은 언어 독립성을 목표로 최소한의 어휘·패턴만을 정의했으며, 어휘 사전과 정규표현식으로 구현돼 새로운 언어에 쉽게 확장할 수 있다. 답변 재구성 단계에서는 각각의 단순 질문에 대해 기존 QA 엔진이 반환한 결과를 수집하고, 시간 제약을 만족하도록 필터링·정렬한다. 예를 들어 “1995년부터 2000년 사이에 미국 대통령은 누구였는가?”라는 질문은 “1995년 미국 대통령은 누구인가?”와 “2000년 미국 대통령은 누구인가?” 두 개의 질문으로 나뉘고, 두 답을 교차 검증해 동일 인물인지 확인한다.

성능 평가에서는 두 가지 비교군을 설정했다. 첫 번째는 일반 목적 QA 시스템만 사용한 경우, 두 번째는 유명 QA 시스템(예: OpenEphyra)과 비교한 경우이다. 영어 데이터셋에서 제안된 다계층 시스템은 F‑measure 65.47%를 기록했으며, 일반 QA 시스템은 38.01%에 그쳤다. 스페인어에서도 동일한 구조를 적용했을 때 40.36% vs. 22.94%의 차이를 보였다. 이러한 결과는 질문 분해가 복합 시간 질문의 의미를 보존하면서도 답변 검색 범위를 크게 축소시켜 정확도를 높인다는 것을 입증한다. 또한, 최소 자원 기반 설계 덕분에 언어 확장 비용이 낮아 실제 다국어 서비스에 적용하기 용이하다는 점도 강조된다.

이 논문의 주요 기여는 (1) 복합 시간 질문을 구조적으로 분해하는 방법론, (2) 언어 독립적인 최소 자원 설계, (3) 다계층 아키텍처가 기존 QA 시스템에 쉽게 통합될 수 있음을 실험적으로 증명한 점이다. 향후 연구에서는 더 복잡한 시간 논리(예: 겹치는 기간, 순환 이벤트)와 이벤트 간 인과 관계까지 포괄하는 확장이 기대된다.