가중 유한 상태 변환기의 3방향 합성: 이론·실험 고속화

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 기존 2‑방향 합성 알고리즘의 비효율성을 극복하고, 세 개의 가중 유한 상태 변환기(T₁, T₂, T₃)를 직접 합성하는 3‑way 합성 기법을 제안한다. 완전 해싱을 이용한 전처리와 ‘가로’·‘중심’ 두 가지 탐색 전략을 결합해 최악의 시간 복잡도를 O(|T|_Q·min(d(T₁)d(T₃), d(T₂)) + |T|_E) 로 낮추었으며, ε‑필터링을 위한 새로운 자동화 설계도 제공한다. 실험 결과, 대규모 음성·텍스트 처리 작업에서 기존 방법 대비 수십 배 이상의 속도 향상을 확인하였다.

상세 분석

논문은 가중 유한 상태 변환기(FST)의 합성이 음성 인식, 기계 번역, 문자열 커널 등 다양한 분야에서 핵심 역할을 한다는 점을 출발점으로 삼는다. 전통적인 2‑way 합성은 중간 결과 T₁∘T₂를 만든 뒤 T₃와 다시 합성하는 방식으로, 중간 트랜스듀서가 폭발적으로 커지는 경우 메모리와 시간 비용이 급증한다. 이를 해결하기 위해 저자들은 세 트랜스듀서를 한 번에 합성하는 3‑way 합성 알고리즘을 설계하였다.

핵심 아이디어는 “가로 전략(lateral)”과 “중심 전략(central)”을 상황에 맞게 전환하는 것이다. 가로 전략에서는 T₁의 전이와 T₃의 전이를 각각 순회하면서 T₂에서 일치하는 전이를 해시 테이블을 통해 O(1) 시간에 찾는다. 이때 복잡도는 |T|_Q·d(T₁)·d(T₃)·|T|_E 로 표현된다. 반면 중심 전략은 T₂의 전이를 기준으로 T₁·T₃의 전이 집합을 탐색한다, 복잡도는 |T|_Q·d(T₂)+|T|_E 로 더 효율적일 수 있다. 두 전략을 상태별로 비교해 |E

가중 유한 상태 변환기의 3방향 합성: 이론·실험 고속화

초록

상세 분석

댓글 및 학술 토론

의견 남기기