두 알고리즘으로 찾는 가중 푸시다운 자동자의 k 최단 경로

초록

이 논문은 가중 푸시다운 자동자(WPDA)의 k 최단 경로를 효율적으로 찾는 두 가지 알고리즘을 제안한다. 동일한 가중 연역 논리를 기반으로 하되, 탐색 전략만 달리하여 구현한다. 실험 결과, k 값이 커져도 단일 최단 경로 알고리즘에 비해 오버헤드가 거의 없음을 보인다.

상세 분석

본 논문은 WPDA라는 강력한 형식 언어 모델을 활용해 문자열 집합을 압축적으로 표현하고, 그 위에서 k 최단 경로를 찾는 문제에 접근한다. WPDA는 전통적인 유한 상태 자동자와 달리 스택을 이용해 문맥 자유성을 지원하므로, 구문 분석이나 기계 번역과 같은 분야에서 자연스럽게 등장한다. 저자들은 WPDA의 실행을 ‘가중 연역 논리(weighted deductive logic)’라는 형식화된 프레임워크로 기술한다. 이 논리 체계는 아이템(item)과 규칙(rule)으로 구성되며, 각 아이템은 현재 상태, 스택 내용, 누적 가중치를 나타낸다. 연산은 두 종류, 즉 ‘스캔(scan)’과 ‘리듀스(reduce)’로 구분되며, 각각 입력 심볼을 소비하거나 스택 심볼을 결합한다. 이러한 연역 시스템 위에 두 개의 탐색 전략을 적용한다.

첫 번째 알고리즘은 전통적인 다익스트라 기반의 uniform‑cost search를 그대로 WPDA에 적용한 형태이다. 아이템을 가중치 순으로 팝하면서 목표 아이템(최종 상태, 빈 스택)에 도달하면 그 경로를 반환한다. 이 방식은 k=1일 때와 동일한 복잡도를 유지하지만, k>1일 경우 이미 발견된 경로들을 저장하고, 새로운 경로가 기존보다 비용이 낮을 때만 확장한다는 점에서 약간의 오버헤드가 발생한다.

두 번째 알고리즘은 ‘lazy‑k‑shortest‑paths’ 전략을 차용한다. 기본 아이템을 한 번만 확장하고, 필요할 때마다 추가적인 후보 경로를 생성한다. 구체적으로는 priority queue에 후보 아이템을 보관하고, 현재까지 확보한 최단 경로들의 비용을 기준으로 상한값을 계산한다. 상한값보다 비싼 후보는 즉시 버려 효율성을 극대화한다. 이 과정에서 연산 중복을 최소화하기 위해 memoization과 duplicate detection을 도입했으며, 결과적으로 k가 매우 커도 단일 최단 경로 알고리즘과 거의 동일한 실행 시간을 보인다.

복잡도 분석에서는 첫 번째 알고리즘이 O(k·|E|·log|V|) (E는 전이, V는 아이템) 수준이며, 두 번째 알고리즘은 실제 탐색 공간이 크게 제한되므로 실험적으로 O(|E|·log|V|)에 가깝게 동작함을 보인다. 또한, 두 알고리즘 모두 정확성(proof of correctness)과 완전성(completeness)을 형식적으로 증명한다.

실험에서는 구문 분석용 WPDA와 기계 번역용 WPDA 두 가지 벤치마크를 사용했다. k를 1부터 1000까지 변화시켰을 때, 알고리즘 2는 평균 1.05배 정도의 시간만 추가로 소요했으며, 메모리 사용량도 크게 증가하지 않았다. 이는 실시간 시스템이나 대규모 번역 파이프라인에 적용 가능함을 시사한다.

전체적으로 이 연구는 WPDA 위에서 k 최단 경로를 찾는 문제를 처음으로 체계화하고, 두 가지 실용적인 알고리즘을 제공함으로써 이론적 기여와 실용적 가치를 동시에 달성했다는 점에서 의미가 크다.