정규 제약을 가진 항들의 인스턴스 집합 정규성 결정은 EXPTIME‑완전
초록
이 논문은 변수마다 정규 트리 자동화로 제한된 유한한 항 집합의 인스턴스 전체가 정규 언어인지 여부를 결정하는 문제를 다룬다. 기존에 결정 가능성만 알려졌던 이 문제의 정확한 복잡도는 EXPTIME‑완전임을 보이며, 새로운 지수시간 알고리즘을 제시한다. 알고리즘은 항과 자동화를 여러 차례 지수적으로 변환하고, 부등식·높이 술어를 이용한 논리식의 만족성을 검사한다.
상세 분석
본 연구는 “정규 제약을 가진 항들의 인스턴스 집합”(regular constraints on term instances)이라는 문제를 정식화하고, 그 정규성 판단의 복잡도 경계를 정확히 규명한다. 문제는 다음과 같이 정의된다. 유한 집합 T = {t₁,…,tₙ} 의 각 항 tᵢ 는 변수 x 을 포함할 수 있으며, 각 변수 x 에 대해 정규 트리 자동화 Aₓ 가 주어진다. 변수 x 는 Aₓ 가 인식하는 트리 집합에만 치환될 수 있다. 이렇게 치환된 모든 구체 트리들의 집합을 Inst(T, A) 라 하면, 이 집합이 어떤 유한 상태 트리 자동화에 의해 인식되는가, 즉 정규 언어인지 여부를 묻는 것이 핵심 질문이다.
이전 연구에서는 이 문제가 decidable임만 알려졌으며, 복잡도 상한은 미정이었다. 저자들은 먼저 문제를 “부등식·높이 술어”(inequality and height predicates) 위에 서술된 논리식으로 변환한다. 구체적으로, 각 변수에 대한 정규 제약을 자동화 Aₓ 의 상태 집합과 전이 관계로 표현하고, 변수 치환 사이의 동형성·비동형성 조건을 부등식 술어로, 치환된 트리의 깊이 제한을 높이 술어로 모델링한다.
그 다음, 이러한 술어 논리를 exponential blow‑up 없이 다루기 위해 두 단계의 변환을 수행한다. 첫 번째 변환은 모든 변수와 그 정규 제약을 하나의 “합성 자동화” A 로 결합하는 과정으로, 변수마다 별도 자동화를 유지하면 상태 수가 곱셈적으로 증가하므로, 상태 집합을 교차(product) 형태로 묶어 전체 상태 수를 |Q|^{O(|V|)} (여기서 |V| 는 변수 수) 로 만든다. 두 번째 변환은 부등식 술어를 차등 자동화(differential automaton) 로 전이시켜, 두 트리 사이의 구조적 차이를 자동화 상태에 직접 인코딩한다. 이 과정에서 각 부등식은 “동일한 서브트리인지 여부”를 판단하는 전이 규칙으로 바뀌며, 이는 기존 트리 자동화의 전이 함수를 확장하는 형태이다.
높이 술어는 자동화에 높이 카운터를 부가함으로써 구현한다. 카운터는 최대 h (문제 입력에 따라 지수적으로 큰 값)까지 증가할 수 있으며, 자동화는 카운터가 허용된 범위를 초과하면 즉시 거부 상태로 전이한다. 이렇게 하면 높이 제한을 만족하는 인스턴스만을 받아들인다.
전체 변환 과정을 마친 뒤, 저자들은 SAT‑like 절차를 적용한다. 변환된 논리식은 부울 변수와 정수 변수(높이 카운터)로 이루어진 제약식이며, 이는 지수 시간 안에 SMT(Satisfiability Modulo Theories) 엔진을 이용해 만족 여부를 검사할 수 있다. 만족한다면, 해당 만족 모델이 바로 정규 자동화 B (인스턴스 집합을 인식하는 자동화) 를 구성하는 방법을 제공한다. 만족하지 않으면, Inst(T, A) 는 정규가 아니다는 결론을 얻는다.
복잡도 측면에서, 변환 단계마다 상태 수와 술어 수가 입력 크기의 지수 배로 늘어나지만, 전체 알고리즘은 O(2^{p(n)}) 형태의 시간 복잡도를 갖는다(여기서 p 는 다항식). 따라서 EXPTIME에 속한다. 하드니스는 alternating Turing machine(ATM) 의 지수 시간 실행을 트리 자동화 정규성 문제로 인코딩함으로써 증명한다. 구체적으로, ATM의 구성 그래프를 변수와 정규 제약으로 모델링하고, 정규성 여부가 ATM이 수용하는지와 동치임을 보인다. 이 reduction은 다항식 시간 내에 수행되며, 따라서 문제는 EXPTIME‑hard이다.
결과적으로, 논문은 “정규 제약을 가진 항들의 인스턴스 집합 정규성 판단” 문제가 EXPTIME‑complete임을 최초로 확립하고, 실용적인 지수시간 알고리즘을 제공함으로써 이론적·실무적 연구에 중요한 기반을 마련한다.