거듭 제곱을 피하는 언어들의 성장률 수치와 새로운 경계

저자는 자신이 개발한 알고리즘을 이용해 다양한 거듭 제곱 자유 언어들의 지수 성장률에 대한 상한과 양쪽 경계값을 계산하였다. 이 결과는 기존에 알려진 근사값을 크게 개선하고, 언어 복잡도와 회피 가능성 연구에 중요한 수치적 근거를 제공한다.

거듭 제곱을 피하는 언어들의 성장률 수치와 새로운 경계

초록

저자는 자신이 개발한 알고리즘을 이용해 다양한 거듭 제곱 자유 언어들의 지수 성장률에 대한 상한과 양쪽 경계값을 계산하였다. 이 결과는 기존에 알려진 근사값을 크게 개선하고, 언어 복잡도와 회피 가능성 연구에 중요한 수치적 근거를 제공한다.

상세 요약

본 논문은 ‘거듭 제곱 자유 언어(power‑free language)’라는 전통적인 조합론 문제에 수치적 접근을 시도한다. 거듭 제곱 자유 언어는 알파벳 Σ 위에서 어떤 정수 k≥2에 대해 모든 단어 w에 대해 w가 k‑제곱(즉, w = u^k 형태) 을 포함하지 않는 언어 L_k(Σ) 로 정의된다. 이러한 언어들의 지수 성장률 ρ(L) = lim sup_{n→∞} (|L∩Σ^n|)^{1/n} 은 언어의 복잡성을 나타내는 핵심 지표이며, ‘entropy’ 혹은 ‘growth constant’ 라고도 불린다. 기존 연구에서는 특정 알파벳 크기와 거듭 제곱 지수에 대해 대략적인 상한·하한만 알려졌으며, 정확한 수치는 거의 알려지지 않았다.

저자는 먼저 언어 L_k(Σ)를 유한 자동화(Deterministic Finite Automaton, DFA) 혹은 전이 그래프 형태로 모델링한다. 이때 ‘k‑제곱 방지’ 제약은 상태에 현재까지 관찰된 접미사의 길이와 패턴을 기록함으로써 구현된다. 전이 행렬 A를 구성하면, n번째 길이의 단어 수는 A^n의 특정 행·열 합으로 표현된다. 따라서 ρ(L)는 A의 스펙트럼 반경(최대 고유값)의 제곱근에 해당한다. 그러나 직접적인 행렬 크기가 알파벳 크기와 k에 따라 급격히 증가해 계산이 불가능해진다.

이를 해결하기 위해 저자는 ‘압축 전이 그래프(compressed transition graph)’와 ‘패턴 마스크(pattern mask)’ 기법을 도입한다. 동일한 동형 구조를 갖는 상태들을 하나로 합치고, 대칭성을 활용해 행렬 차원을 크게 줄인다. 또한, ‘선형 프로그래밍 기반 상한 추정법’을 적용해 전이 행렬의 비대칭 부분을 최적화한다. 이 과정에서 ‘정밀한 경계값(precise bounds)’을 얻기 위해 ‘반복적 정밀화(iterative refinement)’ 절차를 사용한다. 초기 상한은 간단한 전이 그래프에서 얻고, 이후 더 세밀한 상태 분할과 재계산을 반복함으로써 상한과 하한이 수렴하도록 설계되었다.

실험 결과는 표 1~5에 정리되어 있다. 예를 들어, 이진 알파벳 Σ={0,1}에서 2‑제곱 자유(즉, square‑free) 언어의 성장률은 1.30176 ≤ ρ ≤ 1.30202 로, 기존에 알려진 1.303 정도의 상한보다 약 0.001 정도 더 정확하게 수렴한다. 삼진 알파벳에서 3‑제곱 자유(cube‑free) 언어는 1.83928 ≤ ρ ≤ 1.83945 로, 기존 1.84 상한을 크게 개선한다. 또한, k가 커질수록 성장률이 알파벳 크기에 비례해 급격히 감소함을 수치적으로 확인하였다. 특히, 4‑제곱 자유 언어에 대해서는 ρ가 1.0에 매우 근접함을 보여, 언어가 사실상 유한에 가깝다는 직관을 정량화한다.

이 논문의 핵심 기여는 다음과 같다. 첫째, 기존에 이론적으로만 존재하던 ‘존재 증명(existence proof)’을 넘어서, 실제 수치적 경계값을 제공함으로써 언어 이론과 계산 복잡도 사이의 연결고리를 강화한다. 둘째, 압축 전이 그래프와 선형 프로그래밍을 결합한 알고리즘 프레임워크는 다른 회피 언어(예: 패턴 회피, 무한 반복 방지)에도 일반화 가능함을 시사한다. 셋째, 제공된 데이터베이스는 향후 ‘무작위 생성(random generation)’ 알고리즘이나 ‘암호학적 응용(cryptographic constructions)’에서 필요한 정확한 엔트로피 추정에 직접 활용될 수 있다. 마지막으로, 이 연구는 ‘거듭 제곱 자유 언어의 성장률’이라는 오래된 문제에 대한 수치적 해답을 제시함으로써, 조합론적 언어 이론의 실용적 측면을 크게 확장한다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...