일반화된 투 모스 문자열의 임계 지수와 그 실현 위치 분석

초록

본 논문에서는 일반화된 투-모스 단어 t에 대해 그 임계 지수(문자열 내에서 나타날 수 있는 가장 큰 유리 지수)를 정확히 계산하고, 그 최대 지수를 실현하는 멱(power)들의 발생 위치를 완전하게 규명한다.

상세 분석

논문은 먼저 일반화된 투-모스 문자열을 정의한다. 정수 b≥2와 m≥2에 대해 알파벳 Σ_m={0,1,…,m‑1} 위의 동형사상 μ_{b,m}: i↦i(i+1)…(i+b‑1) (mod m)를 두고, 초기 문자 0을 무한히 적용한 고정점 t_{b,m}=μ_{b,m}^∞(0)를 일반화된 투-모스 단어라 칭한다. 기존의 고전 투-모스(t_{2,2})는 b=2, m=2인 경우이며, 이때 문자열은 겹침(overlap)과 세제곱을 회피하는 것으로 알려져 있다.

임계 지수(critical exponent) E(t)는 t에 포함된 모든 유리 지수 r(=|w^r|/|w|) 중 최댓값의 상한을 의미한다. 즉, t가 r‑멱을 포함하면 r≤E(t)이며, E(t)보다 큰 r‑멱은 존재하지 않는다. 이 값을 구하는 것은 문자열의 반복 구조와 회피 성질을 정량화하는 핵심 문제이다.

저자들은 먼저 t_{b,m}의 부분 문자열 구조를 분석한다. μ_{b,m}는 길이 b의 균등 블록을 생성하고, 각 블록은 이전 단계의 블록을 모듈러 m 연산으로 변형한 형태이므로, t_{b,m}는 b진법으로 표현된 정수들의 디지털 합을 m으로 나눈 값의 연속으로도 볼 수 있다. 이 디지털 합 표현을 이용하면, 임의의 위치 n에서 시작하는 길이 ℓ의 구간이 어떤 멱을 형성하는지 여부를 n의 b진법 전개와 ℓ의 b진법 전개 사이의 정규식 매칭 문제로 환원할 수 있다.

핵심 정리는 다음과 같다.

임계 지수는 E(t_{b,m}) = (2b‑1)/b 로 정확히 계산된다. 이는 b≥2, m≥2 모든 경우에 동일하게 적용된다. 특히 고전 투-모스(b=2)에서는 E=3/2가 되며, 이는 알려진 “2‑overlap‑free” 성질과 일치한다.
E(t_{b,m})를 실현하는 최소 멱은 길이 b·m·(b‑1)인 블록 w에 대해 w^{(2b‑1)/b}=w·w·…·(b‑1)·프리픽스 형태로 나타난다. 여기서 w는 μ_{b,m}의 한 번 적용으로 얻은 기본 블록이며, 그 반복 구조는 μ_{b,m}의 자기유사성(self‑similarity)에서 직접 유도된다.
이러한 멱이 나타나는 정확한 위치는 n = k·b^{t} (k∈ℕ, t∈ℕ) 형태의 등비수열을 따른다. 즉, b진법으로 표현했을 때 앞쪽 t자리까지 0으로 채워진 수들이 모두 동일한 멱을 생성한다. 이는 “return word” 개념과 “b‑adic” 구간 분할을 결합한 결과이며, 저자들은 이를 정리하여 “멱 발생 정리”를 제시한다.

증명 전략은 크게 두 단계로 나뉜다. 첫 번째 단계에서는 μ_{b,m}가 생성하는 자동수열(automatic sequence)의 선형 복잡도와 구간별 디지털 합의 주기성을 이용해, 어떤 r> (2b‑1)/b 가 가능하려면 특정 모듈러 방정식을 만족해야 함을 보인다. 그러나 b와 m이 서로소인 경우(대부분의 경우) 이 방정식은 모순을 일으키므로 r는 (2b‑1)/b 이하로 제한된다. 두 번째 단계에서는 실제로 (2b‑1)/b 멱이 존재함을 구성적으로 증명한다. 여기서는 μ_{b,m}의 고정점 구조를 재귀적으로 전개하고, 각 단계에서 발생하는 “핵심 블록”을 명시적으로 기술한다.

또한 저자들은 임계 지수와 관련된 “극한 멱”(limit power) 개념을 도입하여, 무한히 긴 멱이 존재하지 않음에도 불구하고 임계 지수에 수렴하는 유한 멱들의 열이 존재함을 보인다. 이는 기존 연구에서 다루어지지 않았던 미세 구조를 밝혀내는 중요한 기여이다.

결과적으로, 논문은 일반화된 투-모스 단어가 갖는 반복 회피 성질을 정량적으로 완전 규명하고, 임계 지수와 그 실현 위치를 정확히 기술함으로써 자동수열 이론, 조합적 단어 이론, 그리고 수론적 디지털 합 연구 사이의 교차점을 새롭게 확장한다.