평문 복원기 영역이 접두사 자유 복원기 영역을 포함하지 않는다
초록
이 논문은 최적의 평문(plain) 압축 해제기와 최적의 접두사 자유(prefix‑free) 압축 해제기 사이의 영역 포함 관계에 대한 오픈 질문에 부정적인 답을 제시한다. 저자들은 계산 가능하게 열거 가능한 집합 A를 구성해, A 위에 정의된 최적 평문 복원기의 정의역은 어떠한 최적 접두사 자유 복원기의 정의역도 완전히 포함하지 못함을 증명한다.
상세 분석
Kolmogorov 복잡도 이론에서 두 가지 주요 모델이 있다. 하나는 “평문”(plain) 프로그램을 허용하는 모델로, 프로그램 길이 l(p)만을 고려하고, 다른 하나는 “접두사 자유”(prefix‑free) 모델로, 프로그램 집합이 Kraft 불등식 ∑2^{‑|p|} ≤ 1을 만족하도록 강제한다. 각각에 대해 최적 압축 해제기(디코더) U와 V를 잡을 수 있으며, 그 정의역(dom U, dom V)은 각각 평문 문자열과 접두사 자유 문자열의 집합이 된다. 기존 연구에서는 두 복원기의 복잡도 함수 K와 C가 상수 차이 이내로 동일함을 보였지만, 정의역 자체의 구조적 관계는 아직 명확하지 않았다. Calude·Nies·Staiger·Stephan은 “모든 최적 평문 복원기의 정의역이 어떤 최적 접두사 자유 복원기의 정의역을 포함한다”는 가설을 제시했으며, 이는 직관적으로는 접두사 자유 조건이 더 강하므로 평문 복원기의 정의역이 더 넓을 것이라는 기대와 일치한다.
저자들은 이 가설을 반증하기 위해, 먼저 계산 가능하게 열거 가능한 집합 A⊂2^{<ω}를 만든다. A는 다음 두 성질을 만족한다. (1) A는 무한히 많은 문자열을 포함하고, 각 길이 n에 대해 적어도 1/3·2^{n}개의 n‑길이 문자열이 A에 속한다. (2) 어떤 총합 ≤1인 가중치 함수 q가 존재하여, q(x) = ∑_{p∈dom V, U(p)=x}2^{‑|p|} 로 정의될 때, q는 A 위에서 무한히 많은 x에 대해 0이 된다. 즉, A 안에는 V가 거의 할당하지 못하는 “빈” 영역이 무수히 존재한다.
그 다음, 평문 복원기 U를 A 위에만 정의하도록 제한한다. 구체적으로, U는 입력 p를 읽고, p가 A에 속하면 해당 문자열을 출력하고, 그렇지 않으면 정의되지 않는다. 이렇게 하면 U는 최적 평문 복원기가 된다(왜냐하면 A가 충분히 풍부해 모든 문자열을 짧은 프로그램으로 코딩할 수 있기 때문이다). 그러나 위의 성질(2) 때문에, 어떤 최적 접두사 자유 복원기 V를 잡아도, V의 정의역이 A 전체를 커버하지 못한다. 즉, V가 정의되는 모든 x에 대해 q(x)>0이지만, A 안에는 q(x)=0인 무한히 많은 x가 존재한다. 따라서 dom U ⊄ dom V 가 된다.
핵심 아이디어는 Kraft 불등식을 이용해 접두사 자유 프로그램들의 “측정”을 제한하고, A를 설계해 그 측정이 0이 되는 지점을 만들며, 이를 통해 두 복원기 사이에 포함 관계가 깨진다는 점이다. 이 구성은 효과적으로 “희소하지만 충분히 큰” 집합을 이용해 접두사 자유 모델의 제한성을 드러낸다. 결과적으로, 평문 복원기의 정의역이 항상 어떤 접두사 자유 복원기의 정의역을 포함한다는 일반적인 명제는 거짓임을 보였다.
댓글 및 학술 토론
Loading comments...
의견 남기기