허프만 코드와 컴팩트 트리의 개수와 단위분수 합
초록
이 논문은 알파벳 크기 t 에 대해 길이 r 인 “동등하지 않은” 허프만 코드(또는 완전 t‑ary 트리)의 개수를 조사한다. 기존 연구들을 통합하고, 새로운 정밀 비대칭식을 제시하여 두 개의 주항과 지수적으로 작은 오차항을 포함한 정확한 점근적 형태를 증명한다.
상세 분석
논문은 먼저 허프만 코드를 수학적으로 모델링하기 위해 네 가지 동등한 정의를 제시한다. 첫 번째는 Kraft‑McMillan 등식의 등호 형태를 이용한 수론적 정의로, 1을 단위분수들의 합으로 표현하는 방법을 셈한다. 두 번째는 “허프만 시퀀스”라는 이름으로, 각 길이 i 에 해당하는 코드워드 수 a_i 를 1/t^i 의 가중치로 보는 형태이다. 세 번째는 t‑ary 루트 트리를 이용한 정의로, 각 레벨 i 에 존재하는 잎의 개수를 a_i라 두고, 트리의 구조가 완전히 균형을 이루도록 한다. 네 번째는 “제한된 차수 시퀀스” 정의로, 내부 정점 수 b_i 를 도입해 b_i ≤ t·b_{i‑1} 이라는 제약을 두고, 전체 잎 수와 내부 정점 수 사이의 관계를 이용한다. 마지막으로 “적절한 단어” 정의는 0과 1로 이루어진 문자열을 특정 규칙에 따라 구분해 위의 시퀀스와 일대일 대응시킨다. 이 네 정의는 모두 동일한 조합론적 객체를 셈한다는 점에서 서로 동등함을 증명한다.
다음으로 저자는 기존 연구(Boyd, Komlós‑Moser‑Nemetz, Flajolet‑Prodinger 등)의 점근적 결과를 정리하고, 특히 f_t(r) = g_t(n) (여기서 r = 1 + n(t‑1))에 대한 기존 상한·하한을 개선한다. 핵심 기여는 두 개의 주항을 포함하는 새로운 비대칭식이다. 구체적으로, \
댓글 및 학술 토론
Loading comments...
의견 남기기