저메모리 적응형 접두사 코딩
이 논문은 알파벳 크기가 매우 큰 경우에도 O(σ^{1/λ+ε}) 비트의 메모리만 사용하면서 문자열을 온라인으로 압축한다. 각 심볼을 최악의 경우 O(log log σ) 시간에 인코딩·디코딩하고, 전체 압축 길이는 λ n H(s)+(λ ln 2+2+ε) n+O(σ^{1/λ} log²σ) 비트이다.
저자: Travis Gagie, Marek Karpinski, Yakov Nekrich
본 논문은 알파벳 크기 σ가 매우 큰 경우에도 제한된 메모리로 적응형 접두사 코딩을 수행할 수 있는 새로운 알고리즘을 제안한다. 기존의 적응형 코딩 기법(예: FGK, Vitter, Gagie 등)은 문자 빈도표를 유지하기 위해 O(σ) 공간을 필요로 했으며, 이는 Unicode와 같이 수십만 개 이상의 심볼을 다루는 현대 애플리케이션에서 비현실적이다. 저자들은 이러한 문제를 해결하기 위해 “슬라이딩 윈도우 샤논 코딩”이라는 접근법을 고안한다.
알고리즘은 먼저 파라미터 λ>1과 ε>0을 고정하고, ℓ = Θ(σ^{1/λ} log σ) 길이의 고정 윈도우를 정의한다. 윈도우 w_i = s
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기