적응형 패리티를 이용한 오류 복원 LZ77 압축 알고리즘

본 논문은 기존 LZRS′77 알고리즘이 블록 전체에 동일한 패리티 비트를 삽입해 오류 복원 능력이 가장 낮은 블록에 의해 제한되는 문제를 해결하고자, 각 블록의 실제 중복성을 이용해 패리티 양을 가변적으로 할당하는 LZRSa′77를 제안한다. Reed‑Solomon 부호와 LZ77 포인터 선택 여유도를 결합해 평균적으로 4.5∼8개의 오류를 교정할 수 있게 하면서 압축 효율은 거의 변하지 않는다. 실험 결과는 Calgary 코퍼스 파일들을 대…

저자: Tomaz Korosec, Saso Tomazic (Faculty of Electrical Engineering, University of Ljubljana

적응형 패리티를 이용한 오류 복원 LZ77 압축 알고리즘
본 논문은 LZ77 기반 무손실 압축 시스템에서 오류 복원 능력을 향상시키기 위해 기존 LZRS′77 알고리즘의 한계를 분석하고, 이를 보완한 적응형 패리티 삽입 방식인 LZRSa′77를 제안한다. LZRS′77는 LZ77 인코딩 과정에서 포인터 선택 여유(다중 매치)를 이용해 Reed‑Solomon(RS) 부호의 패리티 비트를 삽입한다. 그러나 모든 블록에 동일한 e 값을 적용하기 때문에 전체 파일에서 가장 중복성이 낮은 초기 블록이 전체 오류 정정 한계를 결정한다. 이는 실제 데이터가 블록마다 중복성 차이를 보이는 경우, 전체 시스템의 정정 능력이 크게 저하되는 원인이 된다. LZRSa′77는 이러한 문제를 해결하고자, 각 블록이 보유한 실제 중복성(포인터 다중 매치 수 Mₖ)을 정밀히 측정해 블록별로 적절한 eₙ 값을 동적으로 할당한다. 구체적인 절차는 다음과 같다. 먼저 원본 문자열 X를 표준 LZ77으로 압축하면서, 각 포인터가 가질 수 있는 매치 수 Mₖ를 기록한다. 이후 첫 번째 블록 B₁은 사용자가 지정한 e₁(보통 1~2)만큼의 패리티를 포함하도록 255‑2e₁ 바이트 길이로 만든다. 그 다음 블록 B₂부터는 이전 블록 Bₙ₋₁에서 얻은 총 여유 비트 Σ⌊log₂Mₖ⌋를 16비트(한 RS 심볼) 단위로 나누어 eₙ을 계산하고, Bₙ을 255‑2eₙ 바이트 길이로 설정한다. 이렇게 하면 중복성이 풍부한 구간에서는 더 많은 패리티를 할당받아 평균 e 값이 크게 증가한다. 각 블록 Bₙ에 대해 RS(255,255‑2eₙ) 부호를 적용해 2eₙ개의 패리티 심볼을 생성하고, 이를 Bₙ₋₁의 포인터 선택 여유에 삽입한다. 인코딩은 마지막 블록부터 역순으로 진행해, 앞 블록에 삽입된 패리티가 뒤 블록을 복원하도록 설계한다. 디코딩 단계는 역순으로 진행되며, 첫 블록(옵션)에서 패리티를 사용해 오류를 정정하고, LZS′77 디코더를 통해 원본 데이터를 복원한다. 복원 과정에서 다음 블록의 패리티를 추출하고, 이를 이용해 해당 블록을 정정한다. 이 과정은 모든 블록에 대해 독립적으로 수행되면서도 전체 파일의 연속성을 유지한다. 실험은 Calgary 코퍼스의 12개 파일을 대상으로 수행되었다. 먼저 10 000바이트 구간에서 고정 e와 평균 적응형 e를 비교했으며, 고정 e는 대부분 1~3에 불과했지만, 적응형 e는 4.5~8까지 도달하였다. 이어 3 000바이트와 30 000바이트 길이의 서브스트링에 무작위 비트 오류를 삽입해 100회 반복 실험을 진행하였다. 결과는 LZRSa′77가 LZRS′77에 비해 오류 정정 성공률이 현저히 높으며, 특히 e₁을 5~8로 설정한 경우 첫 블록의 정정 능력이 크게 향상되어 전체 복원 성공률이 크게 증가함을 보여준다. 압축 효율 측면에서는 포인터 선택 여유를 활용해 패리티를 삽입하므로 압축 비율에 거의 영향을 주지 않는다. 다만 구현 복잡도가 증가하고, 각 블록의 길이와 e 값을 메타데이터로 저장해야 하는 오버헤드가 존재한다. 또한 포인터 다중 매치가 충분히 발생하지 않는 데이터(고압축 이미지, 바이너리 실행 파일 등)에서는 적응형 이득이 제한될 수 있다. 논문은 향후 연구 방향으로 (1) 블록 크기를 고정하지 않고 데이터 특성에 따라 가변적으로 조정하는 방법, (2) LDPC, Polar 등 현대적인 채널 부호와 결합해 패리티 효율을 높이는 방안, (3) 하드웨어 가속을 위한 파이프라인 설계 및 SIMD 최적화, (4) 실시간 스트리밍 환경에서 지연을 최소화하기 위한 순방향/역방향 처리 병렬화 등을 제시한다. 이러한 확장은 적응형 패리티 개념을 보다 넓은 응용 분야에 적용할 수 있게 하며, 오류에 취약한 저대역폭 전송이나 저장 매체에서도 높은 신뢰성을 제공할 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기