블록 기반 DCT와 엣지 분류를 이용한 색상 이미지 고효율 압축

초록

본 논문은 RGB 이미지를 YCbCr 색공간으로 변환한 뒤 8×8 DCT 블록을 적용하고, 각 블록을 엣지와 비엣지로 구분하여 압축 강도를 차등 적용하는 방법을 제안한다. 엣지 블록은 낮은 압축률(고품질)로, 비엣지 블록은 높은 압축률(저품질)로 처리해 전체 압축 효율과 재구성 품질을 동시에 향상시켰다고 주장한다. 실험 결과는 기존 블록 기반 DCT 압축 대비 PSNR 상승 및 압축 비율 개선을 보여준다.

상세 분석

이 논문은 색상 이미지 압축에 있어 전통적인 JPEG 방식의 한계를 극복하고자 블록 기반 이산코사인변환(DCT)과 엣지 기반 가변 압축을 결합한 새로운 프레임워크를 제시한다. 먼저 RGB 입력을 YCbCr 색공간으로 변환하는 과정은 인간 시각 특성에 맞춰 밝기(Y)와 색차(Cb, Cr)를 분리함으로써 색채 정보 손실을 최소화한다는 점에서 타당하다. 이후 8×8 DCT 블록을 적용하는데, 이는 JPEG과 동일한 블록 크기를 사용함으로써 기존 하드웨어와 소프트웨어 구현 호환성을 유지한다.

핵심 차별점은 블록을 ‘엣지 블록’과 ‘비엣지 블록’으로 분류하는 단계이다. 논문에서는 Sobel 혹은 Prewitt 같은 1차 미분 연산자를 이용해 각 블록의 에지 강도를 측정하고, 사전에 정의된 임계값(threshold)보다 큰 경우 엣지 블록으로 판정한다. 이때 임계값 설정이 압축 품질에 미치는 영향이 크게 언급되지 않았으며, 이미지 종류에 따라 동적 임계값 조정이 필요할 것으로 보인다.

엣지 블록에 대해서는 낮은 양자화(step size)와 높은 비트 할당을 적용해 디테일 손실을 최소화하고, 비엣지 블록은 높은 양자화와 강도 높은 런-길이 인코딩(RLE) 등을 통해 압축률을 크게 높인다. 이러한 차등 양자화는 인간 시각 시스템이 고주파 성분보다 저주파 성분에 더 민감하다는 가정에 기반한다. 하지만 논문에서는 양자화 테이블 설계 과정과 비트스트림 구조에 대한 구체적인 설명이 부족해 재현 가능성이 떨어진다.

실험에서는 표준 테스트 이미지(예: Lena, Barbara, Peppers)를 사용해 PSNR과 압축 비율을 비교했으며, 제안 방법이 기존 JPEG 대비 평균 1.5dB 이상의 PSNR 향상과 20% 이상의 압축 비율 개선을 달성했다고 보고한다. 그러나 비교 대상이 JPEG 외에 최신 코덱(예: WebP, HEIC)과의 비교가 없으며, 주관적 품질 평가(MOS)나 구조적 유사도(SSIM)와 같은 지표가 누락돼 실제 시각 품질을 완전히 입증하기 어렵다.

또한 블록 경계에서 발생할 수 있는 ‘블록 효과’를 완화하기 위한 디더링이나 포스트 프로세싱 기법이 언급되지 않아, 고압축 비율 상황에서 눈에 띄는 아티팩트가 발생할 가능성이 있다. 계산 복잡도 측면에서는 엣지 검출과 블록 분류 단계가 추가 연산을 요구하지만, 전체 파이프라인이 여전히 O(N) 수준이므로 실시간 적용이 가능할 것으로 예상된다.

종합적으로, 이 논문은 DCT 기반 압축에 엣지 기반 가변 양자화를 도입해 품질-압축 트레이드오프를 개선하려는 시도는 의미가 있으나, 임계값 선정, 양자화 테이블 설계, 최신 코덱과의 정량적 비교 등에서 보완이 필요하다.