영상 압축을 위한 시공간 적응형 양자화 기법

초록

본 논문은 HEVC의 CU‑단계 AdaptiveQP를 개선하여, 색차(Cb·Cr) 샘플의 분산과 CU의 시간적 변화를 동시에 고려한 적응형 양자화 방식을 제안한다. 또한 λ 기반 QP 재조정으로 RDO 복잡도를 낮추었다. 4:4:4·4:2:2·4:2:0·4:0:0 포맷의 테스트 영상에서 BD‑Rate를 Y‑채널 기준 최대 23.1 %, Cr‑채널 26.7 %, Cb‑채널 25.2 % 감소시켰으며, 인코딩 시간도 평균 4.4 % 단축하였다.

상세 요약

HEVC(H.265) 표준에서 CU‑단위 AdaptiveQP는 오직 luma 블록의 픽셀 분산만을 이용해 QP를 조정한다. 이는 인간 시각 시스템이 밝기 변화에 민감하지만, 색차 정보가 무시될 경우 색채 왜곡이 발생할 가능성을 내포한다. 논문은 첫 번째 기여로, 각 CU 내부의 Cb·Cr 샘플 분산을 별도 통계량으로 추출하고, 이를 luma 분산과 가중합한 복합 지표를 QP 조정에 활용한다. 이 복합 지표는 색채가 풍부한 4:4:4 영상이나 색차가 크게 변동하는 4:2:2·4:2:0 영상에서 특히 효과적이다.

두 번째 기여는 CU의 시간적 특성을 반영한다는 점이다. 기존 AdaptiveQP는 프레임 간 변화량을 고려하지 않아, 움직임이 큰 영역에서 과도한 양자화가 발생하거나, 정적인 영역에서는 불필요하게 높은 QP가 적용될 위험이 있다. 저자들은 현재 CU와 이전 프레임 동일 위치 CU 간의 차분 에너지(예: SAD 혹은 MSE)를 계산하고, 이를 시간적 가중치로 사용한다. 공간적 분산과 시간적 차분을 결합한 최종 가중치는 QP를 동적으로 상승·하강시키며, 움직임이 큰 영역에서는 QP를 낮춰 디테일을 보존하고, 정적 영역에서는 QP를 높여 비트율을 절감한다.

복합 QP 결정 과정에서 발생하는 다중 QP 후보 탐색은 RDO(Rate‑Distortion Optimization) 단계의 복잡도를 크게 증가시킨다. 이를 완화하기 위해 저자들은 λ‑refined QP 기법을 도입한다. λ는 RDO에서 비용 함수 J = D + λ·R의 λ 파라미터이며, 기존 HEVC에서는 QP와 λ가 고정 매핑 관계에 있다. 논문에서는 현재 CU의 복합 가중치를 기반으로 λ를 미세 조정하고, 이에 따라 QP 후보 집합을 사전 제한한다. 결과적으로 후보 수가 평균 30 % 감소하면서도 BD‑Rate 손실이 미미하게 유지된다.

실험은 4가지 색채 서브샘플링 포맷(4:4:4, 4:2:2, 4:2:0, 4:0:0)과 다양한 해상도·프레임레이트 영상을 대상으로 수행되었다. BD‑Rate 측정은 표준 Bjøntegaard ΔRate 방식을 사용했으며, Y, Cb, Cr 각각에 대해 별도 보고하였다. 최대 23.1 % (Y), 26.7 % (Cr), 25.2 % (Cb)의 비트율 절감 효과가 확인되었으며, 평균 인코딩 시간은 4.4 % 단축되었다. 특히 색채 정보가 풍부한 4:4:4 영상에서 색차 채널의 BD‑Rate 감소가 두드러졌다.

한계점으로는 시간적 가중치를 계산하기 위해 전 프레임의 CU 정보를 저장해야 하므로 메모리 사용량이 증가한다는 점과, 복합 가중치의 파라미터(예: 공간·시간 가중치 비율)가 고정값으로 설정돼 다양한 콘텐츠에 최적화되지 않을 가능성이 있다. 향후 연구에서는 머신러닝 기반 가중치 자동 튜닝 및 메모리 효율성을 높이는 스트리밍 방식이 제안될 수 있다.

초록

상세 요약

📜 논문 원문 (영문)