주파수 기반 시각 손실 없는 압축을 위한 지각 양자화 기법

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 HEVC 표준의 기존 양자화 방식인 URQ와 RDOQ가 변환 계수의 시각적 중요도를 고려하지 않는 문제를 해결하고자, 변환 계수와 DC 계수 사이의 유클리드 거리를 이용해 고주파 계수를 보다 크게 양자화하는 Frequency‑Dependent Perceptual Quantisation(FDPQ)을 제안한다. 실험 결과, 동일 QP 조건에서 최대 41%의 비트레이트 절감과 시각적으로 손실 없는 영상을 달성하였다.

상세 분석

FDPQ는 인간 시각 시스템(HVS)의 변조 전달 함수(MTF) 특성을 정량화하기 위해, 변환 블록(TB) 내 각 AC 계수가 DC 계수와 갖는 정규화된 유클리드 거리 d 를 계산한다. 거리 d 가 클수록 해당 계수는 인간이 인지하기 어려운 고주파 성분으로 판단하고, 이를 반영해 양자화 단계(QStep)를 증가시키는 가중치 w = e^(‑d) 를 적용한다. 구체적으로, 기존 HEVC에서 사용되는 곱셈 인자(MF) m 을 m′ = ⌈m·w⌉ 식으로 변형함으로써, 고주파 AC 계수에 대해 더 큰 QStep이 적용되어 보다 거친 양자화가 이루어진다. 이 과정은 변환 계수의 위치에 따라 자동으로 조정되며, 4×4부터 32×32까지 모든 블록 크기에 적용 가능하도록 설계되었다.

기존 URQ는 QP에 의해 전체 블록을 동일하게 양자화하므로, 시각적으로 불필요한 고주파 정보를 충분히 제거하지 못한다. RDOQ는 레이트‑디스토션 최적화를 수행하지만, 비용 함수에 인간 시각 특성을 반영하지 않아 여전히 고주파 계수를 과도하게 보존한다. FDPQ는 이러한 한계를 극복하고, 비트스트림 내 비영(0) 계수 비율을 높여 CABAC 엔트로피 코딩 효율을 향상시킨다. 실험에서는 동일 QP(예: 17, 22)에서 RDOQ 대비 평균 30% 이상, 최악의 경우 41%까지 비트레이트 감소를 기록했으며, 주관적 테스트에서는 모든 시점에서 “시각적으로 구분 불가”(visually lossless) 결과를 얻었다.

복잡도 측면에서, FDPQ는 MF와 가중치 w 만을 추가로 계산하면 되므로, RDOQ가 요구하는 레이트‑디스토션 라그랑지안 비용 탐색에 비해 연산량이 현저히 낮다. 가중치와 수정된 MF는 인코더와 디코더 모두에서 동일하게 재현 가능하도록 PPS에 전달되며, 기존 HEVC 파이프라인에 최소한의 변경만으로 통합할 수 있다.

요약하면, FDPQ는 변환 계수의 주파수‑거리 정보를 활용해 인간 시각에 기반한 비선형 양자화를 구현함으로써, 비트레이트 절감과 시각적 무손실을 동시에 달성하는 실용적인 방법이다.

주파수 기반 시각 손실 없는 압축을 위한 지각 양자화 기법

초록

상세 분석

댓글 및 학술 토론

의견 남기기