확장 가능 비디오 코딩의 복잡성을 줄이는 최적 모드 선택 알고리즘

본 논문은 H.264/SVC의 높은 인코딩 복잡성 문제를 해결하기 위해 픽셀 방향성과 매크로블록의 무게중심 이동을 분석하는 새로운 최적 모드 선택 알고리즘을 제안한다. 제안 방식은 적응형 검색 범위와 모드 후보군 축소를 통해 기존 JSVM 기준 대비 57.44%의 인코딩 시간 절약, 0.43dB의 PSNR 향상, 0.23%의 비트레이트 감소를 달성하여 효율성과 화질을 균형 있게 개선했다.

저자: L. Balaji, K. K. Thyagharajan, C. Raja

확장 가능 비디오 코딩의 복잡성을 줄이는 최적 모드 선택 알고리즘
이 논문은 H.264/SVC(Scalable Video Coding)의 높은 계산 복잡성을 해결하기 위한 새로운 최적 모드 선택 알고리즘을 제안하고 그 성능을 검증한다. 서론에서는 SVC가 기본 레이어(BL)와 향상 레이어(EL)로 구성되어 공간적, 시간적, 품질적 확장성을 제공하지만, 레이어 간 예측과 다양한 모드 후보군으로 인해 인코딩 복잡도가 AVC보다 훨씬 높아졌음을 지적한다. 특히 모든 가능한 모드에 대해 RDC(Rate-Distortion Cost)를 계산하는 전통적인 전체 탐색(Full Search) 방식이 주요 병목임을 강조한다. 관련 연구 섹션에서는 기존의 빠른 모드 결정(FMD) 알고리즘들을 RD 예측 기반, RDO 기반, 비-RDO 기반으로 분류하여 검토한다. 레이어 간 모드 상관관계를 이용하거나(Balaji & Thyagharajan, 2014), 베이지안 추정을 사용하는(Yeh et al., 2010) 등 다양한 시도가 있었으나, 대부분 인코딩 시간, PSNR(화질), 비트레이트 세 가지 측정 지표를 동시에 만족시키지 못하는 한계가 있음을 지적한다. 제안 알고리즘의 핵심은 현재 MB와 참조 MB 간의 '픽셀 차이의 합(SOD)'과 두 MB의 '무게중심 이동 거리(DCOG)'를 계산하는 것이다. SOD는 잡음 영향을 줄여 정확한 매칭을 도우며, DCOG는 블록 내 객체 운동의 강도를 나타낸다. 이 두 값을 기준으로 MB를 운동 특성에 따라 4가지 클래스(C1: 정적, C2: 균일 운동, C3: 비균일 저속 운동, C4: 고속/복잡 운동)로 분류한다. 분류 결과는 적응형 검색 범위와 검사할 모드 후보군을 결정하는 데 직접 사용된다. 알고리즘은 SOD와 DCOG가 QP에 비례한 임계값(k1/d1, k2/d2, k3/d3)을 넘는지 여부에 따라 계층적 결정을 내린다. 가장 운동이 적은 경우 검색 범위를 2로 제한하고 'SKIP, 16x16' 모드만, 중간 정도 운동에는 검색 범위 4와 4가지 모드, 더 많은 운동에는 검색 범위 8과 7가지 인터 모드를 검사한다. 가장 복잡한 운동의 경우에만 모든 인터/인트라 모드를 검사한다. 이렇게 함으로써 대부분의 MB에 대해 불필요한 모드 검사와 넓은 범위의 움직임 추정을 생략하여 계산 부하를 대폭 줄인다. 실험 결과 섹션에서는 제안 알고리즘이 JSVM 9.19 참조 소프트웨어와 비교했을 때, 평균 57.44%의 인코딩 시간 절약, 0.43dB의 PSNR 향상, 0.23%의 비트레이트 감소를 달성했음을 보여준다. 이는 제안 방식이 복잡성 감소뿐 아니라 화질과 압축 효율도 동시에 개선할 수 있음을 입증한다. 결론에서는 SOD와 DCOG 기반의 적응형 모드 선택 전략이 SVC 인코더의 효율성을 균형 있게 향상시킨 효과적인 방법임을 재차 강조하며 연구를 마무리한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기