플레노픽 포인트 클라우드 비디오 기반 다중뷰 압축
플레노픽 포인트 클라우드의 다중 색상 속성을 비디오 프레임으로 변환하고, 다중뷰 HEVC(MV‑HEVC)를 이용해 높은 상관성을 활용함으로써 기존 RAHT‑KL 변환 대비 평균 37 % 이상의 비트레이트 절감을 달성한 연구입니다.
저자: Li Li, Zhu Li, Shan Liu
플레노픽 포인트 클라우드(PC)는 일반적인 포인트 클라우드와 달리 각 점이 여러 시점에서 관측된 다중 색상 정보를 포함한다. 이러한 다중 속성은 현실감을 크게 향상시키지만, 속성 수가 12~13배 증가하면서 압축 효율이 큰 과제로 떠오른다. 기존 최첨단 방법은 RAHT‑KL 변환으로, 변환 기반 접근을 통해 속성 간 상관성을 일부 활용한다. 그러나 변환만으로는 뷰 간 높은 상관성을 충분히 활용하기 어렵다.
본 논문은 비디오 기반 포인트 클라우드 압축(V‑PCC)의 장점을 플레노픽 PC에 적용한다. 먼저, 플레노픽 PC의 각 속성을 독립적인 2‑D 영상 스트림으로 변환한다. 기존 V‑PCC는 하나의 색상 영상을 다루지만, 여기서는 m개의 색상(예: Luma, Cb, Cr 등)과 각 뷰에 대해 각각 영상을 생성한다. 이렇게 생성된 영상들은 서로 매우 높은 시각적 유사성을 보이며, 이는 다중뷰 고효율 비디오 코딩(MV‑HEVC)으로 인코딩할 경우 큰 이득을 기대할 수 있다.
MV‑HEVC 적용 방식은 다음과 같다. 정적 플레노픽 PC를 13개의 뷰로 투영하고, 각 뷰마다 두 개의 프레임(전방·후방)으로 구성한다. 뷰 간에는 계층적 GOP 구조를 채택해, 최상위 뷰를 I‑프레임으로 두고 하위 뷰를 B‑프레임으로 설정한다. B‑프레임은 양방향 예측을 통해 상위 뷰와 동일 뷰의 두 프레임을 참조한다. 이렇게 하면 뷰 간 및 시간 축 모두에서 높은 예측 효율을 달성한다. QP 설정은 뷰 레벨과 프레임 레벨에 따라 차등 적용한다. 예를 들어, 레벨 0은 QP = I + 1, 레벨 1은 I + 2 등으로 설정해 고품질 뷰는 낮은 QP, 부수 뷰는 높은 QP를 부여한다. 이러한 QP 차등은 전체 비트 사용을 최적화하면서도 시각적 품질을 유지한다.
다음으로, 비어 있는(미점) 픽셀에 대한 비트 비용을 최소화하기 위해 블록 기반 그룹 패딩을 제안한다. 기존 V‑PCC는 시간 축에서만 평균값 패딩을 적용했으나, 플레노픽 PC는 뷰 간 차이가 크기 때문에 뷰 방향에서도 효율적인 패딩이 필요하다. 논문은 4×4 블록을 기준으로, 블록 전체가 비어 있을 경우에만 모든 뷰와 두 프레임의 평균값으로 패딩한다. 고립된 비어 있는 픽셀은 패딩하지 않아 공간 연속성을 유지한다. 이 방법은 연속된 비어 있는 영역에서 예측 잔차를 크게 감소시켜 비트 절감 효과를 높인다.
실험은 MPEG‑TMC 7.0 기반 V‑PCC 레퍼런스 구현에 제안 알고리즘을 통합해 수행하였다. 테스트 데이터는 6개의 공개 플레노픽 PC(Lo oot, Soldier, Thaidancer, Longdress, Redandblack 등)이며, 각 데이터는 12~13개의 속성을 포함한다. 비교 대상은 기존 RAHT‑KL 변환이다. 실험 설정은 All‑Intra 구성으로, QP 범위 r1~r5(저~고 비트레이트)에서 평가하였다. 평가 지표는 평균 PSNR(모든 뷰)와 BD‑Rate(속성 비트)이다.
결과는 다음과 같다. 다중뷰 인코딩을 적용한 V‑PCC는 평균 37 %의 BD‑Rate 절감을 달성했으며, 특히 저비트레이트 영역에서 큰 이득을 보였다. 블록 기반 패딩을 추가하면 속성 비트에서 평균 13 % 정도 추가 절감이 가능했다. 전체 비트(geometry + attribute) 기준으로는 40 % 이상 절감되었다. 고비트레이트에서는 기존 V‑PCC와 비슷하거나 약간 뒤처지는 경향이 있었지만, 전반적인 압축 효율은 현저히 향상되었다.
이 연구는 플레노픽 PC 압축에 비디오 기반 예측·변환·양자화·엔트로피 코딩을 통합함으로써, 변환 기반 방법이 놓친 뷰 간 상관성을 효과적으로 활용한다는 점에서 학술적 기여가 크다. 또한, 블록 기반 그룹 패딩은 실용적인 비트 절감 기법으로, 실제 전송·저장 시스템에 바로 적용 가능하다. 향후 연구에서는 동적 플레노픽 PC에 대한 시간 축 확장, 실시간 인코딩 최적화, 그리고 딥러닝 기반 뷰 예측 모델과의 결합 등을 통해 더욱 높은 압축 효율과 실시간성을 추구할 수 있을 것이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기