차세대 VVC 인코딩 디코딩 복잡도 심층 분석

초록

본 논문은 VVC 테스트 모델 6의 인코더와 디코더 복잡도를 정량적으로 분석한다. 720p·1080p·2160p 영상 6종을 LD·RA·AI 시나리오별로 320번 인코딩·디코딩하여 각 코딩 툴별 연산량과 메모리 요구량을 측정하였다. 결과는 LD에서 VVC 인코더·디코더가 HEVC 대비 각각 5배·1.5배, AI에서는 31배·1.8배 복잡함을 보여준다. 인코딩에서는 모션 추정(53%), 변환·양자화(22%), 엔트로피 코딩(7%)이, 디코딩에서는 루프 필터(30%), 모션 보상(20%), 엔트로피 디코딩(16%)이 주요 병목임을 밝힌다. 또한 메모리 대역폭 요구가 HEVC 대비 인코딩 30배, 디코딩 3배임을 보고한다.

상세 요약

본 연구는 VVC TM‑6의 복잡도 특성을 정밀하게 파악하기 위해 6개의 대표 영상(720p, 1080p, 2160p)과 3가지 전형적인 인코딩 모드(Low‑Delay, Random‑Access, All‑Intra)를 조합하여 총 320개의 인코딩·디코딩 실험을 수행하였다. 복잡도 측정은 CPU 사이클 카운트와 메모리 접근 횟수를 기반으로 하며, 각 코딩 툴(모션 추정, 변환·양자화, 엔트로피 코딩, 루프 필터 등)별로 세분화된 프로파일링을 적용하였다.

LD 모드에서 인코더 전체 연산량의 53%가 다중 후보 탐색과 정밀 서브픽셀 모션 추정에 할당되며, 이는 VVC가 기존 HEVC 대비 더 많은 예측 모드와 복합 모션 벡터 후보를 도입한 결과이다. 변환·양자화 단계는 22%를 차지하는데, 이는 새로운 MTS(다중 변환 스킴)와 LFNST(저주파 비정규 변환) 적용으로 인한 복잡도 증가가 주요 원인이다. 엔트로피 코딩은 CABAC 구조가 심화돼 7% 수준으로 상승했으며, 이는 컨텍스트 모델 수와 복잡한 비트스테이트 전이 때문이다.

디코더 측면에서는 루프 필터(알리어싱 방지, 샤프닝, DBF 등)가 30%를 차지해 가장 큰 부하를 만든다. 특히, VVC는 ALF와 DBF를 동시에 적용하고, 각 프레임에 대해 다중 필터 파라미터를 동적으로 계산하므로 연산량이 급증한다. 모션 보상은 20%로, 고해상도 영상에서 다중 참조 프레임과 복합 모션 벡터를 처리하는 비용이 크게 늘어났다. 엔트로피 디코딩은 16%를 차지하며, 복잡한 컨텍스트 전이와 비트스트림 파싱이 원인이다.

메모리 대역폭 측정 결과, 인코더는 HEVC 대비 평균 30배, 디코더는 3배의 메모리 트래픽을 요구한다. 이는 대규모 후보 탐색, 다중 변환 계수 저장, 그리고 복잡한 필터 파라미터 교환이 메모리 접근을 빈번하게 만들기 때문이다. 이러한 메모리 압박은 실시간 하드웨어 구현 시 전력 소모와 냉각 설계에 큰 영향을 미친다.

종합적으로, VVC는 압축 효율을 크게 향상시켰지만, 모션 추정·다중 변환·루프 필터와 같은 핵심 모듈에서 폭발적인 연산·메모리 요구가 발생한다는 점을 확인했다. 향후 연구는 이러한 병목을 최소화하기 위한 알고리즘 최적화(예: 후보 탐색 범위 축소, 변환 스킴 선택 가속, 필터 파라미터 공유)와 하드웨어 가속 구조 설계에 초점을 맞춰야 한다.

초록

상세 요약

📜 논문 원문 (영문)