AVS2 감시 프로파일을 위한 ROI 위치 효율 코딩 기법

초록

본 논문은 AVS2 표준의 감시 프로파일에 적용되는 ROI(Region‑of‑Interest) 위치 정보를 효율적으로 비트스트림에 포함시키는 세 가지 코딩 방식을 제안한다. 직접 코딩, 차분 코딩, 재구성 기반 코딩을 각각 설계·분석하고, 압축 효율·복잡도·실시간 적용 가능성을 비교한다. 실험 결과, 차분 코딩이 평균 30 % 이상의 비트 절감 효과를 보이며, 재구성 기반 코딩은 복잡도가 높지만 고정밀 ROI 추적에 유리함을 확인하였다.

상세 분석

본 연구는 ROI 위치 정보를 비디오 코덱에 직접 삽입하는 것이 기존 영상 압축 효율을 저해한다는 점에 주목한다. 이를 해결하기 위해 세 가지 코딩 스킴을 설계했으며, 각각의 설계 원리와 트레이드오프를 상세히 분석한다.

첫 번째인 직접 코딩(direct‑coding) 방식은 각 프레임마다 ROI의 좌표와 크기를 그대로 인코딩한다. 구현이 가장 간단하고, ROI 개수가 적고 변동이 크지 않은 정적 감시 장면에서 실시간 처리에 유리하지만, ROI 수가 많아지면 비트 오버헤드가 급격히 증가한다는 단점이 있다. 특히 좌표값을 고정 길이 비트스트림으로 표현하기 때문에, 작은 움직임에도 불필요한 비트가 소비된다.

두 번째인 차분 코딩(differential‑coding) 방식은 현재 프레임의 ROI 정보를 이전 프레임의 ROI와 비교해 차분값만을 전송한다. 여기서는 두 단계의 차분을 적용한다. 첫 번째 차분은 동일한 객체에 대한 연속 프레임 간 좌표 차이를 계산하고, 두 번째 차분은 동일 프레임 내 다중 ROI 간 상대 위치를 이용한다. 차분값은 부호와 절댓값을 가변 길이 코드(예: Exp‑Golomb)로 압축함으로써 평균 30 %~45 %의 비트 절감 효과를 얻는다. 또한, 차분값이 0에 가까울 경우 런‑길이 인코딩을 적용해 추가적인 압축 효율을 달성한다. 그러나 차분 코딩은 오류 전파에 취약하다. 한 프레임에서 차분값이 손상되면 이후 프레임의 ROI 복원에 오류가 누적될 위험이 있다. 이를 완화하기 위해 주기적인 I‑frame 삽입 시점에 전체 ROI 정보를 재전송하도록 설계하였다.

세 번째인 재구성 기반 코딩(reconstructed‑coding) 방식은 인코더와 디코더가 동일한 ROI 예측 모델을 공유한다는 전제하에, 디코더가 현재 프레임을 복원한 뒤 예측된 ROI 위치와 실제 ROI 위치 간 차이를 전송한다. 이때 차이는 픽셀 단위가 아니라 블록 단위(예: 4×4)로 표현되며, 차분값이 작을 경우 가변 길이 코드로 압축한다. 재구성 기반 코딩은 ROI가 복잡하게 움직이거나 크기가 변동하는 경우에도 높은 정확도를 유지한다. 하지만 인코더와 디코더 간에 동일한 복원 알고리즘과 ROI 추정 로직을 사전에 협의해야 하며, 계산 복잡도가 가장 높다. 특히, 실시간 감시 시스템에서 CPU 사용량이 크게 증가할 수 있다.

종합적으로, 논문은 세 스킴을 상황에 맞게 선택·전환할 수 있는 하이브리드 프레임워크를 제안한다. 정적 장면에서는 직접 코딩이, 움직임이 빈번하지만 ROI 수가 제한적인 경우에는 차분 코딩이, 고정밀 ROI 추적이 요구되는 고해상도 감시 영상에서는 재구성 기반 코딩이 최적이다. 또한, 각 스킴에 대한 비트 오버헤드, 복구 오류율, 연산 복잡도 등을 정량적으로 평가한 실험 결과를 제시해, AVS2 감시 프로파일에 실제 적용 가능한 설계 지침을 제공한다.