다중해상도 색균일 영역 기반 이미지 품질 평가 PerSIM

PerSIM은 인간 시각 시스템을 모델링하여 Lab 색공간의 명도(L)와 색도(a, b) 정보를 각각 LoG 특징과 색 유사도로 평가하고, 다중해상도에서의 기하 평균을 통해 최종 품질 점수를 산출하는 전참조 이미지 품질 지표이다. LIVE와 TID2013 데이터베이스 실험에서 기존 지표들을 능가하는 순위·단조성·선형성을 보였다.

저자: Dogancan Temel, Ghassan AlRegib

다중해상도 색균일 영역 기반 이미지 품질 평가 PerSIM
본 논문은 인간 시각 시스템이 색을 인지하고 구조적 정보를 우선적으로 처리한다는 두 가지 관찰을 바탕으로, 전참조 이미지 품질 평가 지표 PerSIM을 제안한다. 기존의 PSNR, SSIM 등은 픽셀 단위 차이나 구조적 유사도만을 고려했으며, 색채 정보를 충분히 반영하지 못한다는 한계가 있다. 이를 보완하기 위해 저자는 먼저 입력 이미지를 CIELAB 색공간으로 변환한다. Lab 색공간은 명도(L)와 색도(a, b)를 명확히 분리해 인간이 색을 균일하게 인식하도록 설계된 공간이다. 명도 채널 L에 대해서는 라플라시안 오브 가우시안(Laplacian of Gaussian, LoG) 필터를 적용한다. LoG는 2차 미분 연산으로 에지와 텍스처를 강조하며, 이는 망막의 갱글리온 세포가 빛 강도 변화를 감지하는 방식과 유사하다. 논문에서는 표준 편차 σ=10을 기본값으로 하여 13×13 커널을 사용하고, 원본 이미지와 왜곡 이미지 각각에 LoG를 적용한 후, SSIM과 유사한 형태의 유사도 함수를 통해 LoG 유사도 지도를 만든다. 색도 채널 a와 b에 대해서는 각각 단순한 유사도 함수를 적용한다. a와 b 각각에 대해 (2·x₁·x₂ + C) / (x₁² + x₂² + C) 형태의 식을 사용해 색 차이를 정량화한다. 여기서 C는 0.001로 설정해 분모가 0이 되는 상황을 방지한다. 다음으로 인간 시각 시스템의 색채 서브샘플링(4:2:2) 원리를 차용해 명도와 색도 유사도에 서로 다른 가중치를 부여한다. 구체적으로 LoG 유사도는 4차 거듭제곱, 색도 유사도는 2차 거듭제곱을 적용한다. 이후 픽셀 단위에서 세 유사도 중 최소값을 선택해 최종 품질 지도(LabSIM)를 만든다. 이는 인간이 가장 눈에 띄는 결함에 의해 전체 품질을 판단한다는 가정을 구현한다. 시각 시스템이 계층적이라는 점을 반영해 다중해상도 처리를 도입한다. 원본 해상도(1.0), 0.6배, 0.4배 세 스케일에 대해 각각 LoG와 색도 유사도를 계산하고, 각 스케일의 결과를 기하 평균으로 결합한다. 스케일별 LoG 필터의 표준편차와 윈도우 크기는 표 1에 따라 조정한다(σ=10,8,7; 커널 크기=13×13,4×4,2×2). 이렇게 하면 낮은 해상도에서도 의미 있는 특징을 추출할 수 있다. 다중해상도 LabSIM을 평균 풀링해 하나의 품질 점수를 얻고, 25차 거듭제곱의 모노톤 매핑을 적용해 0~1 구간으로 스케일링한다. 이 매핑은 값의 변동성을 확대해 심각한 왜곡에서는 0에 가깝게, 거의 손상이 없을 때는 1에 가깝게 만든다. 성능 검증은 두 개의 표준 데이터베이스인 LIVE와 TID2013을 사용한다. LIVE는 JPEG, JPEG2000, 화이트 노이즈, 가우시안 블러, 빠른 페이딩 채널 오류 등 5가지 왜곡을 포함한다. TID2013은 24가지 왜곡을 포함해 색채 왜곡까지 다룬다. 논문에서는 PLCC와 RMSE(선형성), SROCC와 KCC(순위성) 네 가지 지표를 모두 사용해 비교한다. 결과는 다음과 같다. LIVE 데이터베이스에서는 JPEG/JPEG2000 압축과 가우시안 블러에서 PerSIM이 SSIM, MS‑SSIM, IW‑SSIM, FSIM‑c 등과 동등하거나 더 높은 PLCC를 기록했다. 화이트 노이즈와 빠른 페이딩에서는 LoG가 잡음에 민감하지만 색도 유사도가 낮아 성능이 다소 떨어졌다. 전체 LIVE 데이터셋에서는 PerSIM이 평균적으로 가장 높은 PLCC와 낮은 RMSE를 보였다. TID2013에서는 전체 24가지 왜곡에 대해 PerSIM이 가장 높은 SROCC와 KCC를 기록했다. 특히 색채 왜곡이 포함된 카테고리에서 색도 유사도가 크게 기여했으며, 색도 없이 LoG만을 사용한 LogSIM보다 전반적인 성능이 향상되었다. 논문은 또한 색도 정보를 제외한 경우 성능이 현저히 감소한다는 실험을 제시해, 색채 유사도가 전체 품질 평가에 중요한 역할을 함을 강조한다. 시각 시스템의 계층적·다중해상도 특성을 반영한 구조와 색채 서브샘플링 기반 가중치 부여가 기존 지표 대비 전반적인 개선을 이끌어냈다. 마지막으로 저자는 PerSIM이 구조·색채·다중해상도 세 축을 모두 포괄함으로써 인간 지각에 가까운 품질 평가가 가능하다고 주장한다. 향후 연구 방향으로는 블라인드 품질 평가에 적용하기 위한 특징 학습, 비디오 프레임 간 시간적 다중해상도 모델링, 그리고 실시간 구현을 위한 연산 최적화 등을 제시한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기