이미지 품질 평가 종합 가이드: 주관·객관 방법부터 HDR·3D까지

초록

본 논문은 이미지 품질 평가(IQA)의 전반적인 흐름을 정리한다. 주관적 평가와 객관적 평가의 개념·분류를 설명하고, 대표적인 주관 데이터셋과 성능 지표를 소개한다. 특히 전통적인 2D 이미지에 대한 전참조(FR) 방법 9가지를 상세히 분석하고, HDR·3D 이미지 평가에 대한 최신 동향을 간략히 제시한다.

상세 분석

논문은 먼저 IQA의 필요성을 강조하며, 인간 시각 시스템(HVS)과의 일치성을 목표로 하는 객관적 지표 개발의 배경을 제시한다. 주관적 평가에서는 MOS(Mean Opinion Score)와 DMOS(Differential MOS) 개념을 바탕으로, 실험 설계(피험자 수, 디스플레이 조건, 스케일링 방법)와 데이터셋(예: LIVE, TID2013, CSIQ 등) 선택 기준을 체계적으로 정리한다. 객관적 평가에서는 전참조(FR), 부분참조(NR), 무참조(NR) 세 가지 범주로 나누어, 각 범주의 장·단점을 비교한다. 특히 FR-IQA에 집중하여 MSE, PSNR과 같은 전통적 오류 기반 지표가 HVS에 대한 민감도 부족을 드러내는 점을 지적하고, SSIM이 구조적 유사성을 통해 시각적 품질을 더 잘 반영한다는 점을 설명한다. 이후 MS‑SSIM, VIF, MAD, FSIM, FSIM‑C, DRIM, TMQI 등 9가지 최신 FR 지표를 수식적 정의와 구현 복잡도 측면에서 비교한다. 예를 들어, FSIM은 위상 congruency와 gradient magnitude를 결합해 텍스처와 에지 정보를 동시에 고려하고, FSIM‑C는 색채 정보를 추가해 컬러 이미지에 대한 민감도를 높인다. DRIM은 HDR 이미지의 동적 범위 차이를 정량화하며, TMQI는 톤 매핑 후의 시각적 왜곡을 평가한다. 실험에서는 네 개의 주관 데이터셋(LIVE, TID2013, CSIQ, IVC)에서 각 지표의 Pearson, Spearman, KRCC 상관계수를 산출하고, 평균 연산 시간도 측정한다. 결과는 SSIM·MS‑SSIM·VIF·FSIM이 전반적으로 높은 상관성을 보이지만, 계산 비용에서 차이가 있음을 보여준다. 마지막으로 3‑D IQA 파트에서는 깊이 정보와 시차 차이를 고려한 전/부분/무참조 방법의 필요성을 언급하고, 현재는 시점별 2‑D 품질을 합성하는 방식이 주류이나, 인간의 입체 시각 특성을 반영한 새로운 모델이 요구된다고 결론짓는다.