압축 이미지에서 얼굴 품질을 정량적으로 평가하는 새로운 방법

초록

본 논문은 디지털 이미지 압축 후 얼굴 영역과 비얼굴 영역의 품질 차이를 정량적으로 측정하기 위해 이미지 분할과 세 가지 이미지 품질 지표(Q, SSIM, G‑SSIM)를 결합한 평가 방식을 제안한다. 실험 결과, 압축 과정에서 얼굴 영역이 비얼굴 영역보다 덜 손상되는 경향을 확인하였다.

상세 분석

이 연구는 이미지 압축 품질 평가에 있어 “관심 영역(region of interest, ROI)”을 명시적으로 고려한 점이 가장 큰 강점이다. 기존의 전역 품질 지표는 전체 픽셀을 평균화하기 때문에 얼굴처럼 인간이 시각적으로 민감하게 인식하는 영역의 손실을 과소평가할 위험이 있다. 논문은 먼저 색상 및 텍스처 기반의 간단한 임계값 분할을 이용해 얼굴 영역을 추출하고, 이를 마스크로 활용해 Q, SSIM, G‑SSIM를 각각 얼굴 ROI와 비ROI에 별도로 적용한다. Q는 밝기, 대비, 구조 3요소를 곱한 형태로 전통적인 품질 지표이며, SSIM은 인간 시각 시스템(HVS)을 모방한 구조적 유사성을, G‑SSIM은 이미지의 기울기 정보를 강조해 에지 보존 능력을 평가한다. 세 지표를 동시에 사용함으로써 압축에 따른 밝기 왜곡, 대비 손실, 에지 흐림을 다각도로 포착한다는 점은 방법론적 타당성을 높인다.

실험에서는 JPEG와 JPEG2000 등 대표적인 손실 압축 방식을 다양한 품질 계수(QF)로 적용하고, 원본 이미지와 압축 이미지 사이의 품질 차이를 ROI별로 비교하였다. 결과는 모든 지표에서 얼굴 ROI의 평균 점수가 비ROI보다 현저히 높게 나타났으며, 특히 G‑SSIM에서 에지 보존 효과가 두드러졌다. 이는 압축 알고리즘이 인간 눈에 민감한 얼굴 부위의 고주파 성분을 상대적으로 보호하도록 설계된 경우가 많기 때문으로 해석할 수 있다.

하지만 몇 가지 한계도 존재한다. 첫째, 얼굴 영역 추출에 사용된 단순 임계값 기반 분할은 조명 변화나 복잡한 배경에서 오분할 위험이 있다. 보다 정교한 딥러닝 기반 얼굴 검출기를 적용하면 ROI 정의의 정확성을 크게 향상시킬 수 있다. 둘째, Q, SSIM, G‑SSIM은 모두 전역적인 통계량에 기반하므로, 작은 국부 왜곡을 놓칠 수 있다. 최근 제안된 학습 기반 품질 지표(예: LPIPS)와 결합하면 인간 주관 평가와의 상관성을 더욱 강화할 수 있다. 셋째, 본 연구는 정적인 2차원 이미지에만 초점을 맞추었으며, 동영상 스트리밍이나 실시간 통신 환경에서의 시간적 일관성(temporal consistency) 평가가 포함되지 않았다.

종합적으로, 이 논문은 ROI 기반 품질 평가라는 새로운 관점을 제시함으로써 얼굴 인식, 영상 통화, 원격 의료 등 인간 얼굴이 핵심 정보인 응용 분야에 실용적인 인사이트를 제공한다. 향후 연구에서는 보다 정교한 ROI 추출, 최신 학습 기반 품질 지표와의 통합, 그리고 동영상 시퀀스에 대한 확장을 통해 실용성을 높일 필요가 있다.