SHAMISA 구조화된 관계 학습을 통한 무참조 이미지 품질 평가

SHAMISA는 인간 라벨 없이 왜곡된 이미지만으로 학습하는 비대조 자기지도 프레임워크이다. 연속적인 파라미터 공간에서 무한히 다양한 왜곡을 생성하고, 왜곡 메타데이터와 특징 공간에서 추출한 kNN 그래프를 결합한 이중 그래프를 이용해 부드러운 구조적 연관성을 명시적으로 제공한다. VICReg 기반 비대조 손실에 그래프 가중치를 부여해 학습하고, 사전학습된 인코더를 고정한 뒤 선형 회귀기로 품질을 예측한다. 실험 결과, 인간 라벨 없이도 합성·…

저자: Mahdi Naseri, Zhou Wang

본 논문은 무참조 이미지 품질 평가(NR‑IQA)의 핵심 과제인 대규모 인간 라벨 의존성을 극복하고자, ‘SHAMISA(Shaped Modeling of Implicit Structural Associations)’라는 새로운 비대조 자기지도 학습 프레임워크를 제안한다. 기존의 SSL‑IQA 방법들은 대체로 대조 손실을 사용해 콘텐츠 혹은 왜곡 유사성을 강제하지만, 이는 샘플링 편향과 false‑negative 문제를 야기한다. SHAMISA는 이러한 한계를 넘어, 두 단계의 핵심 메커니즘을 도입한다. 첫 번째 단계는 ‘구성적 왜곡 엔진(compositional distortion engine)’이다. KADID‑10K에 정의된 24개의 원자적 왜곡 함수를 7개의 카테고리(밝기, 블러, 공간, 노이즈, 색상, 압축, 선명도·대비)로 구분하고, 각 배치에서 하나의 카테고리만 심각도를 변화시키는 방식으로 연속적인 파라미터 공간을 샘플링한다. 구체적으로, 왜곡 함수의 원래 파라미터 범위를

SHAMISA 구조화된 관계 학습을 통한 무참조 이미지 품질 평가

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기