블라인드 범용 베이지안 이미지 디노이징

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 가우시안 잡음에 대해 사전 잡음 레벨을 알 필요 없는 단일 딥러닝 모델을 제안한다. Gaussian 이미지 사전을 가정해 이론적으로 최적의 “fusion denoising” 해법을 도출하고, 이를 네트워크 구조에 구현한다. 합성 실험에서 보인 바와 같이 학습에 사용되지 않은 잡음 레벨에도 강인하게 일반화되며, 실제 회색조·컬러 이미지에서도 기존 최첨단 방법보다 평균 0.1 dB 이상 PSNR 향상을 달성한다.

상세 분석

이 연구는 이미지 디노이징 분야에서 ‘블라인드’와 ‘범용성’이라는 두 축을 동시에 만족시키려는 시도로, 기존 방법들이 사전에 잡음 표준편차 σ를 정확히 알아야 하거나, 특정 σ에 특화된 모델을 별도로 학습해야 하는 한계를 극복한다는 점에서 의미가 크다. 저자들은 먼저 이미지에 대한 가우시안 사전(p(x)∼𝒩(0,Σ))을 가정하고, 관측된 잡음 이미지 y = x + n (n∼𝒩(0,σ²I))에 대한 베이지안 최소 평균제곱오차(MMSE) 추정식을 전개한다. 이때 최적 추정은 두 개의 선형 필터, 즉 ‘노이즈 레벨에 따라 가중치를 조정하는 fusion’ 형태로 표현될 수 있음을 보인다. 구체적으로, Σ와 σ²를 이용해 Wiener 필터와 단순 평균 필터를 가중합하는 형태이며, 가중치는 σ에 대한 함수로 정의된다. 이러한 수식적 해를 ‘fusion denoising’이라 명명하고, 이를 딥러닝 프레임워크에 매핑한다.

네트워크 설계는 크게 두 부분으로 나뉜다. 첫 번째는 입력 이미지의 지역 통계(예: 평균, 분산)를 추정해 가우시안 사전의 파라미터 Σ를 근사하는 서브네트워크이며, 두 번째는 추정된 Σ와 입력 이미지 자체를 이용해 위에서 도출한 fusion 연산을 수행하는 모듈이다. 중요한 점은 σ에 대한 명시적 입력이 없다는 것인데, 대신 네트워크가 자체적으로 이미지 내 잡음 강도를 학습하고, 이를 기반으로 가중치를 동적으로 조정한다. 이를 위해 ‘Noise Level Learning’이라는 별도 손실 함수를 도입해, 실제 잡음 레벨과 네트워크가 예측한 레벨 사이의 L2 차이를 최소화한다.

실험에서는 먼저 합성 데이터셋(예: DIV2K, BSD500)을 사용해 σ∈

블라인드 범용 베이지안 이미지 디노이징

초록

상세 분석

댓글 및 학술 토론

의견 남기기