고차원 MRF 기반 변분 모델로 구현한 곱셈 잡음 감소
초록
본 논문은 자연 이미지 통계에 기반한 Fields of Experts(FoE) 고차원 MRF 사전 모델을 이용해 SAR·초음파 등에서 발생하는 곱셈(스펙클) 잡음을 제거하는 새로운 변분 프레임워크를 제안한다. 비선형 로그 변환과 iPiano 비볼록 최적화 알고리즘을 결합해 비선형 데이터 항을 효율적으로 풀고, GPU 구현을 통해 1초 이내의 실시간 성능을 달성한다. 실험 결과는 최신 SAR‑BM3D와 거의 동등한 PSNR/SSIM을 보여준다.
상세 분석
이 연구는 이미지 복원 분야에서 널리 사용되는 총체적 사전 모델인 Fields of Experts(FoE)를 곱셈 잡음(스펙클) 감소 문제에 적용한 최초의 시도 중 하나이다. FoE는 다수의 선형 필터와 비선형 로렌츠 잠재 함수를 결합해 자연 이미지의 고차 통계 특성을 학습한다. 논문에서는 기존에 학습된 48개의 7×7 필터와 가중치 θ_i 를 그대로 사용함으로써 사전 학습 단계에 대한 부담을 최소화한다.
곱셈 잡음은 SAR 이미지에서 흔히 나타나는 현상으로, 관측값 f는 실제 반사율 u의 제곱근에 Nakagami(또는 Gamma) 분포가 곱해진 형태를 가진다. 이를 로그 우도 형태로 변환하면 데이터 항 D(u,f)=L·(2·log u+f²/u²) 가 도출되는데, 이는 u>0 에 대해 비볼록함을 의미한다. 비볼록성을 그대로 두면 최적화가 어려워지므로, 저자들은 두 가지 접근을 제시한다. 첫 번째는 로그 변환 w=log u 를 적용해 D를 볼록 함수 형태(2·w+f²·e^{-2w}) 로 바꾸는 방법이며, 두 번째는 전통적인 Csiszár I‑divergence를 차용해 D(u,f)=½·(u²−2f²·log u) 로 대체하는 방법이다. 두 데이터 항은 각각 텍스처가 풍부한 영역과 균일한 영역에서 서로 보완적인 성능을 보였으며, 이를 가중합 λ₁·D₁+λ₂·D₂ 로 결합한 최종 모델(III.1)을 제안한다.
비볼록 최적화는 iPiano 알고리즘을 이용한다. iPiano는 관성(모멘텀) 항을 포함한 전방‑후방 분할 방식으로, 부드러운 비볼록 함수 F와 볼록(비스무스) 함수 G 로 구성된 문제 min F(u)+G(u) 를 효율적으로 해결한다. 여기서 F는 FoE 사전의 비선형 부분이며, G는 위에서 정의한 볼록 데이터 항이다. F의 그래디언트는 필터 컨볼루션과 로렌츠 함수의 미분을 이용해 쉽게 계산할 수 있고, G에 대한 근접 연산은 뉴턴 방법을 통해 10회 이하의 반복으로 수렴한다.
실험에서는 합성 스펙클 잡음(L=1,3,8)과 실제 SAR 이미지(L=5)를 대상으로 PSNR·SSIM을 측정하였다. 표준 테스트 이미지와 68개의 Berkeley 데이터셋에 대해 제안 모델은 SAR‑BM3D와 거의 동일한 평균 성능을 보였으며, 특히 텍스처가 풍부한 영역에서 더 높은 구조 유사성을 기록했다. 다만 L이 매우 낮은 경우(예: L=1)에는 국소 모델의 한계로 블록형 아티팩트가 발생했으며, 이는 비국소적 비슷한 패치를 활용하는 BM3D 계열에 비해 약점으로 작용한다.
연산 속도 측면에서 저자들은 순수 MATLAB 구현으로 27 초가 소요되는 반면, CUDA 기반 GPU 구현으로 512×512 이미지에 대해 0.6 초, 256×256 이미지에 대해 0.2 초로 실시간 수준에 근접함을 입증했다. 이는 FoE 사전이 단순 컨볼루션 연산으로 구성돼 병렬화에 최적화될 수 있기 때문이다.
전체적으로 이 논문은 FoE 사전과 최신 비볼록 최적화 기법을 결합해 곱셈 잡음 감소 문제에 새로운 해법을 제시했으며, 정확도와 속도 모두에서 기존 최첨단 방법과 경쟁 가능한 결과를 보여준다. 향후 비국소적 정보(예: 비슷한 패치 검색)를 통합하거나, 학습된 FoE 필터를 SAR 특성에 맞게 재학습한다면 더욱 향상된 성능을 기대할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기