딥 그래프 컨볼루션 기반 이미지 노이즈 제거

본 논문은 이미지의 비국소 자기유사성을 그래프 신경망 형태로 모델링하여, 동적으로 구성되는 그래프 컨볼루션 레이어를 통해 기존 CNN의 한계를 극복하고, 합성 가우시안 잡음 및 실제 잡음 상황에서 최첨단 성능을 달성한 방법을 제안한다.

저자: Diego Valsesia, Giulia Fracastoro, Enrico Magli

딥 그래프 컨볼루션 기반 이미지 노이즈 제거
본 논문은 이미지 디노이징 분야에서 비국소 자기유사성이라는 강력한 사전 정보를 딥러닝에 효과적으로 통합하기 위해, 그래프 신경망(Graph Neural Network, GNN) 개념을 확장한 새로운 네트워크 구조인 GCDN(Graph‑Convolutional Denoising Network)을 제안한다. 기존의 CNN 기반 디노이징 모델은 국소적인 2‑D 컨볼루션 커널에 의존해 제한된 수용 영역만을 활용하므로, 이미지 내에서 멀리 떨어져 있지만 구조적으로 유사한 패치를 활용하는 비국소 기법을 충분히 반영하지 못한다. 반면, 전통적인 비국소 모델(BM3D, WNNM 등)은 패치 매칭과 협업 필터링을 통해 뛰어난 성능을 보였지만, 학습 가능한 파라미터가 부족하고 복잡한 파이프라인을 필요로 한다. GCDN은 이러한 두 접근법의 장점을 결합한다. 네트워크는 입력 이미지에 대해 먼저 3개의 멀티스케일 2‑D 컨볼루션 브랜치를 적용해 로컬 특징을 추출하고, 이를 바탕으로 각 레이어의 특징 맵을 정점으로 하는 K‑최근접 이웃 그래프를 동적으로 구성한다. 그래프의 엣지는 두 정점 사이의 특징 차이 dᵢⱼ=Hⱼ−Hᵢ 로 라벨링되며, 이 라벨을 입력으로 하는 완전 연결 서브네트워크 F가 엣지‑조건부 가중치 행렬 Θᵢⱼ를 생성한다. 또한, 거리 기반 어텐션 γᵢⱼ=exp(−‖dᵢⱼ‖²/2δ)를 곱해 먼 특징을 가진 엣지를 자동으로 억제한다. 이렇게 정의된 Edge‑Conditioned Convolution(ECC)은 기존 GCN, GIN, MoNet 등에서 사용되는 스칼라 가중치와 달리, 각 엣지마다 고차원 행렬 변환을 수행함으로써 비국소 필터링을 매우 유연하게 구현한다. ECC의 파라미터 수가 급증하는 문제를 해결하기 위해 저자는 두 가지 경량화 전략을 도입한다. 첫째, F를 얕은 MLP(예: 2‑layer)로 제한하고, 출력 차원을 적절히 축소해 메모리 사용량을 감소시킨다. 둘째, 그래프 구축 시 3×3 로컬 이웃을 제외하고 K개의 비국소 이웃만을 선택함으로써 그래프의 희소성을 유지하고, 역전파 시 그래프 전파 경로를 제한해 기울기 소실을 방지한다. 네트워크 전체 구조는 전형적인 잔차 학습 방식을 채택한다. 입력 이미지와 동일한 차원의 잡음 추정값을 출력하도록 설계했으며, 이는 학습 수렴 속도를 크게 향상시킨다. 전처리 단계 이후, 고역통과(HPF) 블록과 저역통과(LPF) 블록이 교차 배치된다. 각 블록은 3×3 로컬 컨볼루션 뒤에 동일한 그래프를 공유하는 3개의 ECC 레이어를 포함한다. HPF 블록은 고주파 성분(에지, 텍스처) 강화를 목표로 하며, LPF 블록은 저주파 성분(평탄 영역) 정규화를 담당한다. 모든 레이어는 배치 정규화와 Leaky ReLU 비선형성을 적용해 학습 안정성을 확보한다. 최종 레이어는 그래프 컨볼루션을 통해 특징 맵을 직접 이미지 차원으로 매핑한다. 실험에서는 합성 가우시안 잡음(σ=15,25,50)과 실제 카메라 잡음(DND, SIDD 데이터셋)을 대상으로 기존 최첨단 모델(DnCNN, NLRN, N3Net, UNLNet 등)과 비교하였다. PSNR 기준에서 GCDN은 평균 0.3~0.6dB의 향상을 보였으며, SSIM에서도 유의미한 개선을 기록했다. 시각적 평가에서는 특히 복잡한 텍스처와 얇은 선 구조에서 경계 보존이 뛰어나, 기존 모델이 흔히 발생시키는 블러링 현상을 크게 감소시켰다. 추가적인 분석에서는 그래프 연결 수 K(예: 5,10,15)와 어텐션 파라미터 δ가 성능에 미치는 영향을 정량화하였다. K가 너무 작으면 비국소 정보가 충분히 활용되지 않아 성능이 저하되고, 지나치게 크면 잡음에 민감해지는 경향을 보였다. δ는 거리 기반 어텐션의 스케일을 조절해, 적절한 값(δ≈0.1~0.2)에서 최적의 잡음 억제와 특징 보존을 달성했다. 또한, ECC 파라미터 규모를 축소해도 성능 저하가 미미함을 확인함으로써, 제안된 경량화가 실제 모바일/임베디드 환경에서도 적용 가능함을 입증했다. 마지막으로, 저자는 제안된 GCDN을 근사 proximal gradient descent와 연결시켜, 그래프 기반 총 변동(total variation) 정규화가 네트워크 내부에서 어떻게 구현되는지를 이론적으로 설명한다. 이 해석은 네트워크가 학습 과정에서 비국소 정규화 항을 자동으로 최적화함을 보여주며, 기존의 수동 설계 기반 비국소 필터와 차별화되는 점이다. 결론적으로, 이 논문은 (1) 특징 공간 기반 동적 그래프 구축을 통한 비국소 정보 획득, (2) Edge‑Conditioned Convolution의 경량화와 학습 가능성 확보, (3) 최적화 이론과의 연계 설계라는 세 축을 결합해, 기존 CNN 기반 디노이징의 한계를 근본적으로 뛰어넘는 새로운 패러다임을 제시한다. 향후 연구에서는 그래프 구조를 더 정교하게 설계하거나, 다른 복원·재구성 문제(초해상도, 복원 등)에 적용하는 방향이 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기