그룹CDL: 학습된 그룹희소성 및 순환 어텐션을 통한 해석 가능한 잡음제거와 압축감지 MRI
초록
본 논문은 기존 딥러닝 기반 비국소 자기유사성 모델을 해석 가능한 형태로 재구성한다. Convolutional Dictionary Learning을 기반으로 한 CDLNet에 이미지‑적응형 그룹희소성(그룹 임계값)과 순환‑희소 어텐션(CircAtt)을 도입해, 잡음제거와 압축감지 MRI 복원에서 최첨단 블랙박스 모델과 동등하거나 우수한 성능을 달성한다. 또한 잡음 수준 불일치에 대한 강인성을 보인다.
상세 분석
본 연구는 두 가지 핵심 아이디어를 결합한다. 첫째, 기존 CDLNet에서 사용하던 ℓ₁ 기반 소프트‑스레숄딩을 이미지‑적응형 그룹‑스레숄딩으로 확장한다. 그룹‑스레숄딩은 인접 행렬 Γ에 의해 정의된 픽셀 간 유사성을 활용해, 동일 그룹에 속하는 잠재 픽셀들의 채널‑와이즈 스파스 패턴을 공동으로 억제한다. Γ는 비국소 자기유사성을 포착하는 어텐션 매트릭스로, 학습 가능한 네트워크가 입력 이미지에 따라 동적으로 생성한다. 이 과정은 기존의 패치‑기반 비국소 어텐션(PbDA)의 중복 연산과 패치 경계 아티팩트를 제거한다.
둘째, Γ를 효율적으로 계산하기 위해 순환‑희소 어텐션(CircAtt)을 제안한다. CircAtt은 블록‑대각선 형태의 순환( circulant ) 행렬을 이용해 전체 이미지에 걸친 비국소 유사성을 한 번의 희소 행렬 곱으로 구현한다. 이는 (i) 연산 복잡도를 O(N·W) 수준으로 낮추어 대형 이미지와 전역 아티팩트(예: MRI의 앨리어싱) 처리에 적합하게 하고, (ii) 컨볼루션 구조와의 시프트 불변성을 유지한다.
수학적으로는 BPDN 문제를 Proximal Gradient Method(PGM)로 풀고, ψ를 그룹‑희소성 정규화(식 6)로 정의한다. proximal 연산은 근사 그룹‑임계값 연산 GT(식 7)으로 구현되며, 이는 ST(소프트‑스레숄딩)와 동일하지만 스케일링 팩터 ξ=‖(Iₘ⊗Γ)z‖₂가 픽셀‑별로 변한다. 따라서 네트워크는 “어텐션 → 에너지 추정 → 스레숄딩”이라는 순환 흐름을 갖는다.
학습 단계에서는 딕셔너리 D와 Γ를 모두 파라미터화하고, 각 레이어를 PGM 한 스텝에 대응시켜 unrolled 구조를 만든다. 이는 해석 가능성을 보존하면서도 end‑to‑end 미분이 가능하도록 설계되었다. 실험에서는 자연 이미지 잡음제거에서 SwinIR, Restormer 등 최신 트랜스포머 기반 비국소 모델과 비교해 PSNR/SSIM 면에서 동등하거나 약간 우수한 결과를 얻었다. 압축감지 MRI에서는 기존 딥러닝 방법보다 높은 재구성 품질과 빠른 추론 속도를 보였으며, 특히 훈련 시 사용한 잡음 수준과 실제 테스트 시 잡음 수준이 다를 때도 성능 저하가 거의 없었다. 이는 ℓ₁ 기반 CDLNet에서 이미 보고된 잡음‑적응형 스레숄딩 메커니즘을 그룹‑희소성으로 자연스럽게 확장한 결과라 할 수 있다.
전반적으로 그룹‑희소성 및 순환‑희소 어텐션을 통한 해석 가능한 설계는 (1) 비국소 자기유사성의 표현력을 유지하면서도 (2) 블랙박스 네트워크가 갖는 불투명성을 제거하고, (3) 파라미터 효율성과 잡음‑불일치 강인성을 동시에 달성한다는 점에서 의미가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기