다중 슬라이스 융합을 이용한 4D X‑레이 CT 재구성

본 논문은 4차원(공간‑시간) X‑레이 CT 재구성을 위해, 저차원(2D·3D) CNN 기반 디노이저들을 다중 에이전트 합의 평형(MACE) 프레임워크로 결합한 “다중 슬라이스 융합(Multi‑Slice Fusion)” 방법을 제안한다. 3개의 2.5D CNN 디노이저와 측정 모델을 병렬로 실행함으로써, 기존 4D MRF 기반 MBIR 대비 재구성 품질을 크게 향상시키면서도 학습·계산 비용을 현실적인 수준으로 유지한다.

저자: Soumendu Majee, Thilo Balke, Craig A. J. Kemp

다중 슬라이스 융합을 이용한 4D X‑레이 CT 재구성
본 논문은 4차원(공간‑시간) X‑레이 CT 재구성 문제를 해결하기 위해, 저차원(2D·3D) 딥러닝 기반 디노이저들을 다중 에이전트 합의 평형(Multi‑Agent Consensus Equilibrium, MACE) 프레임워크로 결합한 “다중 슬라이스 융합(Multi‑Slice Fusion)” 알고리즘을 제안한다. 연구 배경으로는 기존 4D 재구성 방법이 모델 기반 반복 재구성(MBIR)과 간단한 4D MRF 사전 모델에 의존해 왔으며, 이러한 사전 모델은 복잡한 시공간 구조를 충분히 포착하지 못한다는 점을 들었다. 최근 Plug‑and‑Play(P&P) 기법이 고성능 디노이저를 사전으로 활용할 수 있음을 보였지만, 최신 디노이저(BM4D, CNN)는 주로 2D·3D에 최적화돼 있어 4D 이상 차원에 직접 적용하기엔 메모리·연산 부담이 크고, 학습용 고차원 데이터가 부족하다는 한계가 있다. 이에 저자는 세 가지 2.5D CNN 디노이저를 설계한다. 각 디노이저는 5개의 연속 2D 슬라이스를 채널로 받아 중앙 슬라이스를 복원하는 구조이며, 각각 xy, yz, zx 평면에서 공간적 스무딩을 수행한다. 이러한 디노이저들은 “에이전트”로서 MACE에 입력되고, 측정 모델에 대한 데이터 적합 연산자 F와 함께 총 K+1개의 에이전트를 구성한다. MACE는 각 에이전트의 출력이 동일해지는 합의점(Equilibrium)을 찾는 문제로, 이를 고정점 방정식 L(X)=G(X) 형태로 표현한다. 여기서 L는 각 에이전트의 개별 연산, G는 모든 상태 벡터의 가중 평균이다. 합의점을 찾기 위해 부분 업데이트 Mann iteration을 사용하며, F 연산은 완전 최적화 대신 몇 차례 ICD 업데이트만 수행해 계산 효율을 높인다. 학습 단계에서는 실제 4D CT 데이터가 부족하므로, 3D 공간만을 이용해 저노이즈 CT 볼륨을 구축하고, 63,000개의 40×40×5 패치를 추출한다. 패치에 무작위 회전·플립·미러링을 적용하고, 인공적인 가우시안 노이즈(σ)를 추가해 디노이저를 지도학습한다. 이때 사용되는 노이즈는 MACE 내부에서 발생하는 인공적인 “quadratic norm” 노이즈와 일치하도록 설계되었다. 계산 인프라는 이질적 클러스터를 전제로 한다. CPU 노드(20코어 Kaby Lake)에서 콘빔 투영 역변환(데이터 적합) 작업을 수행하고, GPU 노드(NVIDIA Tesla P100)에서 세 개의 CNN 디노이저를 병렬로 실행한다. 에이전트 간 통신은 평균 연산만 필요하므로 네트워크 부하가 최소화된다. 실험에서는 실제 동적 콘빔 스캔(유리병, 고무 스톱퍼, 알루미늄 크림프) 데이터를 사용해, 제안 방법을 4D MRF 기반 MBIR(QG‑GMRF) 및 전통적인 3D FBP와 비교하였다. 정량적 지표(PSNR, SSIM)와 시각적 평가 모두에서 다중 슬라이스 융합이 노이즈 억제와 세부 보존 사이에서 최적의 균형을 이루며, 특히 움직이는 경계면에서 뚜렷한 개선을 보였다. 또한 단일 CNN을 이용한 MBIR+H_xy,t 등과 비교했을 때, 다중 디노이저를 결합함으로써 시공간 전반에 걸친 일관된 스무딩 효과를 얻을 수 있음을 확인했다. 본 연구의 주요 기여는 다음과 같다. 첫째, 고차원 사전 모델을 별도 설계하지 않고 저차원 CNN을 재활용함으로써 차원 저주 문제를 회피한다. 둘째, MACE 프레임워크를 이용해 여러 사전 모델을 수학적으로 엄밀하게 결합하고, 수렴성을 보장한다. 셋째, 이질적 클러스터 기반 병렬 구현을 통해 실시간 혹은 준실시간 수준의 계산 효율을 달성한다. 한계점으로는 디노이저 수와 축 선택이 문제에 따라 최적화가 필요하고, 인공적인 가우시안 노이즈가 실제 CT 측정 노이즈와 차이가 있을 수 있다는 점, 그리고 MACE 파라미터(β, ρ 등)의 튜닝이 필요하다는 점을 들 수 있다. 향후 연구에서는 실제 4D 훈련 데이터를 확보하거나, 물리 기반 노이즈 모델을 디노이저 학습에 통합하는 방안을 모색할 예정이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기