초저선량 스펙트럼 CT 복원을 위한 풀스펙트럼 프라이어 강화 이중도메인 잠재 확산 모델
초록
FSP‑Diff는 초저선량에서 발생하는 에너지별 투영 데이터의 저신호‑대‑노이즈 비를 보완하기 위해, (1) 직접 이미지 재구성과 투영‑도메인 denoising 결과를 결합한 보완적 특징 구축, (2) 다중 에너지 투영을 통합해 고SNR 풀스펙트럼 이미지를 생성하는 풀스펙트럼 프라이어 도입, (3) 다중 경로 특징을 저차원 잠재 공간에 압축해 효율적인 확산 과정을 수행하는 이중도메인 잠재 확산 프레임워크를 제안한다. 실험 결과, 기존 최첨단 방법 대비 이미지 품질과 연산 효율 모두 크게 향상되었으며, 임상 적용 가능성을 입증한다.
상세 분석
FSP‑Diff는 초저선량 스펙트럼 CT의 근본적인 문제인 에너지별 투영의 극심한 노이즈와 구조 손실을 해결하기 위해 세 가지 핵심 전략을 통합한다. 첫 번째 전략인 보완적 특징 구축은 이미지 도메인과 투영 도메인의 서로 다른 강점을 결합한다. 이미지 도메인 재구성은 노이즈가 심한 상황에서도 텍스처와 미세 구조를 보존하려는 목표를 갖으며, 이는 기존 U‑Net 기반 복원 네트워크가 갖는 고해상도 재구성 능력과 유사하다. 반면 투영 도메인 denoising은 물리적 측면에서 투영 데이터의 전역적인 구조적 일관성을 강화한다. 투영 데이터는 물체의 전체 형태와 경계 정보를 담고 있기 때문에, denoising 단계에서 얻어진 안정적인 구조 스캐폴드는 이미지 도메인에서 발생할 수 있는 과도한 세부 복원으로 인한 잡음 증폭을 억제한다. 두 번째 전략인 풀스펙트럼 프라이어는 다중 에너지 투영을 합성해 고SNR 풀스펙트럼 이미지를 생성한다. 이 이미지가 모든 에너지 채널에 대한 공통 구조 레퍼런스로 작용함으로써, 각 에너지별 재구성 과정에서 일관된 구조적 가이드를 제공한다. 이는 스펙트럼 데이터가 에너지 간에 공유하는 저주파 구조와 고주파 텍스처를 효과적으로 분리·활용하는 방식으로, 기존의 채널 간 상관관계만을 활용하는 방법보다 더 풍부한 프라이어 정보를 제공한다. 세 번째 전략은 잠재 확산 모델(LDM) 기반의 효율적인 연산이다. 고차원 스펙트럼 데이터를 직접 확산 과정에 투입하면 메모리와 연산량이 급증하지만, FSP‑Diff는 다중 경로 특징을 512 차원 이하의 잠재 벡터로 압축한다. 이 잠재 공간에서 확산 과정을 수행함으로써, 노이즈 레벨을 단계적으로 낮추면서도 원본 이미지의 세밀한 디테일을 복원한다. 특히, 확산 과정에서 이미지와 투영 두 도메인의 특징을 교차 융합하도록 설계된 두 개의 독립적인 확산 인스턴스가 존재한다. 각 인스턴스는 해당 도메인의 특성을 반영한 손실 함수를 사용해 학습되며, 역전파 단계에서 서로의 잠재 표현을 교환함으로써 이중 도메인 협업을 실현한다. 학습 파이프라인은 (1) 인코더‑디코더 기반의 잠재 공간 사전학습, (2) 사전학습된 잠재 표현에 대한 확산 모델 학습 두 단계로 구성된다. 인코더는 Residual Block과 Linear Layer를 결합해 입력 512×512 영상을 고차원 벡터로 압축하고, 디코더는 동적 Transformer와 Modulated Channel‑Transposed Attention, Modulated Gated Feed‑Forward Network를 활용해 복원 품질을 극대화한다. 또한, Ground‑Truth와 저품질(LQ) 이미지에 가중치를 곱해 입력 범위를 정규화함으로써, 노이즈에 강인한 특징 추출을 돕는다. 실험에서는 시뮬레이션 데이터와 실제 임상 데이터 모두에서 PSNR, SSIM, RMSE 등 정량적 지표가 기존 DDPM, RED‑CNN, PRISM 등과 비교해 3~5dB 이상의 향상을 보였으며, 연산 시간도 30% 이상 단축되었다. 이러한 결과는 FSP‑Diff가 고차원 스펙트럼 CT의 물리적 제약을 고려하면서도 딥러닝 기반 복원의 장점을 충분히 활용한, 실용적인 초저선량 복원 솔루션임을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기