실험적 희소뷰 CT 복원을 위한 확산 모델 연구

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 물리적 Shepp‑Logan 팬텀을 이용해 실제 희소뷰 X‑ray CT 데이터를 획득하고, 합성 데이터와의 도메인 차이(‘domain shift’)와 전방 모델 불일치가 확산 기반 사전(prior) 적용에 미치는 영향을 체계적으로 분석한다. 세 종류의 훈련 데이터(표준 SL, 실험용 SL, 혼합)로 만든 확산 사전을 DDS(Decomposed Diffusion Sampling)와 결합해 다양한 투영 수와 해상도에서 재구성을 수행한다. 결과는(1) 심한 도메인 불일치는 모델 붕괴와 환각을 초래하지만, 다양성을 갖춘 혼합 사전이 더 견고함을 보이며, (2) 전방 모델 불일치는 샘플을 사전 매니폴드에서 멀어지게 하여 아티팩트를 유발하지만, annealed likelihood 스케줄링으로 완화 가능함을 보여준다. 실험적 벤치마크에서 성능 향상이 바로 실세계 데이터에 적용되지 않음을 강조한다.

상세 분석

이 연구는 확산 모델을 CT 복원에 적용할 때 두 가지 핵심 오류원, 즉 훈련 데이터와 실제 측정 사이의 도메인 시프트와 물리적 전방 모델의 불일치를 정량적으로 분리·평가한다는 점에서 의미가 크다. 먼저 저자들은 6 mm 두께의 PMMA 판에 레이저 절단으로 만든 물리적 Shepp‑Logan 팬텀을 제작하고, 901개의 투영을 수집해 실험 데이터를 확보한다. 훈련용 데이터는 세 가지 변형을 통해 생성한다. ‘표준 SL’ 데이터셋은 기존 Shepp‑Logan 파라미터에 가우시안 노이즈를 가해 10 k 장을 만든 것이며, ‘실험용 SL’은 실제 팬텀의 타원 파라미터를 기반으로 동일한 방식으로 변형한다. ‘혼합’ 데이터셋은 두 파라미터 집합을 베르누이 확률 π로 섞어 다양성을 확보한다. 이렇게 만든 세 개의 확산 사전(f_std, f_exp, f_mix)은 동일한 네트워크 구조와 코사인 노이즈 스케줄을 사용해 학습된다.

복원 단계에서는 Decomposed Diffusion Sampler(DDS)를 채택한다. DDS는 기존 DPS가 요구하는 고비용 Jacobian 대신, 현재 노이즈 단계의 이미지에 대해 CG 기반의 M‑step을 수행해 ‘클린 매니폴드’로 투사한다. 이때 물리적 팬텀에 맞춘 fan‑beam 연산자를 전방 모델 A로 사용하고, 데이터 일관성 손실 ℓ(x)=½‖y−Ax‖²의 그래디언트를 likelihood term으로 삽입한다. 중요한 설계는 ‘annealed likelihood schedule’이다. γ_t를 고정값 대신 선형 감소 혹은 상수값(0.5, 5 등)으로 조정해, 초기 단계에서는 prior에 크게 의존하고 후반부에서는 data term을 점진적으로 강화한다. 이는 전방 모델 불일치가 샘플을 매니폴드 밖으로 끌어내는 현상을 억제하고, 샘플링 단계(NFE)를 크게 줄이면서도 PSNR/SSIM을 유지하게 만든다.

실험 결과는 네 가지 테스트 도메인(표준 시뮬레이션, 설계 기반 시뮬레이션, 재구성 기반 시뮬레이션, 실제 측정)에서 PSNR와 SSIM을 비교한다. ‘표준 SL’ 사전은 동일 도메인(y_sim(std))에서 최고 성능을 보이지만, 실험용 팬텀에 적용하면 급격히 성능이 떨어진다. 반면 ‘혼합’ 사전은 도메인 전이가 있을 때도 5 dB 정도의 PSNR 이득을 유지하며, 특히 투영 수가 5 개 이상일 때 강인함을 드러낸다. 이는 다양한 형태의 엘립스를 학습함으로써 사전이 보다 넓은 이미지 매니폴드를 커버하게 된 결과이다. 전방 모델 불일치에 대해서는 y_sim(recon)과 y_exp 사이의 격차가 명확히 나타난다. 라인 프로파일 분석에서 실험 데이터는 작은 구멍 주변에서 위치 오프셋과 형태 왜곡을 보이며, 이는 likelihood term이 과도하게 작용해 사전 매니폴드에서 벗어나기 때문이다. 해상도를 128→512로 높여도 격차가 완전히 사라지지는 않으며, 물리적 캘리브레이션 오류, 빔 하드닝, 산란 등이 여전히 주요 오류원임을 확인한다. 마지막으로 표 Ⅱ는 일정한 γ와 선형 감소 γ 스케줄을 비교한다. 선형 감소(γ_max=5) 방식이 가장 높은 SSIM(≈0.85)과 PSNR(≈24 dB)을 제공하며, 특히 적은 샘플링 단계(NFE=10)에서도 성능 저하가 최소화된다. 이는 annealed likelihood가 전방 모델 불일치를 보정하면서도 계산 효율성을 크게 향상시킨다.

요약하면, (1) 도메인 시프트가 심하면 사전이 붕괴하고 환각이 발생하지만, 훈련 데이터에 다양성을 주입한 혼합 사전은 실험적 변이에도 강인함을 보인다. (2) 전방 모델 불일치는 데이터 일관성 항이 사전 매니폴드에서 벗어나게 만들지만, γ_t를 단계적으로 감소시키는 annealed 스케줄링이 이를 완화한다. (3) 실험적 벤치마크 없이 단순히 합성 데이터에서 얻은 성능 향상이 실제 CT 시스템에 바로 적용되지는 않으며, 향후 연구는 보다 정밀한 물리 모델링과 다양한 실제 데이터셋을 통한 검증이 필요하다.

실험적 희소뷰 CT 복원을 위한 확산 모델 연구

초록

상세 분석

댓글 및 학술 토론

의견 남기기