듀얼 도메인 네트워크를 이용한 CT 금속 아티팩트 감소

DuDoNet은 금속 임플란트로 인한 CT 영상의 아티팩트를 동시에 시노그램과 이미지 두 영역에서 복원하는 엔드‑투‑엔드 딥러닝 모델이다. 시노그램 보정 네트워크(SE‑Net)와 라돈 역변환 레이어(RIL), 이미지 보정 네트워크(IE‑Net)로 구성되며, 라돈 일관성 손실을 통해 두 도메인 간 일관성을 강제한다. 실험 결과, 기존 단일 도메인 MAR 방법들을 크게 능가한다.

저자: Wei-An Lin, Haofu Liao, Cheng Peng

듀얼 도메인 네트워크를 이용한 CT 금속 아티팩트 감소
본 논문은 금속 임플란트가 존재하는 환자의 CT 영상에서 발생하는 금속 아티팩트를 효과적으로 감소시키기 위한 새로운 딥러닝 프레임워크인 DuDoNet을 제안한다. 금속 아티팩트는 시노그램(투영 데이터) 영역에서 비선형 왜곡을 일으키며, 이를 단순히 이미지 도메인에서 보정하거나 시노그램을 보간하는 기존 방법들은 각각 이차 아티팩트와 구조적 손실이라는 문제점을 안고 있다. 저자들은 이러한 문제를 해결하기 위해 시노그램과 이미지 두 도메인을 동시에 학습시키는 이중 도메인 네트워크를 설계하였다. DuDoNet은 크게 세 부분으로 구성된다. 첫 번째는 시노그램 보정 네트워크(SE‑Net)이다. 입력 시노그램 Y와 금속 트레이스 마스크 M_t 를 받아, 선형 보간(LI)으로 초기 보정된 시노그램 Y_LI 를 생성한다. 이후 마스크 피라미드 U‑Net 구조를 통해 다중 스케일에서 M_t 를 직접 결합함으로써, 작은 금속 영역의 정보가 다운샘플링 과정에서 소실되는 것을 방지한다. SE‑Net은 Y_out = M_t ⊙ G_s(Y_LI, M_t) + (1−M_t) ⊙ Y_LI 로 출력되며, L1 손실을 이용해 실제 금속이 없는 시노그램 Y_gt 와의 차이를 최소화한다. 두 번째 핵심 구성 요소는 Radon Inversion Layer(RIL)이다. 전통적인 필터드 백프로젝션(FBP) 과정을 미분 가능하게 구현하여, 이미지 도메인 손실이 시노그램 파라미터에 직접 역전파될 수 있게 만든다. 구체적으로 팬‑빔 시노그램을 평행‑빔 형태로 변환(parallel‑beam conversion), Ram‑Lak 필터링, 그리고 백프로젝션의 세 단계로 구성된다. 이때 좌표 변환은 그리드 샘플링을 통해 구현되어 메모리 사용량을 크게 절감한다. RIL은 f_R(Y_out) 로 시노그램을 이미지로 복원하며, 이 과정에서 발생하는 미분 연산은 실제 투영 연산 P와 동일한 역할을 수행한다. 세 번째는 이미지 보정 네트워크(IE‑Net)이다. RIL을 통해 복원된 이미지 X̂ = f_R(Y_out) 를 입력받아, U‑Net 기반 잔차 학습을 수행한다. 최종 출력은 X_out = X_LI + G_i( X̂ , X_LI ) 로 정의되며, 여기서 X_LI는 선형 보간 시노그램을 FBP로 재구성한 이미지이다. IE‑Net 역시 L1 손실을 사용해 실제 금속이 없는 CT 이미지 X_gt 와의 차이를 최소화한다. 전체 손실 함수는 L = L_Gs + L_RC + L_Gi 로 구성된다. L_Gs는 시노그램 복원 손실, L_Gi는 이미지 복원 손실이며, L_RC는 라돈 일관성 손실로 정의된다. L_RC = ‖f_R(Y_out) – X_gt‖_1 은 이미지 도메인에서 발생하는 이차 아티팩트를 시노그램에 직접 피드백함으로써 두 도메인 간 일관성을 강제한다. 실험은 DeepLesion 데이터셋에서 추출한 4,000개의 CT 이미지와 100개의 금속 형태를 조합해 360,000개의 학습 샘플을 생성하고, 200개의 테스트 샘플을 별도 평가에 사용하였다. 시뮬레이션 과정에서는 다중 에너지 스펙트럼, 부분 볼륨 효과, 포아송 노이즈 등을 포함해 실제 임상 상황을 정밀하게 재현하였다. 비교 대상으로는 전통적인 LI, NMAR, 재가중 JSR, 그리고 최신 딥러닝 기반 CNNMAR, RDN‑2, pix2pix 등이 포함되었다. 정량적 평가지표인 PSNR과 SSIM, 그리고 정성적 시각 평가 모두에서 DuDoNet은 기존 방법들을 크게 앞섰으며, 특히 작은 금속 임플란트 주변의 섀도우와 스트리크를 효과적으로 복원하고 이차 아티팩트를 최소화하였다. 논문의 주요 기여는 다음과 같다. (1) 시노그램‑이미지 이중 도메인 학습을 가능하게 하는 차별화된 라돈 역변환 레이어(RIL)를 도입하여, 두 도메인 간의 손실 전파를 자연스럽게 연결하였다. (2) 마스크 피라미드 U‑Net을 통해 시노그램 복원 시 스케일‑인베리언스를 확보함으로써 작은 금속 영역도 정확히 복원할 수 있게 하였다. (3) 라돈 일관성 손실(L_RC)을 제안하여 이미지 도메인에서 발생하는 이차 아티팩트를 시노그램 도메인에 직접 피드백함으로써 전반적인 일관성을 강화하였다. 이러한 설계는 기존 MAR 연구의 한계를 극복하고, 다양한 CT 재구성 파이프라인에 적용 가능한 범용적인 프레임워크를 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기