GPU 기반 저선량 원뿔빔 CT 고속 재구성
본 연구는 저선량 및 불완전한 투사 데이터를 이용해 고품질 CBCT 영상을 실시간에 가깝게 복원하는 GPU 가속 알고리즘을 제안한다. 데이터 적합도 항과 전변량(TV) 정규화 항을 결합한 에너지 함수를 최소화하기 위해 전방‑후방 분할(forward‑backward splitting) 방식을 GPU 친화적으로 구현하고, 다중 격자(multigrid) 기법을
초록
본 연구는 저선량 및 불완전한 투사 데이터를 이용해 고품질 CBCT 영상을 실시간에 가깝게 복원하는 GPU 가속 알고리즘을 제안한다. 데이터 적합도 항과 전변량(TV) 정규화 항을 결합한 에너지 함수를 최소화하기 위해 전방‑후방 분할(forward‑backward splitting) 방식을 GPU 친화적으로 구현하고, 다중 격자(multigrid) 기법을 도입하였다. 디지털 및 물리적 팬텀 실험에서 40개의 투사만으로도 임상적 정렬 정확도를 만족시키며, 0.1 mAs/투사 수준에서도 재구성이 가능함을 확인하였다. 재구성 시간은 약 130 초로 기존 반복법 대비 100배 이상 가속되었다.
상세 요약
이 논문은 방사선 치료 과정에서 환자 정렬을 위한 이미지 가이드에 필수적인 원뿔빔 CT(CBCT)의 방사선 피폭을 크게 낮추는 방법론을 제시한다. 핵심 아이디어는 투사 수를 크게 감소시키고(mAs를 낮춤) 동시에 고성능 그래픽 처리 장치(GPU)를 활용해 복잡한 반복 재구성 과정을 실시간에 가깝게 수행하는 것이다.
먼저, 저선량·저투사 상황에서 발생하는 데이터의 고노이즈와 데이터 부족 문제를 해결하기 위해 에너지 함수 E(f)=‖Af−p‖₂²+λ·TV(f) 를 정의한다. 여기서 A는 투사 연산자, p는 측정된 투사 데이터, TV(f)는 전변량 정규화 항이며 λ는 정규화 강도 파라미터이다. 데이터 적합도 항은 최소 제곱법으로 노이즈에 민감하지만, TV 정규화는 영상의 경계는 보존하면서 잡음을 효과적으로 억제한다는 장점이 있다.
알고리즘 구현 측면에서는 전방‑후방 분할(FBS) 방법을 선택하였다. FBS는 데이터 적합도 항에 대한 그래디언트 하강 단계(전방 단계)와 TV 정규화에 대한 근접 연산(후방 단계)을 번갈아 수행한다. 이때 전방 단계는 투사·역투사 연산을 포함하는데, 이는 GPU에서 대규모 행렬-벡터 연산으로 구현될 때 메모리 접근 패턴이 최적화될 수 있다. 후방 단계에서는 TV의 근접 연산을 Chambolle‑Pock 알고리즘이나 Fast Gradient Projection(FGP) 방식으로 구현했으며, 이 역시 픽셀 단위 병렬 처리가 가능하도록 설계되었다.
다중 격자(multigrid) 기법은 초기 해를 저해상도 격자에서 빠르게 얻은 뒤, 점진적으로 고해상도 격자로 보간하면서 반복 횟수를 크게 줄인다. 이는 특히 GPU 메모리 제한 하에서 큰 부피 데이터를 다룰 때 메모리 사용 효율을 극대화하고, 수렴 속도를 가속화한다.
실험에서는 디지털 NCAT 팬텀과 실제 환자 데이터를 사용해 40개의 투사(≈360도 회전에서 1° 간격)만으로도 IGRT 정렬에 충분한 이미지 품질을 달성함을 보였다. 물리적 Catphan 및 Rando 팬텀 실험에서는 0.1 mAs/투사 수준에서도 TV 정규화가 잡음을 효과적으로 억제해 선명한 구조를 복원하였다. 정량적 평가는 RMSE, SSIM, 그리고 정렬 오차(translation, rotation) 등을 포함했으며, 모두 기존 360 투사·0.4 mAs 프로토콜 대비 30배 이상 감소된 선량에서도 임상 허용 기준을 만족하였다.
성능 측면에서 NVIDIA Tesla C1060 GPU(≈1 TFLOPS) 상에서 전체 재구성 시간은 약 130 초였으며, 이는 동일한 파라미터를 CPU 기반 반복법으로 수행했을 때 약 3 시간 이상 소요되는 것에 비해 100배 이상의 가속을 의미한다. 메모리 사용량은 2 GB 이하로 제한되어 일반적인 연구용 워크스테이션에서도 적용 가능하다.
결론적으로, 이 연구는 저선량 CBCT를 실시간에 가깝게 제공함으로써 방사선 치료 과정에서 환자 피폭을 크게 감소시키고, 동시에 임상 워크플로우에 지장을 주지 않는 실용적인 솔루션을 제시한다. 향후 다중 에너지 투사, 비정형 궤도, 그리고 딥러닝 기반 사전학습 정규화와 결합한다면 더욱 높은 재구성 품질과 속도를 기대할 수 있다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...