물리 기반 양방향 주파수 인식 컨볼루션 및 확산 모델을 이용한 사인그램 복원

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 CT에서 발생하는 희소 뷰 사인그램의 손실을 복원하기 위해, 사인그램의 각도‑검출기 축에 대한 방향성 주파수 특성을 명시적으로 모델링하고 물리적 일관성을 강제하는 새로운 확산 기반 프레임워크 FCDM을 제안한다. 양방향 주파수‑도메인 컨볼루션(BFDC)으로 공간·주파수 정보를 분리 추출하고, 총 흡수 보존 및 주파수 일관성 손실을 포함한 물리‑가이드 손실을 적용한다. 또한 각도 정보를 포함한 Fourier‑enhanced mask embedding(FEME)과 주파수‑가중 노이즈 스케줄링(FANS)을 통해 확산 과정에서 전역 구조와 고주파 디테일을 균형 있게 복원한다. 실험 결과, 다양한 희소 뷰 설정에서 SSIM > 0.93, PSNR ≈ 31 dB를 달성하며 기존 방법들을 크게 능가한다.

상세 분석

FCDM은 사인그램 복원을 위해 세 가지 핵심 문제를 동시에 해결한다. 첫째, 사인그램은 Radon 변환에 의해 생성되므로 detector 축과 projection angle 축이 물리적으로 서로 다른 의미를 갖는다. 기존 2D 컨볼루션은 이 두 축을 동일하게 처리해 방향성 정보를 손실시키지만, 본 논문은 BFDC라는 양방향 주파수‑도메인 컨볼루션을 도입해 각각의 축에 대해 별도의 실수형 푸리에 변환(RFFT)을 수행하고, 축별 주파수 커널(K_w, K_h)과 Hadamard 곱을 적용한 뒤 역변환한다. 이렇게 얻은 l_w와 l_h는 각 축의 스펙트럼 특성을 강조하며, 공간 컨볼루션 결과 h_s와 가중치 α_w, α_h를 통해 최종 특성 l에 융합된다. 둘째, 사인그램 복원은 전역 물리 제약을 만족해야 한다. 저자는 총 흡수 보존 손실(L_absorp)을 정의해 각도별 투영값의 적분과 역 Radon 변환을 통한 전체 흡수량을 일치시키도록 유도한다. 이는 복원된 사인그램이 비물리적 밝기 변화를 일으키지 않도록 하는 핵심 정규화이다. 셋째, 확산 과정 자체를 사인그램 특성에 맞게 조정한다. 기존 DDPM은 모든 픽셀을 독립적으로 노이즈화하지만, 사인그램은 각도 간 강한 상관관계를 가진다. 이를 해결하기 위해 FEME를 사용해 마스크를 Fourier encoding(Φ)으로 변환, 각도 정보를 내재화한 마스크 임베딩 M′(θ)를 생성한다. 또한 FANS는 초기 단계에서 저주파 성분을 크게 보존하고, 타임스텝이 진행될수록 고주파 노이즈 비중을 늘려 전역 구조는 안정적으로, 세부 디테일은 점진적으로 정교화한다. 이러한 설계는 확산 모델이 사인그램의 전역 일관성을 유지하면서도 고해상도 세부 정보를 복원하도록 만든다. 실험에서는 TomoBank과 LoDoPaB 데이터셋을 사용해 다양한 뷰 감소 비율(예: 1/8, 1/16)에서 기존 U‑Net, GAN, Transformer 기반 방법들을 능가했으며, ablation study를 통해 BFDC, 물리‑가이드 손실, FEME, FANS 각각이 성능 향상에 기여함을 입증했다. 전체적으로 FCDM은 사인그램의 물리·주파수 구조를 정량적으로 모델링하고, 이를 확산 프레임워크와 결합함으로써 기존 RGB‑중심 인페인팅 기법이 갖는 한계를 뛰어넘는 새로운 패러다임을 제시한다.

물리 기반 양방향 주파수 인식 컨볼루션 및 확산 모델을 이용한 사인그램 복원

초록

상세 분석

댓글 및 학술 토론

의견 남기기