바디 MRI 바이어스 필드 보정을 위한 변분 하다마드 U Net
초록
VHU‑Net은 하다마드 변환을 채널별로 적용해 저주파 바이어스 필드를 효과적으로 분리하고, 역하다마드‑재구성 트랜스포머를 통해 전역적인 주파수‑인식 attention을 제공한다. 변분 ELBO 손실로 잠재 공간을 라플라시안 분포에 제약해 희소성을 강화하고, 다기관 바디 MRI 데이터에서 기존 N4ITK·ABCnet 등보다 높은 강도 균일성과 세그멘테이션 정확도를 달성한다.
상세 분석
VHU‑Net은 기존 U‑Net 구조에 두 가지 핵심 모듈을 삽입함으로써 바이어스 필드 보정에 특화된 아키텍처를 제시한다. 첫 번째는 ConvHTBlock으로, 일반적인 2D 컨볼루션 뒤에 채널별 하다마드 변환(HT) 레이어를 두어 이미지의 주파수 스펙트럼을 직접 조작한다. HT는 +1·‑1 로만 구성된 행렬을 사용해 연산량을 크게 줄이면서도 에너지 집중 특성으로 저주파 성분을 상위 코효시언트에 압축한다. 이어지는 스케일링 레이어와 반소프트(thresholding) 연산은 학습 가능한 스케일 파라미터와 임계값을 통해 고주파 잡음을 억제하고, 저주파 바이어스 성분만을 강조한다. 이러한 설계는 컨볼루션 필터가 HT와 공동 학습되도록 하여, 데이터에 맞는 최적의 주파수 분해와 잡음 억제를 동시에 달성한다.
두 번째 핵심은 디코더에 삽입된 IHTR‑TB(Inverse‑HT‑Reconstructed Transformer Block)이다. HT 자체는 채널 간 상관관계를 모델링하지 못한다는 한계가 있기 때문에, IHTR‑TB는 역하다마드 변환 후 트랜스포머 레이어를 적용해 전역적인 주파수‑인식 attention을 구현한다. 트랜스포머는 모든 위치의 저주파 계수를 서로 연결함으로써, 바이어스 필드가 공간적으로 일관된 형태를 유지하도록 돕는다. 또한, IHTR‑TB 내부에 다시 반소프트 임계값을 두어 남은 고주파 성분을 추가로 정제한다.
학습 목표는 변분 추론에 기반한 ELBO를 최적화하는 것이다. 관측 이미지 x와 목표 바이어스 필드 z 사이의 조건부 로그우도 log p(z|x)를 직접 계산하기 어려우므로, 인코더가 추정한 잠재 변수 y에 대한 근사 후방 q(y|x)를 도입한다. ELBO는 E_q
댓글 및 학술 토론
Loading comments...
의견 남기기