주파수 영역 적응을 통한 의료 영상 분할 혁신: AFDAN 네트워크
초록
AFDAN은 주파수 도메인에서 소스와 타깃 의료 영상의 특징을 정렬하고, 공간‑주파수 정보를 융합해 데이터 부족 상황에서도 높은 IoU(비틸리고 90.9%, 혈관 82.6%)를 달성한 도메인 적응 프레임워크이다.
상세 분석
AFDAN은 기존 도메인 적응 방법이 주로 이미지 레벨의 스타일 차이나 피처 매핑에 의존하는 한계를 극복하기 위해, 주파수 도메인, 특히 진폭 스펙트럼에 초점을 맞춘다. 첫 번째 모듈인 Adversarial Domain Learning (ADL)은 진폭 스펙트럼을 생성‑판별 구조로 학습시켜 소스 이미지의 진폭을 타깃 진폭과 구분할 수 없도록 만든다. 이는 진폭이 이미지의 조명·대조와 같은 스타일 정보를 담고 있어 도메인 간 차이를 효과적으로 감소시킨다. 두 번째 모듈인 Source‑Target Frequency Fusion (STFF)는 소스와 타깃의 저주파 진폭을 무작위 가중치 α로 선형 혼합함으로써, 두 도메인의 중간 진폭 분포를 생성한다. 이 stochastic fusion은 과적합을 방지하고, 고주파는 그대로 보존해 미세 구조(병변 경계)를 유지한다. 세 번째 모듈인 Spatial‑Frequency Integration (SFI)은 FFT‑변환 후 얻은 주파수 피처와 기존 CNN/Transformer 기반 공간 피처를 bilinear up‑sampling으로 크기를 맞춘 뒤 채널 차원으로 결합하고, 공간‑주파수 attention을 적용한다. 이렇게 하면 전역적인 도메인 불변 특성과 지역적인 해부학적 디테일을 동시에 활용할 수 있다. 실험에서는 ISIC2018 → VITILIGO2025, Fundus‑A VSeg → DRIVE 두 쌍의 도메인 전이에서 기존 SOTA(PSPNet, YOLO11, EHTDI 등)를 크게 앞선 성능을 보였으며, Ablation 결과는 각 모듈이 독립적으로 1~5%p의 IoU 향상을 제공하고, 조합 시 시너지 효과가 나타남을 확인한다. 강점으로는 (1) 주파수 도메인 정렬을 통한 라벨 불일치 완화, (2) 모듈식 설계로 기존 SegFormer 등 백본에 손쉽게 적용 가능, (3) 적은 라벨 데이터에서도 높은 일반화 능력이다. 한계점은 (1) 실험이 두 개 도메인에 국한되어 있어 다양한 장기·조직에 대한 일반화 검증이 부족하고, (2) FFT‑기반 연산과 추가 attention이 연산량·메모리 비용을 증가시킬 가능성이 있으며, (3) 진폭 정렬만을 사용함으로써 위상 정보의 잠재적 활용이 미흡하다는 점이다. 향후 연구에서는 다중 도메인·다중 클래스 상황, 위상‑진폭 공동 정렬, 경량화된 주파수 변환 모듈 등을 탐색할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기