잠재공간 구조인과 모델을 이용한 고해상도 3D 뇌 MRI 반사실 생성
초록
본 논문은 VQ‑VAE로 3D T1‑weighted 뇌 MRI를 저차원 잠재공간에 압축한 뒤, 해당 잠재공간에 구조인과 모델(SCM)을 구축한다. 폐쇄형 해를 갖는 일반화 선형 모델(GLM)을 이용해 인과적 추론(추론‑행동‑예측) 3단계를 수행하고, 변형된 잠재벡터를 디코더에 넣어 고품질 3D MRI 반사실(counterfactual) 이미지를 생성한다. ADNI와 NCANDA 데이터셋을 활용한 실험에서 기존 GAN·Diffusion 기반 생성 모델보다 해상도·해부학적 일관성 모두에서 우수함을 보였다.
상세 분석
이 연구는 두 가지 핵심 난관을 동시에 해결한다. 첫째, 뇌 MRI와 같은 3차원 의료 영상은 수십만 개의 픽셀(볼륨)로 구성돼 고차원이며, 직접적인 인과 모델링은 계산량과 파라미터 최적화 측면에서 비현실적이다. 둘째, 기존 생성 모델은 훈련 데이터 분포를 벗어난 샘플을 만들 때 품질이 급격히 저하된다. 저자들은 VQ‑VAE(벡터 양자화 변분 오토인코더)를 이용해 원본 MRI를 d×h×w×n_D 차원의 잠재 텐서 z 로 압축한다. 양자화 단계에서 코드북을 활용해 연속적인 잠재공간을 이산화함으로써 정규화와 과적합 방지를 동시에 달성한다.
잠재공간에 구조인과 모델(LSCM)을 삽입하는 방식은 기존 DSCM(Deep Structural Causal Model)이 직접 이미지에 적용될 때 발생하는 비가역성·고비용 문제를 회피한다. 저자들은 각 잠재벡터를 평탄화해 N×K 행렬 Z 로 만들고, 인과 변수들의 부모 집합 pa_z 를 N×m 행렬 P 로 구성한다. 이후 일반화 선형 모델(GLM)의 최소제곱 해 B = (PᵀP)⁻¹PᵀZ 를 폐쇄형으로 계산한다. 이때 잔차 U_Z = Z – P B 가 잠재공간의 외생 변수 역할을 하며, 인과적 개입(do‑연산) 후 새로운 부모값 c_pa_z 를 그래프에 따라 수정한다. 최종 예측 단계에서는 b_Z = U_Z + c_pa_z B 로 새로운 잠재벡터를 얻고, 이를 VQ‑VAE 디코더 D 에 입력해 반사실 MRI b_x 를 복원한다.
인과 그래프는 연령, 진단(AUD vs. 정상), 전두엽·전두엽·두정엽 부피 등 다섯 개 변수로 구성되며, 기존 문헌(예:
댓글 및 학술 토론
Loading comments...
의견 남기기