이미지 정합과 딥 임베디드 클러스터링을 활용한 AMD 중증도 예측 및 설명 가능성

본 논문은 OCT 영상의 정합 파라미터를 추정하고 이를 딥 임베디드 클러스터링(DEC)과 결합해 정상·DME·건성 AMD 3가지 질환을 구분하고, 1~10 단계의 중증도 점수를 자동으로 부여한다. 정합 결과를 정량적 설명 변수로 활용함으로써 기존 클래스 활성화 맵(CAM)보다 직관적이고 측정 가능한 설명성을 제공한다.

저자: Dwarikanath Mahapatra

이미지 정합과 딥 임베디드 클러스터링을 활용한 AMD 중증도 예측 및 설명 가능성
본 논문은 연령 관련 황반변성(AMD)의 중증도를 OCT 영상으로 자동 예측하고, 그 과정에서 얻은 정합 파라미터를 이용해 설명 가능성을 높이는 새로운 프레임워크를 제안한다. 기존의 딥러닝 기반 의료 영상 분류는 질환 존재 여부만을 이진 혹은 다중 클래스 형태로 출력하고, CAM과 같은 시각화 도구는 질환 부위를 강조하지만 정량적 근거를 제공하지 못한다. AMD는 표준화된 중증도 척도가 없으며, 임상의 판단에 크게 의존한다는 점에서, 정합 기반의 정량적 설명이 특히 유용하다. **1. 데이터 및 전처리** 공개 OCT 데이터셋(정상 50명, 건성 AMD 48명, DME 50명)에서 각 볼륨은 512×1024 픽셀, 슬라이스 수는 19~61 사이이며, 축소된 해상도와 회전·플립 증강을 통해 150배 확대한다. **2. 클래스별 아틀라스 구축** 정상, AMD, DME 각각에 대해 그룹 워크 정합을 수행한다. 정상 볼륨은 포인트 클라우드와 ICP 알고리즘으로 대략 정렬한 뒤 ITK 기반 그룹 정합을 적용해 평균 아틀라스 A_N을 만든다. 동일 절차를 AMD와 DME에도 적용해 A_AMD와 A_DME를 생성한다. 정합 파라미터는 B‑spline 격자점(16×16×16)의 변위값으로 표현한다. **3. 딥 임베디드 클러스터링(DEC)** DEC는 입력 데이터를 비선형 매핑 f_θ를 통해 잠재 공간 Z로 압축하고, Student‑t 분포 기반 유사도 q_ij를 이용해 클러스터 중심 μ_j와의 관계를 모델링한다. 초기화는 오토인코더를 사용하고, KL‑다이버전스 최소화와 타깃 분포 재계산을 반복한다. 클러스터 수 k는 10으로 설정했으며, 결과적으로 정상(1‑3), DME(4‑7), AMD(8‑10) 라벨에 매핑된다. **4. 정합 파라미터 회귀 네트워크** CNN 인코더는 1×1, 3×3 컨볼루션과 맥스풀링을 연속 적용해 16×16×128 차원의 특징 맵을 만든다. 이 특징 맵은 두 갈래로 분기한다. 첫 번째 갈래는 완전 연결층(4096‑4096‑4096)으로 구성돼, 입력 볼륨의 실제 질환 라벨과 결합해 정합 파라미터(4096 차원)를 회귀한다. 라벨을 함께 입력함으로써 “정상 볼륨 → 정상 아틀라스”, “AMD 볼륨 → AMD 아틀라스” 등 올바른 아틀라스로 정합하도록 지도한다. 두 번째 갈래는 DEC에 연결돼 클러스터 라벨을 예측한다. **5. 학습 및 평가** 데이터는 70 % 훈련, 10 % 검증, 20 % 테스트로 분할한다. 초기 50 epoch은 회귀 손실(MSE)만 사용해 기본 가중치를 학습하고, 이후 DEC를 학습한다. 정합 정확도는 시뮬레이션 변형을 적용해 평균 절대 거리(MAD), 95 % Hausdorff 거리(HD95), Dice 계수(DM)로 평가했으며, 제안 방법(Reg‑DEC)은 기존 DL 정합(VoxelMorph, FlowNet, DIRNet 등) 대비 MAD 13.7→7.9 mm, HD95 12.9→6.9 mm, DM 78.9→89.3 % 등 현저히 우수했다. 분류 성능은 VGG‑16, ResNet, DenseNet, 멀티스케일 CNN Ensemble 등과 비교했으며, Reg‑DEC는 평균 정확도 93.6 %~94.3 %를 기록해 최고 수준을 유지했다. 또한, 파라미터 수와 학습 시간도 기존 모델보다 적었다(학습 시간 0.5 s vs 0.6 s). **6. 중증도 예측 및 설명 가능성** 테스트 이미지가 DEC에서 예측한 클러스터 i에 할당되면, 해당 클러스터 번호 자체가 1~10 사이의 중증도 점수가 된다. 추가로 각 클러스터 중심과의 L2 거리 d_i를 이용해 정규화 확률 p_d를 계산한다. p_d는 “가장 심각한 단계에 도달할 확률”을 의미하며, 이는 기존 CNN이 제공하는 클래스 확률과는 다른 의미를 가진다. 정합 변위의 크기와 방향을 시각화하면, 질환 부위가 정확히 어디인지, 변위가 클수록 중증도가 높다는 정량적 근거를 제공한다. **7. 일반화 및 한계** DME 데이터를 학습에서 제외하고도, Reg‑DEC는 DME 테스트 이미지를 클러스터 4‑7에 적절히 할당해 96.9 %의 정확도를 유지한다. 이는 클러스터링이 데이터의 내재 구조를 잘 포착함을 시사한다. 그러나 클러스터 수와 격자 해상도 선택이 임의적이며, 정합 파라미터가 격자 변위에 제한돼 미세 변형을 완전히 반영하지 못할 수 있다. 또한, OCT 영상의 품질 변동에 민감할 가능성이 있다. **8. 결론** 본 연구는 OCT 영상에서 정합 파라미터를 직접 회귀하고, 이를 딥 임베디드 클러스터링과 결합해 질환 분류와 중증도 점수를 동시에 제공한다. 정합 기반 설명은 CAM보다 직관적이고 정량적이며, 미표준화된 AMD 중증도 평가에 실용적인 솔루션을 제시한다. 향후 다중 스케일 정합, 가변 클러스터링, 임상 라벨링 정밀화 등을 통해 모델의 일반화와 해석력을 더욱 강화할 수 있을 것이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기