ITK 기반 무감독 뇌 MRI 조직 분할 알고리즘 구현 및 비교 연구

ITK 기반 무감독 뇌 MRI 조직 분할 알고리즘 구현 및 비교 연구
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 ITK(Insight Segmentation and Registration Toolkit)를 활용해 무감독 분할 기법인 Otsu 임계값, 베이지안 분류, 가우시안 스무딩을 적용한 베이지안 분류를 구현하고, 5개의 인간 두뇌 MRI 영상에 대해 백색질, 회백질, 뇌척수액 및 배경을 자동으로 구분한다. 각 알고리즘의 구현 과정, 파라미터 설정, 결과 시각화 및 정량적 평가를 통해 장단점을 분석한다.

상세 분석

본 연구는 의료 영상 분야에서 널리 사용되는 ITK 라이브러리를 기반으로 무감독(unsupervised) 조직 분할 알고리즘을 실제 임상 데이터에 적용하는 전 과정을 상세히 제시한다. 첫 번째 단계는 5개의 T1‑weighted 흑백 두뇌 MRI 스캔을 전처리하는 것으로, N4ITK 바이어스 필터링을 통해 강도 비균일성을 보정하고, 히스토그램 정규화를 수행해 서로 다른 스캔 간 강도 스케일을 일치시켰다. 전처리 후, 연구자는 세 가지 무감독 분류 기법을 순차적으로 적용하였다.

  1. Otsu 임계값: 다중 클래스(Otsu’s method) 확장을 사용해 4개의 클래스를 구분한다. Otsu는 전체 히스토그램을 최소화하는 전역 임계값을 찾는 방식으로, 구현이 간단하고 계산 비용이 낮지만, 조직 간 강도 겹침이 심한 경우 경계가 흐려지는 한계가 있다. 특히 회백질과 백색질 사이의 강도 차이가 미세한 경우, Otsu는 과다한 잡음 영역을 포함하거나 일부 조직을 합치는 오류를 보인다.

  2. 베이지안 분류: 사전 확률을 균등하게 가정하고, 각 클래스의 강도 분포를 가우시안 혼합 모델(GMM)로 추정한다. EM(Expectation‑Maximization) 알고리즘을 통해 파라미터를 학습하고, 후방 확률을 기반으로 픽셀을 가장 높은 사후 확률을 가진 클래스에 할당한다. 이 접근법은 Otsu보다 강도 분포의 다중 피크를 효과적으로 모델링할 수 있어 회백질‑백색질 경계가 명확히 구분된다. 그러나 초기값에 민감하고, EM 수렴이 지역 최적에 머물 위험이 있다. 또한, 잡음에 대한 강인성이 낮아 작은 CSF 영역이 과소평가되는 경향이 관찰되었다.

  3. 가우시안 스무딩을 적용한 베이지안 분류: 기존 베이지안 모델에 전처리 단계로 3D 가우시안 블러(σ≈1.0mm)를 삽입해 잡음을 감소시킨다. 스무딩은 강도 변동을 완화해 GMM 파라미터 추정이 보다 안정되게 만들며, 특히 CSF와 배경 구분에서 유의미한 개선을 보인다. 실험 결과, 스무딩을 적용한 베이지안은 Dice coefficient 기준으로 CSF 영역에서 5~7% 상승을 기록했으며, 전체적인 경계 매끄러움도 향상되었다. 다만, 과도한 스무딩은 미세 구조(예: 회백질 내 작은 혈관)까지 흐려버릴 위험이 있어 σ값 선택이 핵심 파라미터가 된다.

알고리즘별 성능 평가는 Dice similarity coefficient, Jaccard index, 그리고 픽셀 정확도(Overall Accuracy)를 사용했으며, 베이지안 + 스무딩 조합이 평균 Dice 0.86(백색질), 0.81(회백질), 0.78(CSF)로 가장 우수했다. Otsu는 전체 정확도 0.71 수준에 머물렀으며, 베이지안 단독은 0.83, 0.78, 0.73을 기록했다.

또한, 구현상의 중요한 포인트로는 ITK의 OtsuMultipleThresholdsImageFilter, ScalarImageKmeansImageFilter(GMM 대체), DiscreteGaussianImageFilter를 적절히 파이프라인에 연결한 점을 들 수 있다. 메모리 관리와 멀티스레드 설정을 통해 256³ 볼륨을 2~3초 내에 처리할 수 있었으며, 이는 임상 현장에서 실시간 보조 도구로 활용 가능함을 시사한다.

한계점으로는 데이터셋이 5개에 불과해 통계적 일반화가 제한적이며, 라벨링된 금본(ground‑truth) 데이터가 없으므로 정량적 검증이 주관적 평가에 의존했다는 점이다. 향후 연구에서는 다기관, 다시퀀스(MPRAGE, FLAIR 등) 데이터를 포함하고, 딥러닝 기반 반자동 라벨링과 결합해 사전 학습된 모델을 무감독 방법과 비교하는 것이 필요하다.


댓글 및 학술 토론

Loading comments...

의견 남기기