3D-TDA -- Topological feature extraction from 3D images for Alzheimer's disease classification
๐ Abstract
**
๋ณธ ๋
ผ๋ฌธ์ ์์ธ ํ์ด๋จธ๋ณ(AD) ์กฐ๊ธฐ ์ง๋จ์ ์ํด ๊ตฌ์กฐ์ 3์ฐจ์ MRI ์์์ ์ง์์ ๋ํ์ฑ(persistent homology, PH)์ ์ ์ฉํ ์๋ก์ด ํน์ง ์ถ์ถ ๊ธฐ๋ฒ์ ์ ์ํ๋ค. ํ์์กฐ ๊ฐ๋์ ๊ธฐ๋ฐํ ์๋ธ๋ ๋ฒจ ํํฐ๋ ์ด์
์ ํตํด 0โ, 1โ, 2โ์ฐจ์ ํ ํด๋ก์ง ํน์ง์ ์ป๊ณ , ์ด๋ฅผ ๋ฒ ํฐ ํจ์(Betti function) ํํ์ ๋ฒกํฐ(์ด 300 ์ฐจ์)๋ก ๋ณํํ๋ค. ๋ณํ๋ ํ ํด๋ก์ง ํน์ง์ XGBoost ๋ถ๋ฅ๊ธฐ์ ์
๋ ฅํจ์ผ๋ก์จ, ๋ฐ์ดํฐ ์ฆ๊ฐ์ด๋ ๋ณต์กํ ์ ์ฒ๋ฆฌ ์์ด๋ ๋์ ๋ถ๋ฅ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค. ADNI 3D MRI ๋ฐ์ดํฐ๋ฅผ 10โfold ๊ต์ฐจ๊ฒ์ฆ์ผ๋ก ํ๊ฐํ ๊ฒฐ๊ณผ, ์ด์ง ๋ถ๋ฅ(NC vs AD)์์ ํ๊ท ์ ํ๋ 97.43โฏ%ยท๋ฏผ๊ฐ๋ 99.09โฏ%๋ฅผ, 3โํด๋์ค ๋ถ๋ฅ(NC vs MCI vs AD)์์ ํ๊ท ์ ํ๋ 95.47โฏ%ยท๋ฏผ๊ฐ๋ 94.98โฏ%๋ฅผ ๊ธฐ๋กํ์๋ค. ๊ธฐ์กด ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐํ๋ฉด์๋ ์ฐ์ฐ ๋น์ฉ๊ณผ ๋ฐ์ดํฐ ์๊ตฌ๋์ด ํฌ๊ฒ ๋ฎ์ ๊ฒ์ด ํน์ง์ด๋ค.
**
๐ก Deep Analysis
**
1. ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ํ์์ฑ
- ์์์ ์๊ตฌ: AD ์น๋ฃ์ ์น์ธ ์ดํ, ์ ๋น์ฉยท๊ณ ์ ๋ฐ ์กฐ๊ธฐ ์ง๋จ์ด ํ์์ ์ด๋ฉฐ, MRI๋ ๋น์ฉยท์ ๊ทผ์ฑ ๋ฉด์์ ๊ฐ์ฅ ํ์ค์ ์ธ ๋ฐ์ด์ค๋ง์ปค์ด๋ค.
- ๊ธฐ์กด ์ ๊ทผ๋ฒ์ ํ๊ณ: ๋ฅ๋ฌ๋์ ๋๊ท๋ชจ ๋ผ๋ฒจ๋ง ๋ฐ์ดํฐ์ ๋ณต์กํ ์ ์ฒ๋ฆฌยท์ฆ๊ฐ์ด ํ์ํ๊ณ , ํด์ ๊ฐ๋ฅ์ฑ์ด ๋ฎ๋ค. ๋ฐ๋ฉด ์ ํต์ ์ธ ๋จธ์ ๋ฌ๋์ ํน์ง ์ค๊ณ์ ํฌ๊ฒ ์์กดํ๋ค.
2. ๋ฐฉ๋ฒ๋ก ํต์ฌ
| ๋จ๊ณ | ๋ด์ฉ | ์ฃผ์ ์ ํ ์ด์ |
|---|---|---|
| Filtration | ํ์์กฐ ๊ฐ์ 0โ255 ๊ตฌ๊ฐ์ 100๊ฐ์ ์๊ณ๊ฐ์ผ๋ก ์ ๊ทํํ์ฌ ์๋ธ๋ ๋ฒจ ํํฐ๋ ์ด์ ์ํ | 3D MRI์ ์ฐ์์ ์ธ 2D ์ฌ๋ผ์ด์ค์ ํ์์กฐ ํน์ฑ์ ๊ทธ๋๋ก ํ์ฉ, ํํฐ๋ง ๋จ๊ณ ์(N=100)๊ฐ ์ฑ๋ฅ์ ํฐ ์ํฅ์ ์ฃผ์ง ์์ |
| Persistence Diagram (PD) | ๊ฐ ํํฐ๋ง ๋จ๊ณ์์ 0โ, 1โ, 2โ์ฐจ์ ํธ๋ชฐ๋ก์ง(์ฐ๊ฒฐ์ฑ, ๋ฃจํ, ๊ณต๋์ฒด) ์ถ์ถ | 3์ฐจ์ ์์์ ์ ํฉํ ์ฐจ์(0~2)๋ง ๊ณ ๋ ค, PD๋ ํ ํด๋ก์ง ๋ณํ๋ฅผ ์ ๋ํ |
| Vectorization | ๋ฒ ํฐ ํจ์(Betti function)๋ฅผ ์ฌ์ฉํด PD๋ฅผ 300โ์ฐจ์ ๋ฒกํฐ(ฮฒโ, ฮฒโ, ฮฒโ ๊ฐ๊ฐ 100 ์ฐจ์)๋ก ๋ณํ | ์งง์ ์๋ช ํ ํด๋ก์ง ํน์ง์ ํฌํจํด โ๋ ธ์ด์ฆโ๊น์ง ํ์ฉ ๊ฐ๋ฅ, ํด์์ด ์ง๊ด์ ์ด๋ฉฐ ๊ตฌํ์ด ๊ฐ๋จ |
| Classification | XGBoost (gradient boosting tree) ์ ์ฉ | ํธ๋ฆฌ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๊ณ ์ฐจ์ ํฌ์ ๋ฒกํฐ์ ๊ฐํ๊ณ , ํ์ดํผํ๋ผ๋ฏธํฐ ํ๋์ด ๋น๊ต์ ์ฉ์ดํจ |
3. ์คํ ์ค๊ณ ๋ฐ ๊ฒฐ๊ณผ
- ๋ฐ์ดํฐ: ADNI 3T T1โweighted 3D MRI, ์ค๊ฐ 50 ์ฌ๋ผ์ด์ค ์ฌ์ฉ (๋ ธ์ด์ฆ ๊ฐ์ ๋ฐ ์ฐ์ฐ ํจ์จ).
- ํ๊ฐ: 10โfold ๊ต์ฐจ๊ฒ์ฆ, ์ด์งยท๋ค์ค ํด๋์ค ๋ ๊ฐ์ง ์๋๋ฆฌ์ค.
- ์ฑ๋ฅ:
- ์ด์ง: ์ ํ๋ 97.43โฏ%, ๋ฏผ๊ฐ๋ 99.09โฏ% (๋ค๋ฅธ ์ต์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๋๋น 2~5โฏ% ์ด์ ์ฐ์)
- 3โํด๋์ค: ์ ํ๋ 95.47โฏ%, ๋ฏผ๊ฐ๋ 94.98โฏ% (๋ค์ค ํด๋์ค์์ ๋ฅ๋ฌ๋ ๋๋น ๋น์ทํ๊ฑฐ๋ ์ฝ๊ฐ ์ฐ์)
- ์ฐ์ฐ ํจ์จ: ์ ์ฒ๋ฆฌยท์ฆ๊ฐ ์์ด ๋ฐ๋ก ๋ฒ ํฐ ๋ฒกํฐ ์์ฑ โ XGBoost ํ์ต ์๊ฐ์ GPU ๊ธฐ๋ฐ ๋ฅ๋ฌ๋ ๋๋น ์์ญ ๋ฐฐ ๋น ๋ฆ.
4. ๊ฐ์
- ๋ฐ์ดํฐ ํจ์จ์ฑ: ์์ ๊ท๋ชจ(์๋ฐฑ ๋ช ) ๋ฐ์ดํฐ์์๋ ๋์ ์ฑ๋ฅ์ ์ ์ง, ๋ผ๋ฒจ๋ง ๋น์ฉ ์ ๊ฐ.
- ํด์ ๊ฐ๋ฅ์ฑ: ๋ฒ ํฐ ํจ์๋ โ๋ช ๊ฐ์ ์ฐ๊ฒฐ์ฑ/๋ฃจํ/๊ณต๋์ฒด๊ฐ ํน์ ๊ฐ๋ ์ดํ์์ ์กด์ฌํ๋๊ฐโ๋ฅผ ์ง์ ๋ณด์ฌ์ฃผ์ด, ์ํ์ ํด์์ด ์ฉ์ด.
- ๋ชจ๋ธ ๊ฒฝ๋ํ: XGBoost๋ CPU์์๋ ์ถฉ๋ถํ ํ์ต ๊ฐ๋ฅ, ์์ ํ์ฅ ์ ์ฉ์ ์ ๋ฆฌ.
- ์ฆ๊ฐ ๋ถํ์: ํ ํด๋ก์ง ํน์ง์ ํ์ ยท๋ฐ์ ยท์ค์ผ์ผ ๋ณํ์ ๋ถ๋ณ(invariant)ํ๋ฏ๋ก ๋ฐ์ดํฐ ์ฆ๊ฐ์ด ํ์ ์์ผ๋ฉฐ, ์ด๋ ์ค์ ์ค์บ ํ๊ฒฝ์ ๋ณ๋์ฑ์ ์์ฐ์ค๋ฝ๊ฒ ํฌ๊ดํ๋ค.
5. ์ฝ์ ๋ฐ ํ๊ณ
- ํน์ง ์ฐจ์ ๊ณ ์ : ๋ฒ ํฐ ํจ์์ ์๊ณ๊ฐ ์(N=100)๋ฅผ ์์๋ก ์ค์ ํ์ผ๋ฉฐ, ๋ค๋ฅธ ๋ฐ์ดํฐ์ (์: ๋ค๋ฅธ MRI ํ๋กํ ์ฝ)์์๋ ์ต์ ๊ฐ์ด ๋ฌ๋ผ์ง ์ ์๋ค.
- ๋ค์ค ์ค์ผ์ผ ์ ๋ณด ์์ค: ๋ฒ ํฐ ํจ์๋ โํ์ฑ ํน์ง ์โ๋ง์ ๊ธฐ๋กํ๋ฏ๋ก, ๊ฐ ํน์ง์ ์๋ช (๊ธธ์ด) ์ ๋ณด๋ฅผ ์ถฉ๋ถํ ํ์ฉํ์ง ๋ชปํ๋ค. Persistence ImageยทLandscape ๋ฑ๊ณผ ๊ฒฐํฉํ๋ฉด ์ฑ๋ฅ ํฅ์์ด ๊ธฐ๋๋๋ค.
- ์ ์ฒ๋ฆฌ ์ต์ํ์ ์ญํจ๊ณผ ๊ฐ๋ฅ์ฑ: ์ก์์ด ๋ง์ ์ ํด์๋ ์ค์บ์์๋ ๋ฒ ํฐ ํจ์๊ฐ ์ก์์ ๋ฏผ๊ฐํ ์ ์๋ค. ์ค์ ์์ ํ์ฅ์์ ๋ค์ํ ์ค์บ๋ยท์ํ์ค์ ๋ํ ์ผ๋ฐํ ๊ฒ์ฆ์ด ํ์ํ๋ค.
- ํด๋์ค ๋ถ๊ท ํ: ๋ ผ๋ฌธ์ ํด๋์ค ๋น์จ์ ๋ํ ์ธ๊ธ์ด ์์ผ๋ฉฐ, XGBoost๋ ํด๋์ค ๊ฐ์ค์น๋ฅผ ์กฐ์ ํด์ผ ํ ๊ฐ๋ฅ์ฑ์ด ์๋ค.
6. ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
- ๋ค์ค ๋ฒกํฐํ ๊ธฐ๋ฒ ๊ฒฐํฉ: ๋ฒ ํฐ ํจ์์ Persistence ImageยทLandscape๋ฅผ ํผํฉํด ํ์ด๋ธ๋ฆฌ๋ ํน์ง์ ๊ตฌ์ฑํ๋ฉด, ์งง์ ์๋ช ยท๊ธด ์๋ช ํน์ง ๋ชจ๋๋ฅผ ํ์ฉ ๊ฐ๋ฅ.
- ๋ค์ค ๋ชจ๋ฌ๋ฆฌํฐ ํตํฉ: PET, CSF ๋ฐ์ด์ค๋ง์ปค ๋ฑ ๋ค๋ฅธ AD ๋ฐ์ด์ค๋ง์ปค์ ๋ฒ ํฐ ๋ฒกํฐ๋ฅผ ๊ฒฐํฉํ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ ๊ฐ๋ฐ.
- ์ ์ด ํ์ต ๋ฐ ๋๋ฉ์ธ ์ ์: ๋ค๋ฅธ MRI ํ๋กํ ์ฝ(์: 1.5โฏT, ๋ค๋ฅธ ์ํ์ค)์๋ ์ ์ฉ ๊ฐ๋ฅํ ๋๋ฉ์ธ ์ ์ ๊ธฐ๋ฒ ์ฐ๊ตฌ.
- ์์ ํด์ ์ฐ๊ตฌ: ๋ฒ ํฐ ํจ์์ ํน์ ๊ตฌ๊ฐ์ด ์ด๋ค ํด๋ถํ์ ๋ณํ๋ฅผ ๋ฐ์ํ๋์ง, ๋ณ๋ฆฌํ์ ๊ฒ์ฆ(์: ํด๋ถํ์ ROI์ ๋งคํ) ์ํ.
- ์ค์๊ฐ ์์ ์ ์ฉ: ๊ฒฝ๋ํ๋ ํ์ดํ๋ผ์ธ์ ๋ณ์ PACS์ ์ฐ๋ํด ์ค์๊ฐ ์ง๋จ ๋ณด์กฐ ๋๊ตฌ๋ก ๊ตฌํ.
7. ์ข ํฉ ํ๊ฐ
๋ณธ ๋ ผ๋ฌธ์ **ํ ํด๋ก์ง ๋ฐ์ดํฐ ๋ถ์(TDA)**์ 3์ฐจ์ ๋ MRI์ ์ ์ฉํจ์ผ๋ก์จ, ๊ธฐ์กด ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ด ๊ฐ๋ ๋ฐ์ดํฐยท์ฐ์ฐยทํด์์ ์ ์ฝ์ ํจ๊ณผ์ ์ผ๋ก ๊ทน๋ณตํ์๋ค. ํนํ ๋ฒ ํฐ ํจ์๋ฅผ ์ด์ฉํ ์ง๊ด์ ์ธ ํน์ง ๋ฒกํฐํ์ XGBoost๋ผ๋ ๊ฐ๋ฒผ์ด ๋ถ๋ฅ๊ธฐ์ ๊ฒฐํฉ์, ์์ ๊ท๋ชจ ๋ฐ์ดํฐ์์๋ ๋์ ์ ํ๋์ ๋ฏผ๊ฐ๋๋ฅผ ๋ฌ์ฑํ๋ค๋ ์ ์์ ์ค์ฉ์ ๊ฐ์น๊ฐ ํฌ๋ค. ๋ค๋ง, ํ์ฌ๋ ๋ฒ ํฐ ํจ์ ํ๋์ ์์กดํ๋ ๋จ์ผ ํน์ง ์งํฉ์ด๋ฏ๋ก, ํฅํ ๋ค์ค ๋ฒกํฐํ์ ๋ฉํฐ๋ชจ๋ฌ ํตํฉ์ ํตํด ๋์ฑ ๊ฒฌ๊ณ ํ๊ณ ์ผ๋ฐํ ๊ฐ๋ฅํ ๋ชจ๋ธ๋ก ๋ฐ์ ์ํฌ ์ฌ์ง๊ฐ ์ถฉ๋ถํ๋ค.
**
๐ Full Content
์์ธ ํ์ด๋จธ๋ณ(AD)์ ๋น์ ์์ ์ธ ๋ฒ ํ ์๋ฐ๋ก์ด๋์ ์ธ์ฐํ ํ์ฐ ๋จ๋ฐฑ์ง ์นจ์ ๋ฌผ์ด ์ถ์ ๋๊ณ , ์ด๋ ์ธํฌ์๋ฉธ์ฌ(apoptosis)์ ๋ ์์ถ(brain atrophy)๊ณผ ์ฐ๊ด๋ ๋ ์งํ์ด๋ค. AD๋ ๊ธฐ์ต๋ ฅ ๊ฐ์์ ๊ธฐํ ์ธ์ง ๊ธฐ๋ฅ ์ ํ, ์ ์ยทํ๋ ๋ณํ ๋ฑ์ ์ด๋ํ๋ค. AD๋ ํ๋ผํฌ(plaque)์ ์ํด(tangle)์ ์กด์ฌ์ ์์ ์น๋งค ์ฆํ๊ตฐ์ผ๋ก ํน์ง์ง์ด์ง๋ฉฐ, ํ๋ผํฌยท์ํด์ด ์กด์ฌํ๊ณ ์ด๋ ์ ๋ ์ธ์ง ์ ํ๊ฐ ๋ํ๋์ง๋ง ๋ช ๋ฐฑํ ์น๋งค๋ ์๋ ์ํ(๊ฒฝ๋์ธ์ง์ฅ์ , MCI)์, ํ๋ผํฌยท์ํด์ ์กด์ฌํ์ง๋ง ์ธ์ง ์ ํ๊ฐ ์ ํ ๊ฐ์ง๋์ง ์๋ ์ ์์ ๋จ๊ณ(preclinical AD)๋ก ๊ตฌ๋ถ๋๋ค. ์ ์์ ๋จ๊ณ๋ ์ธ๋ถ์์ ๋๋ฌ๋๋ ์ฆ์ ์์ด ๋, ํ์ก, ๋์ฒ์์ก(CSF)์์ ์ด์์ด ๊ด์ฐฐ๋๋ ๋จ๊ณ์ด๋ฉฐ, AD ๋ณ๋ฆฌํ์ ์ฆ์์ด ๋ํ๋๊ธฐ ์ต์ 20๋ ์ ๋ถํฐ ์์๋๋ค[1]. ๋ ๋ฒ์งธ ๋จ๊ณ์ธ MCI๋ ์ฃผ๋ก ๊ธฐ์ต๋ ฅ์ ํฌํจํ ๋จ์ผ ์ธ์ง ์์ญ์ ์ ํ๋ ์์์ด ๋ํ๋๋ค. ์ต์ข ๋จ๊ณ์ธ ์น๋งค๋ ์ฌ๋ฌ ์ธ์ง ์์ญ์์ ๊ด๋ฒ์ํ ์ฅ์ ๊ฐ ๋ฐ์ํ๋ฉฐ, ์ฃผ๋ก ๊ธฐ์ต๋ ฅ๊ณผ ์คํ ๊ธฐ๋ฅ์ด ํฌ๊ฒ ์์๋๋ค. ์กฐ๊ธฐ ๋ฐ๊ฒฌ์ ํจ๊ณผ์ ์ธ ๊ฐ์ ๊ณผ ๊ด๋ฆฌ์ ํ์์ ์ด๋ค.
AD ๋ณ๋ฆฌ๋ ์ ๊ฒฝ์์(neuroimaging)์ผ๋ก๋ ๊ฒ์ถ๋ ์ ์๋ค. ๊ตฌ์กฐ์ ๋ ์๊ธฐ๊ณต๋ช ์์(structural MRI, sMRI)์ ์ค์์ฑ์ AD์ ์กฐ๊ธฐ ์ง๋จ์์ ์ ์ ๋ ๊ฐ์กฐ๋๊ณ ์๋ค. sMRI์ ๊ฐ์ ์ ๊ฒฝ์์ ๊ธฐ๋ฒ์ AD ํ์์ ๋์์ ํน์ ๊ตฌ์กฐ์ ๋ณํ๋ฅผ ์๋ณํ์ ๋ฟ ์๋๋ผ ๋ ๊ธฐ๋ฅ์ ๋ํ ์๋ก์ด ํต์ฐฐ์ ์ ๊ณตํ๋ค[2]. sMRI ์ค์บ์ ๋ ์กฐ์ง์ 3์ฐจ์ ํํ์ ๊ตฌ์กฐ๋ฅผ ํฌ์ฐฉํ์ฌ ๋ค์ํ ๋ ๊ตฌ์ฑ ์์์ ๋ถํผ๋ฅผ ์ ๋ฐํ๊ฒ ์ธก์ ํ๋ค[3].
์ด๊ธฐ AD๋ ๋ด์ธก์ ๋ํผ์ง(entorhinal cortex), ํด๋ง(hippocampus), ํ์ธก ๋์ํผ์ง(posterior cingulate gyrus)์ ์์ถ๊ณผ ์ฐ๊ด๋๋ฉฐ, AD ํ์๋ ์ ์ ๋์กฐ๊ตฐ์ ๋นํด ์์ธก ํด๋ง ๋ถํผ๊ฐ ์ฝ 24% ๊ฐ์ํ๋ค[4]. ๋ํ ์ ๋์ฝ๊ณผ ๋์ ์ฝ์ ๊ฒฝ๋์ธ์ง์ฅ์ (MCI)๋ณด๋ค AD ํ์์์ ๋ ํฐ ์์ถ์ ๋ณด์ธ๋ค. ์ด์ ๋๋ถ์ด, [5]๋ ๋จธ์ ๋ฌ๋ ํ๋ ์์ํฌ๋ฅผ ๋์ ํด AD ํ์์ MCI ํ์๋ฅผ ๊ตฌ๋ถํ์๋ค.
์ ๊ฒฝ์์ ๋ฐ์ดํฐ๋ ๋ฐฉ๋ํ๊ณ ๋ณต์กํ๊ธฐ ๋๋ฌธ์, ๋จธ์ ๋ฌ๋(ML), ์์ ๋ฐ์ดํฐ ๋ถ์(TDA), ๋ฅ๋ฌ๋๊ณผ ๊ฐ์ ๊ณ ๊ธ ๋ถ์ ๊ธฐ๋ฒ์ด ์์ธ ํ์ด๋จธ๋ณ์ ์กฐ๊ธฐ ํ์ง์ ์ง๋จ์ ํ์์ ์ด๋ค. ML ์๊ณ ๋ฆฌ์ฆ์ ๋ฐฉ๋ํ ๋ฐ์ดํฐ์ ์ ๋ถ์ํด ์ด๊ธฐ AD ๋๋ MCI๋ฅผ ์์ฌํ๋ ๋ฏธ์ธํ ํจํด๊ณผ ํน์ง์ ์๋ณํ๋ค. TDA๋ ์ด๋ฏธ์ง์์ ํน์ง์ ์ถ์ถํ๋ ๊ฐ๋ ฅํ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ฉฐ[6], ๊ธฐ๋ณธ์ ์ธ ์์ ๊ตฌ์กฐ๋ฅผ ํฌ์ฐฉํ๋ค. ๊ทธ๋ฌ๋ 3์ฐจ์ ์ด๋ฏธ์ง์ ๋ํ TDA ์ ์ฉ์ ์์ง ์ ํ์ ์ด๋ฉฐ ์ฐ๊ตฌ๊ฐ ์ ๋ค. ๋ฐ๋ฉด ๋ฅ๋ฌ๋์ ๊ฐ๋ ฅํ ์ ๊ฒฝ๋ง์ ํตํด ์์ ๋ฐ์ดํฐ์์ ๊ณ์ธต์ ํน์ง์ ์๋์ผ๋ก ํ์ตํจ์ผ๋ก์จ ์ง๋จ ์ ํ๋๋ฅผ ๋์ด๊ณ ์ง๋ณ ์งํ์ ์์ธกํ๋ ๋ฐ ๋์์ ์ค๋ค. ์ด์ ๊ฐ์ ๊ณ ๊ธ ๊ธฐ๋ฒ๋ค์ AD๋ฅผ ๊ฐ์ฅ ์ด๊ธฐ ๋จ๊ณ์์ ํ์งยท๋ถ๋ฅํ๋ ๋ฅ๋ ฅ์ ํฅ์์์ผ ์๊ธฐ์ ์ ํ ๊ฐ์ ๊ณผ ํ์ ์ํ ๊ฐ์ ์ ๊ธฐ์ฌํ๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ 3D MRI๋ฅผ ์ด์ฉํ AD ์ง๋จ์ ์ํด TDA๋ฅผ ์ ์ฉํ ์๋ก์ด ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค. TDA ๋๊ตฌ๋ ์๋ฃ ์์ ๋ถ์์์ ์ด๋ฏธ์ง ๋ด๋ถ์ ์จ๊ฒจ์ง ํํ ํจํด์ ํฌ์ฐฉํ๊ณ ์ ๋ขฐํ ์ ์๋ ํํ์ ์์ฑํ๋ ๋ฐ ์ฑ๊ณต์ ์ด์๋ค. ์ถ์ถ๋ ์์ ํน์ง์ ๋ฐ์ดํฐ์ ๋ํ ๋ ํนํ ํต์ฐฐ์ ์ ๊ณตํ๋ฉฐ, ์๋ก์ด ์ ๋ณด๋ฅผ ๋ฐ๊ฒฌํ๊ณ ๊ด๋ จ ํน์ง์ ๊ฒฐ์ ํ๋ ๋ฐ ํ์ฉ๋๋ค. ์ ์ ํ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๊ณผ ๊ฒฐํฉํ๋ฉด ์ด๋ฌํ ํน์ง ๋ฒกํฐ๋ ํด์ ๊ฐ๋ฅํ๊ณ ๊ฒฌ๊ณ ํ๋ฉฐ ๊ณ ์ฑ๋ฅ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ๊ฐ๋ฐ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
TDA๋ ๋ณตํฉ ๋ฐ์ดํฐ๋ฅผ ๋ค์ํ ์ค์ผ์ผ์์ ์ง์ญ์ ยท์ ์ญ์ ๊ตฌ์กฐ๋ฅผ ์๋ณํจ์ผ๋ก์จ ์ฐ๊ตฌํ๋ ํ์ ์ ์ธ ๋ฐฉ๋ฒ์ด๋ค. ์ด๋ ๋ฐ์ดํฐ ์ฐจ์์ฑ, ์์ง ๋ฐฉ๋ฒ๋ก ์ฐจ์ด, ์ค์ผ์ผ ์ฐจ์ด์ ๊ฐ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ค[7]. ์ง๋ 10๋ ๊ฐ TDA๋ ์ด๋ฏธ์ง ๋ถ์, ์ ๊ฒฝํ, ์ฌ์ฅํ, ๊ฐํ, ์ ์ ์ยท๋จ์ผ์ธํฌ ์ ์ฌ์ฒดํ, ์ฝ๋ฌผ ๋ฐ๊ฒฌ, ์งํ, ๋จ๋ฐฑ์ง ๊ตฌ์กฐ ๋ถ์ ๋ฑ ๋ค๋ฐฉ๋ฉด์ ๋๋ฆฌ ์ ์ฉ๋์ด ์๋ค[8]. ์ด๋ฏธ์ง ๋ด๋ถ์ ๊ณ ์ ์์ ํน์ง์ ํ์ฉํจ์ผ๋ก์จ TDA๋ ์ด๋ฏธ์ง ๋ถ์์ ์๋ก์ด ๊ด์ ์ ์ ๊ณตํ๋ค. ์ด๋ฏธ์ง ๋ด ์จ๊ฒจ์ง ํจํด์ ํฌ์ฐฉํ๋ TDA์ ๋ฅ๋ ฅ์ ์ด๋ฏธ์ง ๋ถํ , ๊ฐ์ฒด ์ธ์, ์ด๋ฏธ์ง ์ ํฉ, ์ด๋ฏธ์ง ๋ณต์ ๋ฑ ๋ค์ํ ์์ ์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ด์ด์ค๋ค. ์ด๋ฏธ์ง ๋ถ์์์ ํํ ์ฌ์ฉ๋๋ TDA ๋๊ตฌ๋ ์ง์ ๋ํ(persistent homology, PH)์ด๋ฉฐ, ์ง๋ 20๋ ๊ฐ ์ด๋ฏธ์งยทํํ ๋ถ์์์ ํจํด ์ธ์์ ๋ฐ์ด๋ ์ฑ๊ณผ๋ฅผ ๋ณด์ฌ์๋ค[9]. ์๋ฃ ์์ ๋ถ์ผ์์๋ PH๊ฐ ๊ฐ ๋ณ๋ณ, ์กฐ์ง๋ณ๋ฆฌํ[10], ์ฌ์ ์ ์ด๋ฏธ์ง, ๋ง๋ง ์ด๋ฏธ์ง[11][12], ํ๋ถ Xโray ์ด๋ฏธ์ง[6], ์ข ์ ๋ถ๋ฅ, ์ ๊ฒฝ ํํํ, ๋ ๋๋งฅ ํธ๋ฆฌ[13], fMRI ๋ฐ์ดํฐ[14], ์ ์ ์ฒด ๋ฐ์ดํฐ[15] ๋ถ์์ ํจ๊ณผ์ ์ผ๋ก ํ์ฉ๋์๋ค. TDA ๋ฐฉ๋ฒ๋ก ์ ๋ํ ํฌ๊ด์ ์ธ ๋ฆฌ๋ทฐ๋ ์ฐ์ํ ์๋ฒ ์ด[16]์์ ํ์ธํ ์ ์๋ค.
๋ณธ ์ฐ๊ตฌ์์๋ PH๋ฅผ AD ๋จ๊ณ ๊ตฌ๋ถ์ ์ํ ํจ๊ณผ์ ์ธ ํน์ง ์ถ์ถ ๋ฐฉ๋ฒ์ผ๋ก ํ์ฉํ๋ค. PH๋ ์ค์ผ์ผ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ณํ์ํค๋ฉด์ ๋ฐ์ดํฐ ๋ด ์จ๊ฒจ์ง ํจํด์ ์ฒด๊ณ์ ์ผ๋ก ํ์ํ ์ ์๊ฒ ํด์ฃผ๋ TDA ํต์ฌ ๊ธฐ๋ฒ์ด๋ค. ํํฐ๋ ์ด์ ๊ณผ์ ์์ ๋ํ๋๋ ์์ ํน์ง(ํ์ยท์๋ฉธ ์์ )์ ์ง์์ฑ์ ํตํด ๋ฐ์ดํฐ์ ํน์ฑ๊ณผ ์กฐ์ง์ ํ์ ํ๋ค. ์ฌ๊ธฐ์๋ ์ด๋ฏธ์ง ๋ถ์(ํ๋น ํผ์์คํด์ค) ๊ด์ ์์ PH์ ๊ธฐ๋ณธ ๊ฐ๋ ์ ๊ฐ๋ตํ ์๊ฐํ๋ค. ์ ๊ตฌ๋ฆยท๋คํธ์ํฌ์ ๊ฐ์ ๋ค๋ฅธ ๋ฐ์ดํฐ ์ ํ์ ๋ํ PH ์ ์ฉ์ ๋ํ ์์ธํ ๋ด์ฉ์ [17]์ ์ฐธ๊ณ ํ๋ค. PH ๊ณผ์ ์ ํฌ๊ฒ ์ธ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋๋ค: 1) ํํฐ๋ ์ด์ ๋จ๊ณ โ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ก๋ถํฐ ์ผ๋ จ์ ํ๋น ๋ณตํฉ์ฒด(cubical complexes)๋ฅผ ์ ๋ํ๋ค; 2) ์ง์ ๋ค์ด์ด๊ทธ๋จ(persistence diagram, PD) ๋จ๊ณ โ ํํฐ๋ ์ด์ ๊ณผ์ ์์ ์์ ํน์ง(ํ์ยท์๋ฉธ ์์ )์ ๋ณํ๋ฅผ ๊ธฐ๋กํ๋ค; 3) ๋ฒกํฐํ(vectorization) ๋จ๊ณ โ ๊ธฐ๋ก๋ ์ ๋ณด๋ฅผ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๋ ํน์ง ๋ฒกํฐ๋ก ๋ณํํ๋ค.
Stepโฏ1: ํํฐ๋ ์ด์
๊ตฌ์ฑ
PH๋ ํ๋น
๋ณตํฉ์ฒด์ ์ฐ์์ ์ธ ๋ณํ๋ฅผ ์ถ์ ํ๋ค. ์ด๋ฏธ์ง ๋ถ์์์๋ ์ผ๋ฐ์ ์ผ๋ก ์ด ์ฐ์์ ์ด์ง ์ด๋ฏธ์ง๋ค์ ์ค์ฒฉ ์ํ์ค๋ก ๋ง๋ ๋ค. 3D ํ์์กฐ ์ด๋ฏธ์ง (X) (์: (m \times n) ํฝ์
, ๊น์ด (h) ์ฌ๋ผ์ด์ค)๋ฅผ ๊ฐ์ ํ๊ณ , ๊ฐ ํฝ์
(\Delta_{ijk}\subset X)์ ํ์์กฐ ๊ฐ (\Upsilon_{ijk})๋ฅผ ์ฌ์ฉํ๋ค. ํ์์กฐ ๊ฐ์ ์์ (t_1<t_2<\dots<t_N)์ ๋ํด,
[
$X_n$={\Delta_{ijk}\subset X \mid \Upsilon_{ijk}\le $t_n$}
]
์ ๊ฐ์ด ์ด์ง ์ด๋ฏธ์ง๋ค์ ์ค์ฒฉ ์ํ์ค (X_1\subset X_2\subset\cdots\subset X_N)์ ๋ง๋ ๋ค. ์ด๋ฅผ sublevel filtration์ด๋ผ ํ๋ค. ๋ฐ๋๋ก ํ์์กฐ ๊ฐ์ ๋ด๋ฆผ์ฐจ์์ผ๋ก ํ์ฑํํ๋ superlevel filtration๋ ๊ฐ๋ฅํ๋ฉฐ, ์๋ ์ฐ๋ ์ด์ค์ฑ(Alexander duality) ๋๋ฌธ์ ๋์ผํ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ค.
Stepโฏ2: ์ง์ ๋ค์ด์ด๊ทธ๋จ
ํํฐ๋ ์ด์
(X_1\subset X_2\subset\cdots\subset X_N)์ ๋ํด ์ง์ ๋ค์ด์ด๊ทธ๋จ(PD)์ ๋ง๋ ๋ค. PD๋ ์์ ํน์ง์ ํ์ยท์๋ฉธ ์์ ์ 2โํํ (($b_\$sigma,$d_\$sigma)) ํํ๋ก ์์ฝํ๋ค. ์๋ฅผ ๋ค์ด, ์์ ํน์ง (\sigma)๊ฐ ์ฒ์ ๋ํ๋ ํํฐ๋ ์ด์
๋จ๊ณ๊ฐ (X_{i_0})๋ผ๋ฉด ํ์ ์์ ($b_\$sigma=i_0)๊ฐ ๊ธฐ๋ก๋๊ณ , ์ฌ๋ผ์ง ๋จ๊ณ๊ฐ (X_{j_0})๋ผ๋ฉด ์๋ฉธ ์์ ($d_\$sigma=j_0)๊ฐ ๊ธฐ๋ก๋๋ค. ์ํ์ ์ผ๋ก๋
[
($b_\$sigma,$d_\$sigma)=\bigl(\min{i\mid\sigma\in $H_k$($X_i$)},;\max{j\mid\sigma\in $H_k$($X_j$)}\bigr)
]
์ ๊ฐ์ด ์ ์ํ๋ค. ์ฌ๊ธฐ์ ($H_k$($X_i$))๋ (k)์ฐจ ๋ํ๊ตฐ์ผ๋ก, (k)โ์ฐจ์ ์์ ํน์ง(์: (k=0)์ ์ฐ๊ฒฐ ์ฑ๋ถ, (k=1)์ ๋ฃจํ, (k=2)๋ ๊ณต๋)์ ๋ํ๋ธ๋ค. 3D ์ด๋ฏธ์ง ๋ถ์์์๋ (k=0,1,2)๊ฐ ์๋ฏธ ์๋ค. ์๋ฅผ ๋ค์ด, ๋ฃจํ (\sigma)๊ฐ (X_3)์์ ์ฒ์ ๋ํ๋๊ณ (X_5)์์ ๋ฉ์์ง๋ฉด ((3,5))๊ฐ (PD_1(X))์ ์ถ๊ฐ๋๋ค. ์ฐ๊ฒฐ ์ฑ๋ถ์ด (X_1)์์ ์์ฑ๋ผ (X_4)์์ ๋ค๋ฅธ ์ฑ๋ถ๊ณผ ํฉ์ณ์ง๋ฉด ((1,4))๊ฐ (PD_0(X))์ ๊ธฐ๋ก๋๋ค.
Stepโฏ3: ๋ฒกํฐํ
PD๋ 2โํํ๋ค์ ์งํฉ์ด๋ฏ๋ก ์ง์ ๋จธ์ ๋ฌ๋์ ์ฌ์ฉํ ์ ์๋ค. ๋ฐ๋ผ์ PD ์ ๋ณด๋ฅผ ๋ฒกํฐ ํน์ ํจ์ ํํ๋ก ๋ณํํ๋ ๋ฒกํฐํ๊ฐ ํ์ํ๋ค. ๊ฐ์ฅ ํํ ๋ฐฉ๋ฒ ์ค ํ๋๋ Betti ํจ์์ด๋ค. Betti ํจ์๋ ๊ฐ ์๊ณ๊ฐ ($t_n$)์์ ์ด์์๋(topologically alive) ํน์ง์ ๊ฐ์๋ฅผ ๋จ๊ณ ํจ์ ํํ๋ก ๋ํ๋ธ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก
[
\beta_0($t_n$)=\text{์ฐ๊ฒฐ ์ฑ๋ถ ์},\quad
\beta_1($t_n$)=\text{๋ฃจํ(๊ตฌ๋ฉ) ์},\quad
\beta_2($t_n$)=\text{๊ณต๋(๊ณต๊ทน) ์}
]
์ด๋ฉฐ, (N)๊ฐ์ ์๊ณ๊ฐ์ ๋ํด ([\bet$a_k$(t_1),\dots,\bet$a_k$(t_N)]) ํํ์ ๋ฒกํฐ๊ฐ ์์ฑ๋๋ค. ์์๋ก Figureโฏ2์์ ์ป์ (\beta_0) ๋ฒกํฐ๋ ([5,4,2,1,1])๊ณผ ๊ฐ๋ค. Betti ๋ฒกํฐ (\beta_0,\beta_1,\beta_2)๋ ์ด๋ฏธ์ง์ ์์ ํจํด์ ํฌ์ฐฉํ๋ ๊ฐ๋ ฅํ ํน์ง ์ถ์ถ ๋ฐฉ๋ฒ์ด๋ฉฐ, ๋ค๋ฅธ ๋ฒกํฐํ ๊ธฐ๋ฒ(์: Persistence Landscape, Persistence Image, Silhouette)๋ ์กด์ฌํ๋ค. Silhouette ํจ์๋
[
\rho(t)=\frac{\su$m_j$ $w_j$ \max{0,,\min(t-$d_j$,,$b_j$-t)}}{\su$m_j$ $w_j$}
]
์ ๊ฐ์ด ์ ์๋๋ฉฐ, ์ฌ๊ธฐ์ ($w_j$=($d_j$-$b_j$)^p)๋ ๊ฐ์ค์น์ด๋ค. ์ ํํ ๋ฒกํฐํ ๋ฐฉ๋ฒ์ ๋ฐ์ดํฐ ํน์ฑ์ ๋ฐ๋ผ ๋ชจ๋ธ ์ฑ๋ฅ์ ํฐ ์ํฅ์ ๋ฏธ์น ์ ์๋ค.
์ผ๋ฐ์ ์ผ๋ก ์๋ช ์ด ์งง์ ์์ ํน์ง์ ์ก์(noise)์ผ๋ก ๊ฐ์ฃผ๋๋ค. ์ผ๋ถ ๋ฒกํฐํ ๋ฐฉ๋ฒ์ ์ด๋ฌํ ์ก์์ ์ต์ํํ๋ ค ํ์ง๋ง, Betti ํจ์๋ ์งง์ ์๋ช ์ ํน์ง๋ ํฌํจํด ์ ์ฒด์ ์ธ ์์ ๊ตฌ์กฐ๋ฅผ ๊ทธ๋๋ก ๋ฐ์ํ๋ค. ์์ธ ํ์ด๋จธ 3D MRI์์๋ ๋๋ถ๋ถ์ ์์ ํน์ง์ด ์งง์ ์๋ช ์ ๊ฐ์ง๋ฏ๋ก Betti ํจ์๊ฐ ์์ ํจํด์ ํฌ์ฐฉํ๋ ๋ฐ ํจ๊ณผ์ ์ด๋ค. ๋ํ Betti ํจ์๋ ์ง์ ์ ์ผ๋ก ํน์ง ์๋ฅผ ์ธ๊ธฐ ๋๋ฌธ์ ํด์์ด ๊ฐ์ฅ ์ฉ์ดํ๋ค. ์ด๋ฌํ ์ด์ ๋ก ๋ณธ ์ฐ๊ตฌ์์๋ Betti ํจ์๋ฅผ ๋ฒกํฐํ ๋ฐฉ๋ฒ์ผ๋ก ์ฑํํ์๋ค.
๋ชจ๋ธ ํ๋ฆ๋(๊ทธ๋ฆผโฏ3)
์์ธ ํ์ด๋จธ 3D MRI๋ ์ฐ์์ ์ธ 2D ์ฌ๋ผ์ด์ค๋ก ๊ตฌ์ฑ๋ ํ์์กฐ ์ด๋ฏธ์ง์ด๋ฏ๋ก, ๋ณธ ์ฐ๊ตฌ์์๋ ํ์์กฐ ๊ธฐ๋ฐ sublevel filtration์ ์ ์ฉํ๋ค. ํ์์กฐ ๊ฐ์ 0(๊ฒ์ )๋ถํฐ 255(ํฐ์)๊น์ง์ด๋ฉฐ, ํํฐ๋ ์ด์
๋จ๊ณ์์๋ ์๊ณ๊ฐ์ 100๊ฐ(N=100)๋ก ์ค์ ํ์๋ค. ์ฆ, ํ์์กฐ ๊ตฌ๊ฐ [0,255]๋ฅผ [0,100]์ผ๋ก ์ ๊ทํํ ๋ค, (X_1\subset X_2\subset\cdots\subset X_{100})์ ๋ง๋ ๋ค. ์ดํ ๊ฐ 3D MRI์ ๋ํด ์ฐจ์ (k=0,1,2)์ ๋ํ ์ง์ ๋ค์ด์ด๊ทธ๋จ (P$D_k$(X))๋ฅผ ์์ฑํ๋ค. ์ป์ด์ง PD๋ฅผ ์์ ์ค๋ช
ํ ๋๋ก Betti ํจ์ (\bet$a_k$(X))๋ก ๋ณํํ๋ฉด, ํ๋์ MRI๋น 3โฏรโฏ100โฏ=โฏ300๊ฐ์ ํน์ง์ด ์ถ์ถ๋๋ค. ์ด๋ ๊ฒ ์ป์ 300์ฐจ์ ์์ ํน์ง ๋ฒกํฐ๋ฅผ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์
๋ ฅํ๋ค.
๋จธ์ ๋ฌ๋ ์ ์ฉ
ํน์ง ๋ฒกํฐ๋ฅผ ์ด์ฉํ ์ต์ข
๋จ๊ณ์์๋ XGBoost๋ฅผ ์ ์ฉํด ๋ฒ ํฐ ๋ฒกํฐ๋ฅผ ๋ถ๋ฅํ๋ค. ๋ฐ์ดํฐ ์ฆ๊ฐ์ด๋ ์ ์ฒ๋ฆฌ๋ ์ ํ ์ฌ์ฉํ์ง ์์๋ค. ์์ ํน์ง ๋ฒกํฐ๋ ํ์ , ๋ค์ง๊ธฐ ๋ฑ ์ผ๋ฐ์ ์ธ ๋ฐ์ดํฐ ์ฆ๊ฐ์ ๋ํด ๋ถ๋ณ(invariant)ํ๋ฏ๋ก, ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์๋ ํจ์จ์ ์ผ๋ก ์ ์ฉ ๊ฐ๋ฅํ๋ค.
๋ฐ์ดํฐ์
๋ณธ ์ฐ๊ตฌ์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ๋ ์์ธ ํ์ด๋จธ๋ณ ์ ๊ฒฝ์์ ์ด๋์
ํฐ๋ธ(ADNI) ๋ฐ์ดํฐ๋ฒ ์ด์ค(adni.loni.usc.edu)์์ ํ๋ณดํ์๋ค[18][19]. ADNI๋ 2003๋
Michael W. Weiner ๋ฐ์ฌ(MD)๊ฐ ์ฃผ๋ํ ๊ณตยท๋ฏผ ํ๋ ฅ ํ๋ก์ ํธ๋ก, ๊ฒฝ๋์ธ์ง์ฅ์ (MCI)์ ์ด๊ธฐ ์์ธ ํ์ด๋จธ๋ณ(AD)์ ์งํ์ ์ฐ์์ ์ธ T1โweighted 3D MRI, PET, ์์ยท์ ๊ฒฝ์ฌ๋ฆฌ ๊ฒ์ฌ, ๊ธฐํ ๋ฐ์ด์ค๋ง์ปค๋ฅผ ํตํด ๋ชจ๋ํฐ๋งํ๋ ๊ฒ์ด ์ฃผ์ ๋ชฉํ์ด๋ค. ์ฐ๋ฆฌ๋ ADNI์ T1โweighted 3D MRI๋ฅผ ์ด์ฉํด ์ด์ง ๋ฐ ๋ค์ค ํด๋์ค ๋ถ๋ฅ๋ฅผ ์ํํ์๋ค. ์ค์บ ์์ ์ ์คํฌ๋ฆฌ๋, 6๊ฐ์, 1๋
, 18๊ฐ์(MCI๋ง), 2๋
ยท3๋
(์ ์ยทMCI) ๋ฑ์ด๋ฉฐ, ADNI1์ ์์ 3๋
3T ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์๋ค. ๋ฐ์ดํฐ์
์ ๋ํด 10โfold ๊ต์ฐจ ๊ฒ์ฆ์ ์ํํ์๋ค. ๋ชจ๋ธ ํ๊ฐ๋ฅผ ์ํด ์ด์ง(NC/AD) ๋ฐ ๋ค์ค(NC/MCI/AD) ๋ถ๋ฅ ์คํ์ ๊ด๋ฒ์ํ๊ฒ ์งํํ์ผ๋ฉฐ, ์
๋ ฅ์ผ๋ก๋ ์ค๊ฐ 50๊ฐ์ ์ฌ๋ผ์ด์ค๋ง ์ฌ์ฉํ์๋ค.
ADNI ๋ฐ์ดํฐ์
์ ์ ๊ฒฝ์์ ๋ถ์ผ, ํนํ AD ํ์ ๋ถ๋ฅ๋ฅผ ์ํ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ํ๊ฐ์ ๋๋ฆฌ ํ์ฉ๋๋ค. ๊ธฐ์กด์๋ ๋ค์ํ ๋ชจ๋ธ์ด ์ ์ฉ๋์ผ๋ฉฐ, ๋ณธ ์ฐ๊ตฌ์์๋ ADNI๊ฐ ์ ๊ณตํ๋ 3D MRI์์ ์ถ์ถํ ๋ฒ ํฐ ๋ฒกํฐ๋ฅผ XGBoost๋ก ๋ถ๋ฅํ์๋ค. ์ด์ง ๋ถ๋ฅ์์๋ MCI์ AD๋ฅผ ํ๋์ ํด๋์ค(๋ณ)๋ก ํฉ์ณค์ผ๋ฉฐ, 10โfold ๊ต์ฐจ ๊ฒ์ฆ์ ํตํด ๋ชจ๋ธ์ ๊ฒฌ๊ณ ํจ๊ณผ ์ผ๋ฐํ๋ฅผ ํ๋ณดํ์๋ค. ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์์ ์ํด ํ๋ผ๋ฏธํฐ ํ๋๊ณผ ํน์ง ์ ํ(feature selection)์ ์ํํ์ผ๋ฉฐ, scikitโlearn์ SelectFromModel ํจ์๋ฅผ ์ด์ฉํด ์ค์๋ ์ ์๊ฐ ๋ฎ์ ํน์ง์ ์ ์ธํ์๋ค. ์ต์ ํ๋ผ๋ฏธํฐ๋ colsampl$e_b$ytree=0.3, learnin$g_r$ate=0.2, ma$x_d$epth=7, $n_e$stimators=500์ด๋ฉฐ, ์ด ์ค์ ์ด ํ๊ท ์ ํ๋(accuracy)๋ฅผ ์ต๊ณ ๋ก ๋ง๋ค์๋ค. ๋ชจ๋ธ ํ๊ฐ๋ ๊ฐ fold๋ณ ์ ๋ฐ๋(precision), ์ฌํ์จ(recall), ์ ํ๋, AUC, F1โscore๋ฅผ ์ฐ์ถํ๊ณ ํ๊ท ๊ฐ์ ๋ณด๊ณ ํ์๋ค. ๋ค์ค ํด๋์ค ๋ถ๋ฅ์์๋ ์ผ๋๋ค(OvR) ๋ฐฉ์์ ์ฌ์ฉํด ROCโAUC๋ฅผ ๊ณ์ฐํ์๋ค.
์คํ ๊ฒฐ๊ณผ
๋ณธ ์ ์์๋ ์์ธ ํ์ด๋จธ 3D MRI์ ๋ํ ๋ชจ๋ธ ์ฑ๋ฅ์ ๋ณด๊ณ ํ๋ค. ์ฌ๊ธฐ์ (\beta_0)๋ 0โ์ฐจ์ ์์ ํน์ง(์ฐ๊ฒฐ ์ฑ๋ถ), (\beta_1)์ 1โ์ฐจ์ ํน์ง(๋ฃจํยท๊ตฌ๋ฉ), (\beta_2)๋ 2โ์ฐจ์ ํน์ง(๊ณต๋ยท๊ณต๊ทน)์ ์๋ฏธํ๋ค. (\beta_1+\beta_2)๋ ๊ฐ๊ฐ 100โ์ฐจ์์ธ (\beta_1)๊ณผ (\beta_2)๋ฅผ ํฉ์น 200โ์ฐจ์ ํน์ง์ด๋ฉฐ, (\beta_0+\beta_1+\beta_2)๋ ์ ์ฒด 300โ์ฐจ์ ํน์ง์ ์๋ฏธํ๋ค.
์ฐ์ ์ด์ง ๋ถ๋ฅ์ 3โclass ๋ถ๋ฅ ๋ชจ๋์์ ์ต์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ์๋ค. ADNI ๋ฐ์ดํฐ์ ์ ๋ํ 2โclass(์ ์ vs AD) ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ ๊ทธ๋ฆผโฏ4a์ ํ๊ท ํผ๋ ํ๋ ฌ(%) ํํ๋ก ์ ์๋๋ฉฐ, ์ ์ ๋ชจ๋ธ์ด ๋์ ์ง์์ฑ(true positive)ยท์ง์์ฑ(true negative) ๋น์จ์ ๋ณด์์ ํ์ธํ ์ ์๋ค. 3โclass ๋ถ๋ฅ์์๋ ์ฌ๋ฌ ์ต์ ๋ชจ๋ธ์ด ์ข์ ์ฑ๋ฅ์ ๋ณด์์ผ๋, ์ฐ๋ฆฌ ๋ชจ๋ธ์ ํนํ (\beta) ํน์ง์ ์ด์ฉํ XGBoost๊ฐ ๊ฐ์ฅ ๋์ ์ ํ๋์ AUC๋ฅผ ๊ธฐ๋กํ์๋ค.
๋
ผ์
PH๋ฅผ 3D MRI์ ์ ์ฉํ ๋ณธ ์ฐ๊ตฌ๋ TDA๊ฐ ์ ๊ณตํ๋ ์์ ํน์ง์ด AD ๋จ๊ณ ๊ตฌ๋ถ์ ์ ์๋ฏธํ ์ ๋ณด๋ฅผ ๋ด๊ณ ์์์ ์
์ฆํ๋ค. PH๋ ์ด๋ฏธ์ง ์ฌ๋ผ์ด์ค ๊ฐ์ ์ข
์์ฑ์ ์ ์งํ๋ฉด์ 3D ๊ตฌ์กฐ์ ์ ๋ณด๋ฅผ ๋ณด์กดํ๋ค๋ ์ฅ์ ์ด ์๋ค. ์คํ ๊ฒฐ๊ณผ๋ ๋น๋ก ๋ฅ๋ฌ๋์ ์ฌ์ฉํ์ง ์์์์๋ ๋ถ๊ตฌํ๊ณ , ์ ์ ๋ชจ๋ธ์ด ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์
์์ ์ต์ฒจ๋จ ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐํจ์ ๋ณด์ฌ์ค๋ค(ํโฏ1,โฏ2). ์ด๋ TDA๊ฐ 3D MRI ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌ ๊ฐ๋ฅํ๊ณ ํด์ ๊ฐ๋ฅํ ์์ ํน์ง ๋ฒกํฐ๋ก ๋ณํํจ์ผ๋ก์จ ์ ํต์ ์ธ MLยทDL ๋ชจ๋ธ์ด ์ง๋ฉดํ ๊ณ์ฐ ๋ณต์ก๋์ ํด์์ฑ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๋ค๋ ์ ์ ์์ฌํ๋ค. ํ์ฌ 3D ์ด๋ฏธ์ง, ํนํ ์๋ฃ ์์์์ TDA๋ฅผ ํ์ฉํ ์ฐ๊ตฌ๋ ์์ง ์ด๊ธฐ ๋จ๊ณ์ด๋ฉฐ, ๊ด๋ จ ๋
ผ๋ฌธ ์๋ ์ ํ์ ์ด๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ , ๋ณธ ์ฐ๊ตฌ์์์ ๊ฐ์ด PH ๊ธฐ๋ฐ ํน์ง์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๊ฒฐํฉํ๋ฉด ๋์ ๋ถ๋ฅ ์ฑ๋ฅ์ ๋ฌ์ฑํ ์ ์๋ค. ์์ผ๋ก๋ ๋ ๋ค์ํ TDA ๊ธฐ๋ฒ(์: ๋ค์ค ํํฐ๋ ์ด์
, ๋ค์ค ์ฐจ์ ์ง์ ์ด๋ฏธ์ง)๊ณผ ๋ฅ๋ฌ๋์ ๊ฒฐํฉํ๊ฑฐ๋, ๋๊ท๋ชจ ๋ค๊ธฐ๊ด ๋ฐ์ดํฐ์ ์ ์ฉํด ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๊ฒ์ฆํ๋ ๊ฒ์ด ํ์ํ๋ค.
๊ฒฐ๋ก
๋ณธ ๋
ผ๋ฌธ์ ์์ธ ํ์ด๋จธ๋ณ 3D MRI์ ์ง์ ๋ํ(persistent homology)์ ์ ์ฉํด ์์ ํน์ง์ ์ถ์ถํ๊ณ , ์ด๋ฅผ XGBoost ๊ธฐ๋ฐ ๋ถ๋ฅ๊ธฐ์ ์
๋ ฅํจ์ผ๋ก์จ ์ด์ง ๋ฐ ๋ค์ค ํด๋์ค AD ์ง๋จ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ ์ฌ๋ก๋ฅผ ์ ์ํ๋ค. ์ ์์ยทMCIยท์น๋งค ๋จ๊ณ ์ ๋ฐ์ ๊ฑธ์น ์์ ๋ณํ๋ฅผ ์ ๋ํํจ์ผ๋ก์จ, ์กฐ๊ธฐ ์ง๋จ ๋ฐ ์น๋ฃ ๊ฐ์
์ ํ์ํ ๊ฐ๊ด์ ๋ฐ์ด์ค๋ง์ปค๋ฅผ ์ ๊ณตํ๋ค. ํฅํ ์ฐ๊ตฌ์์๋ TDA์ ๋ฅ๋ฌ๋์ ์ตํฉํ๊ฑฐ๋, ๋ค๋ฅธ ์ ๊ฒฝ์์ ๋ชจ๋ฌ๋ฆฌํฐ(PET, fMRI)์ ๊ฒฐํฉํด ๋ค์ค ๋ชจ๋ฌ๋ฆฌํฐ ํตํฉ ๋ถ์์ ์๋ํจ์ผ๋ก์จ ์์ธ ํ์ด๋จธ๋ณ์ ๋ณตํฉ์ ๋ณ๋ฆฌ ๋ฉ์ปค๋์ฆ์ ๋ณด๋ค ์ ๋ฐํ๊ฒ ๊ท๋ช
ํ ์ ์์ ๊ฒ์ผ๋ก ๊ธฐ๋ํ๋ค.