뇌 활동 지도 클러스터링을 위한 확산 지도 기반 차원 축소와 스펙트럴 군집화

본 연구는 fMRI에서 ICA로 추출한 고차원 공간 지도들을, 비선형 차원 축소 기법인 확산 지도를 이용해 저차원으로 압축한 뒤 스펙트럴 클러스터링으로 두 개의 군집(밀집·희소)으로 구분한다. 전통적인 상관 기반 군집화와 PCA·kPCA 기반 방법과 비교했을 때, 동일한 군집 구조를 재현하면서 시각화가 용이하고 군집 경계가 더 명확하게 나타난다.

저자: Tuomo Sipola, Fengyu Cong, Tapani Ristaniemi

뇌 활동 지도 클러스터링을 위한 확산 지도 기반 차원 축소와 스펙트럴 군집화
본 논문은 기능적 자기공명영상(fMRI) 데이터에서 독립 성분 분석(ICA)으로 추출한 공간 지도들을 효과적으로 군집화하기 위한 새로운 파이프라인을 제안한다. fMRI 연구에서는 일반적으로 n개의 공간 지도(각 지도는 하나의 뇌 활동 패턴을 나타냄)와 p개의 볼셀(공간 해상도)로 구성된 데이터 매트릭스가 생성되는데, 여기서 n은 수십에서 수백 수준인 반면 p는 수십만에 달한다는 “소수‑다수” 특성을 가진다. 기존 연구에서는 n × n 상관 행렬을 기반으로 계층적 군집화, k‑means, 혹은 스펙트럴 클러스터링을 적용했지만, 이러한 선형 유사도는 고차원 데이터의 복잡한 비선형 구조를 충분히 반영하지 못한다는 점이 지적되어 왔다. 이에 저자는 비선형 차원 축소 기법인 확산 지도(Diffusion Map)를 도입한다. 확산 지도는 데이터 포인트 간의 전이 확률을 정의하고, 이 전이 행렬의 고유값·고유벡터를 이용해 저차원 임베딩을 생성한다. 구체적인 절차는 다음과 같다. 첫 단계에서 각 공간 지도에 로그 정규화를 적용해 스케일 차이를 보정한다. 두 번째 단계에서는 가우시안 커널 W₍ᵢⱼ₎ = exp(−‖xᵢ−xⱼ‖²/ε) 로 affinity matrix를 만든다. 여기서 ε는 커널 폭으로, 전체 가중치 합 L = ∑₍ᵢⱼ₎ W₍ᵢⱼ₎ 의 선형 구간을 탐색해 선택한다(그림 1 참고). 이후 행합 행렬 D를 이용해 전이 행렬 P = D⁻¹W를 정규화하고, 대칭화된 라플라시안 ˜P = D^{‑½} W D^{‑½} 를 구성한다. SVD를 수행해 고유값 λ₁≥λ₂≥…와 고유벡터 v₁, v₂,…를 얻고, 저차원 좌표 Ψ는 (λ₂v₂, λ₃v₃,…, λ_{d+1}v_{d+1}) 로 정의한다. 고유값의 감쇠 속도에 따라 적절한 차원 d를 선택한다(보통 2~3차원). 임베딩이 완료되면, 저차원 공간에서 스펙트럴 클러스터링을 적용한다. 저자는 두 번째 고유벡터(v₂)의 부호를 기준으로 0을 경계로 하는 선형 분리를 사용했으며, 이는 정규화 컷(Normalized Cut) 문제의 해와 동일하다. 결과적으로 두 개의 군집—‘밀집(dense)’과 ‘희소(sparse)’—이 명확히 구분된다. 실험 데이터는 11명의 전문 음악가가 512 초 길이의 현대 탱고 음악을 자유 청취한 fMRI 세션에서 추출한 23개의 ICA 공간 지도(p = 209 633)이다. 각 지도는 음악의 밝기(brightness) 특성과의 상관이 유의미(p < 0.05)한 경우에만 선택되었다. ε 선택 과정은 전체 가중치 합 L을 ε에 대해 플롯한 뒤, 선형 구간 중앙값을 채택함으로써 안정적인 전이 행렬을 얻었다. 차원 축소 후, 저자는 1차원 임베딩만으로도 충분히 군집을 구분할 수 있음을 확인했으며, 시각화는 첫 두 개 고유쌍을 사용해 2차원 평면에 표시하였다(그림 2). 비교 실험으로는 (1) 전통적인 상관 기반 계층적 군집(agglomerative hierarchical clustering)과 k‑means, (2) PCA 및 Gaussian kernel을 이용한 kernel PCA 기반 스펙트럴 클러스터링을 수행했다. 모든 방법이 동일한 두 군집을 도출했으며, 특히 확산 지도 기반 방법은 군집 경계가 더 뚜렷하고, 밀집 군집 내부의 확산 거리 차이가 작아 군집의 응집도가 높게 나타났다(그림 3, 4). 또한, 밀집 군집에 속한 지도들의 상관 행렬은 높은 평균 상관값을 보였으며, 희소 군집은 낮은 상관값을 나타내어 군집의 의미적 차이를 뒷받침한다(그림 6‑8). 논문의 주요 기여는 다음과 같다. 첫째, 고차원 fMRI ICA 결과에 비선형 차원 축소를 적용해 데이터 구조를 보존하면서도 시각화가 가능하도록 했다. 둘째, ε 파라미터 선택을 위한 실용적인 방법을 제시해 확산 지도 구축의 재현성을 확보했다. 셋째, 스펙트럴 클러스터링과 결합해 복잡한 고차원 데이터를 단순한 선형 경계만으로도 효과적으로 군집화했다. 넷째, 기존 선형 방법과 동일한 군집 품질을 유지하면서도 시각적 해석이 용이한 결과를 제공했다. 한계점으로는 샘플 수가 크게 증가할 경우 확산 지도 계산(특히 affinity matrix와 고유분해)의 복잡도가 O(n²)·O(n³)으로 급증한다는 점이다. 이를 완화하기 위해 out‑of‑sample 확장(out‑of‑sample extension)이나 Nystrom 근사와 같은 스케일링 기법을 도입할 필요가 있다. 또한, 현재 실험은 음악 청취라는 제한된 자극에만 적용되었으므로, 다른 감각 자극이나 인지 과제에 대한 일반화 검증이 요구된다. 결론적으로, 확산 지도 기반 차원 축소와 스펙트럴 클러스터링은 fMRI ICA 공간 지도 군집화에 있어 비선형 구조를 효과적으로 포착하고, 시각적 해석을 돕는 강력한 도구임을 입증하였다. 향후 더 큰 데이터셋, 다양한 자극 조건, 그리고 실시간 뇌-컴퓨터 인터페이스와 같은 응용 분야에 확장될 가능성이 크다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기