정규화되지 않은 그랜저 인과성으로 보는 시너지와 중복 정보 흐름
초록
본 논문은 정규화되지 않은 형태의 그랜저 인과성을 이용해 다변량 시계열에서 변수들의 시너지와 중복성을 정량화하는 새로운 프레임워크를 제안한다. 이를 통해 뇌의 휴식 상태 fMRI 데이터에 적용했을 때, 공간적으로 인접하거나 양측 대칭을 이루는 영역들은 주로 중복 관계를, 반대 반구의 비동질적 영역들은 주로 시너지 관계를 나타냄을 확인하였다.
상세 분석
이 연구는 기존 그랜저 인과성(GC) 정의가 로그 변환을 포함해 변수 간의 독립적 기여를 선형적으로 합산하지 못한다는 한계를 지적한다. 특히 다변량 시스템에서 변수들이 서로 중복되거나 시너지 효과를 보일 경우, 표준 GC는 인과력을 과소 혹은 과대 평가한다. 이를 해결하기 위해 저자들은 “정규화되지 않은 그랜저 인과성”(unnormalized GC) δ_u 을 정의하였다. δ_u는 예측 오차 분산의 차이(ε_without B – ε_with B)로 계산되며, 독립적이고 선형적으로 결합된 변수 집합 B에 대해 δ_u(B→α)=∑_{β∈B}δ_u(β→α)라는 가법성을 만족한다. 이 가법성은 로그 변환이 없는 덕분에 가능하며, 변수들의 기여를 직접 비교할 수 있는 기반을 제공한다.
시너지와 중복을 정량화하기 위해 저자들은 두 가지 조건을 제시한다.
- 시너지: δ_u(B→α) < ∑_{β∈B}δ_u(β→α)
- 중복: δ_u(B→α) > ∑_{β∈B}δ_u(β→α)
즉, 전체 집합이 개별 기여의 합보다 작으면 시너지, 크면 중복으로 판단한다. 이 정의는 기존 정보이론 기반의 상호정보(interaction information)와는 달리, 연속형 변수에 직접 적용 가능하도록 설계되었다.
또한, 특정 타깃 α에 대해 모든 가능한 변수 집합 B의 파티션을 탐색하여 총 δ_u 값을 최대화하는 파티션을 찾음으로써, 중복 변수들을 효과적으로 그룹화한다. 예시로 제시된 3변수 시스템에서는 {x₁,x₂}가 중복 관계에 있을 때 전체 δ_u가 가장 크게 되는 파티션이 {x₁,x₂}|{x₃}임을 확인한다. 이는 실제 데이터에서 중복된 뇌 영역들을 자동으로 클러스터링하는 데 활용될 수 있다.
시너지 지수를 쌍별(pairwise)로 정의하기 위해, 두 변수 X_i와 X_j가 타깃 α에 미치는 정규화되지 않은 인과성 차이를 계산한다. 이 지수는 두 변수가 독립적으로 작용할 경우 0이 되며, 기존 정의와 달리 “양의 시너지”와 “음의 시너지”를 구분하지 않는다. 따라서 복잡한 뇌 네트워크에서 비동질적 영역 간의 상호작용을 명확히 드러낼 수 있다.
실험에서는 Human Connectome Project(HCP)에서 수집한 휴식 상태 fMRI 데이터를 90개 뇌 영역(아키텍처 기반)으로 전처리하고, 각 영역의 BOLD 시계열에 대해 정규화되지 않은 GC와 쌍별 시너지 지수를 계산하였다. 결과는 다음과 같다.
- 공간적으로 인접하거나 양측 대칭을 이루는 영역 쌍은 높은 중복 지수를 보였으며, 이는 공통 혈류 동역학 혹은 해부학적 연결성에 기인한다.
- 반대 반구에 위치하지만 기능적으로 연관된 비동질적 영역(예: 전두엽과 후두엽 사이)에서는 양의 시너지 지수가 두드러졌다. 이는 서로 다른 기능 모듈이 협력하여 전체 뇌 상태를 유지한다는 가설을 뒷받침한다.
이러한 패턴은 정상 휴식 뇌가 “중복 회로”와 “시너지 회로”의 균형을 유지한다는 기존 이론을 정량적으로 입증한다. 또한, 제안된 프레임워크는 임상 데이터에 적용해 병리적 상태(예: 알츠하이머, 간질)에서 이 균형이 어떻게 깨지는지를 탐색하는 기반이 될 수 있다.
전반적으로, 정규화되지 않은 그랜저 인과성은 다변량 시계열 분석에서 시너지와 중복을 명확히 구분하고, 이를 네트워크 형태로 시각화할 수 있게 함으로써 복잡계 연구에 새로운 도구를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기