다계층 기능주성분분석을 통한 수면 뇌파와 심혈관 위험 연계 연구
초록
본 논문은 수면심장건강연구(SHHS)의 다중 방문·다중 EEG 채널 데이터를 분석하기 위해 다계층 기능주성분분석(MFPCA)이라는 새로운 통계 기법을 제안한다. MFPCA는 개인 내·외 변동을 동시에 추출하여 주요 기능적 패턴을 요약하고, 이러한 패턴이 심혈관 질환 위험과 어떻게 연관되는지를 정량화한다. 실험 결과, 수면 중 특정 주파수 대역의 변동이 심혈관 사건 발생 위험을 유의하게 예측함을 확인하였다.
상세 분석
다계층 기능주성분분석(MFPCA)은 전통적인 기능주성분분석(FPCA)의 확장으로, 계층적 구조를 가진 함수형 데이터를 동시에 모델링한다. SHHS와 같이 동일 피험자가 여러 시점(방문)과 여러 채널(EEG 전극)에서 측정한 연속 신호는 3차원(피험자 × 방문 × 시간) 형태의 데이터 매트릭스를 형성한다. 기존 FPCA는 한 수준(예: 피험자 간)만을 고려해 평균 함수와 공분산 함수를 추정하고, 그 고유함수(eigenfunction)를 통해 차원을 축소한다. 그러나 다중 방문·다중 채널 데이터에서는 (1) 개인 내 시간적 변동(방문 간 차이), (2) 채널 간 공간적 변동, (3) 개인 간 변동이 모두 존재한다. MFPCA는 이러한 변동을 단계별로 분해한다. 먼저, 전체 평균 함수를 추정하고, 각 피험자·방문·채널에 대한 잔차 함수를 구한다. 그 다음, 1차 수준(피험자) 공분산 함수를 추정해 1차 고유함수와 점수를 얻고, 잔차를 2차 수준(방문) 공분산에 투영해 2차 고유함수와 점수를 산출한다. 마지막으로, 3차 수준(채널) 변동을 별도 공분산 구조로 모델링한다. 이 계층적 분해는 각 수준별 변동 비율을 명시적으로 제공하므로, 연구자는 어느 수준에서 주요 신호가 발생하는지 직관적으로 파악할 수 있다.
추정 단계에서는 스무딩 기법(예: B‑spline 혹은 Fourier basis)을 이용해 함수형 데이터를 부드럽게 만든 뒤, 제한 최대우도(LME) 혹은 변분 베이지안 접근법을 적용해 공분산 함수를 추정한다. 고유함수는 공분산 행렬의 고유분해를 통해 얻으며, 차원 축소 후 남은 점수는 일반화 선형 모델이나 Cox 비례위험모델에 입력해 임상 결과와의 연관성을 검정한다. 논문에서는 교차 검증을 통해 선택된 고유함수 개수가 전체 변동의 85 % 이상을 설명함을 보였으며, 특히 1차 수준에서 EEG 파워 스펙트럼의 저주파(δ, θ) 변동이 심혈관 사건 위험과 강한 양의 상관관계를 갖는 것으로 나타났다.
통계적 검증 측면에서, 부트스트랩을 이용한 신뢰구간 추정과 퍼뮤테이션 테스트를 통해 고유함수와 점수의 유의성을 평가하였다. 또한, 다중 비교 보정을 위해 FDR 절차를 적용해 false discovery rate를 통제하였다. 모델 적합도는 AIC/BIC와 예측 오차(Mean Squared Prediction Error)를 사용해 기존 단일 수준 FPCA와 비교했으며, MFPCA가 예측 정확도와 해석 가능성 모두에서 우수함을 입증했다.
이러한 방법론적 기여 외에도, 실제 SHHS 데이터에 적용한 결과는 임상적 의미가 크다. 수면 중 EEG의 특정 주파수 대역 변동이 심혈관 위험을 예측한다는 사실은, 수면 단계와 뇌파 활동이 심혈관 시스템에 미치는 영향을 정량화하는 새로운 근거를 제공한다. 특히, 1차 수준 고유함수가 전체 변동의 60 % 이상을 차지함을 통해 개인 간 차이가 가장 큰 위험 요인임을 강조한다.
전반적으로 MFPCA는 다중 수준·다중 채널 함수형 데이터를 효율적으로 요약하고, 각 수준별 변동을 명확히 구분함으로써 복잡한 생리학적 현상을 통계적으로 해석할 수 있는 강력한 도구로 자리매김한다.
댓글 및 학술 토론
Loading comments...
의견 남기기