동적 인과 구조 탐색을 위한 안정적 차별가능 발견 SC3D
초록
SC3D는 다변량 시계열에서 시간 지연과 순간적 인과 관계를 동시에 학습하는 두 단계 차별가능 프레임워크이다. 1단계에서는 노드별 예측 모델을 이용해 후보 엣지를 사전 선택하고, 2단계에서는 얻어진 마스크를 기반으로 라그드 인접 행렬과 순간적 DAG를 동시에 최적화한다. 스펙트럴 비순환성 제약을 순간적 블록에만 적용함으로써 수치적 안정성을 확보하고, 기존 방법보다 더 정확하고 안정적인 인과 구조 복원을 달성한다.
상세 분석
SC3D는 기존 시계열 인과 탐색 방법이 직면한 두 가지 핵심 문제, 즉(1) 시간 지연(lagged)과 순간적(instantaneous) 인과 관계를 동시에 모델링하기 어려운 점, (2) 변수 수가 늘어날수록 조합적 탐색 공간이 급격히 커져 최적화가 불안정해지는 점을 해결한다. 이를 위해 저자는 차별가능 인과 탐색(Differentiable Causal Discovery, DCD)의 최신 안정화 기법인 스펙트럴 비순환성 제약을 차용하고, 이를 시간적 구조에 맞게 변형하였다.
1단계인 노드별 사전 선택(Node‑wise Temporal Preselection)에서는 각 목표 변수 (X_{j}^{t+1})에 대해 고정된 윈도우 (V^{(j)}_t)를 정의하고, 해당 윈도우 내의 모든 후보 부모에 대해 차별가능 예측 모델(예: 그룹 Lasso가 적용된 신경망)을 학습한다. 여기서 손실은 로그우도와 (\ell_1) 정규화의 가중합이며, 최적화 결과는 각 후보 엣지에 대한 비음수 스코어(그룹 가중치 크기)로 변환된다. 스코어가 일정 임계값 이하인 엣지는 마스크에서 차단되어 2단계에 전달되지 않는다. 이 과정은 정리 3.1에 의해 이론적으로 “동적 마코프 경계”(Dynamic Markov Boundary)를 완전히 보존한다는 것이 증명되었으며, 즉 선택된 마스크는 진정한 원인 변수들을 모두 포함한다.
2단계에서는 마스크에 의해 제한된 파라미터 공간에서 라그드 인접 행렬 ({A^{(\ell)}}_{\ell=1}^L)와 순간적 인접 행렬 (B)를 동시에 최적화한다. 라그드 엣지는 시간 순서에 의해 자동으로 비순환성을 만족하므로 별도 제약이 필요 없으며, 오직 순간적 블록 (B)에만 스펙트럴 비순환성 페널티를 적용한다. 이 페널티는 (\operatorname{tr}\big((I - B)^{\top}(I - B)\big) - d) 형태가 아니라, 고유값 기반의 스펙트럼 함수를 이용해 수치적 안정성을 크게 향상시킨다. 최적화 과정에서 페널티 계수를 점진적으로 증가시켜 (B)가 실제 DAG가 될 때까지 조정하고, 이후에는 고정한다.
알고리즘 전체는 두 단계가 순차적으로 진행되므로 탐색 공간이 크게 축소되고, 각 단계에서 차별가능 최적화가 가능해진다. 실험에서는 합성 데이터와 실제 벤치마크(예: Lorenz 시스템, VAR 기반 시뮬레이션)에서 기존 대표적 방법(DYNOTEARS, PCMCI+, VAR‑LiNGAM 등)보다 높은 구조 정확도(F1 점수)와 낮은 변동성을 보였다. 특히 변수 수가 50~100 수준으로 확대될 때도 스펙트럴 제약이 수치적 발산을 방지해 안정적인 학습이 가능했다.
이 논문은 (i) 라그드와 순간적 인과를 동시에 학습하는 통합 모델을 제시하고, (ii) 스펙트럴 비순환성 제약을 시간적 DAG에 적용해 기존 평활(trace) 기반 제약의 한계를 극복했으며, (iii) 두 단계 사전 선택·제약 최적화 전략을 통해 고차원 시계열에서도 확장 가능성을 확보했다는 점에서 의미가 크다. 향후 연구는 비선형 SVAR 모델에 대한 더 일반적인 신경망 파라미터화, 마스크 임계값 자동 튜닝, 그리고 실제 도메인(뇌신경, 기후) 데이터에 대한 적용을 통해 실용성을 검증할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기