부분 전이 엔트로피 순위 벡터: 다변량 시계열에서의 부분 인과성 측정과 검정 방법
본 논문은 기존 전이 엔트로피(TE)와 그 순위 기반 변형인 STE·TERV를 다변량 시계열에 적용하기 위해 부분 전이 엔트로피 순위 벡터(PTERV)를 제안한다. PTERV의 점근적 편향·분산을 이론적으로 분석하고, 가우시안·감마 근사에 기반한 파라메트릭 유의성 검정과 시간‑시프트 서러게이트를 이용한 무작위 검정을 비교한다. 시뮬레이션 결과, PTERV는 PSTE보다 성능이 우수하지만 완전 부분 전이 엔트로피(PTE)보다 낮으며, 추세(dri…
저자: Dimitris Kugiumtzis
본 논문은 시간 지연 임베딩을 이용해 재구성된 다변량 시계열에서 정보 흐름을 측정하는 방법을 체계적으로 확장한다. 먼저 전이 엔트로피(TE)의 정의와 기존의 순위 기반 변형인 상징적 전이 엔트로피(STE)와 전이 엔트로피 순위 벡터(TERV)를 소개한다. STE는 각 재구성 벡터를 순위화하지만, 미래 응답 벡터 yₜ₊₁…yₜ₊ₜ를 순위화할 때 차원 불일치가 발생해 엔트로피 추정에 편향을 초래한다. 이를 보완한 TERV는 미래 샘플을 현재 재구성 벡터에 포함시켜 (m+T) 차원의 순위 벡터를 구성함으로써 정확한 조건부 상호정보량을 계산한다.
논문의 핵심 기여는 TERV를 다변량 상황에 적용하기 위해 부분 조건부 형태인 부분 전이 엔트로피 순위 벡터(PTERV)를 정의한 것이다. K개의 시계열 {X, Y, Z₁,…,Z_{K‑2}}가 주어질 때, PTERV는 X→Y의 직접 인과성을 Z₁…Z_{K‑2}를 조건으로 하여 I(ȳ_T; x̂ | ŷ, ẑ) 형태의 조건부 상호정보량으로 표현된다. 여기서 ȳ_T는 미래 응답의 순위 벡터, x̂와 ŷ는 현재 X와 Y의 순위 벡터, ẑ는 모든 교란 변수의 순위 벡터를 의미한다.
점근적 통계적 특성을 분석하기 위해, 순위 벡터가 이산 상태 공간을 형성한다는 점을 활용한다. 각 순위 조합의 관측 빈도 n_i는 이항 분포 B(N, p_i)를 따른다고 가정하고, 편향과 분산을 2차·3차 테일러 전개를 통해 유도한다. 편향식은 B(H_obs) = –∑ p_i² ε_i² – ∑ p_i ε_i³/6 형태이며, 이를 이항 분포의 모멘트와 결합해 최종적으로 –(B*–1)/(2N) + O(1/N²) 로 정리된다. 분산은 Var(H_obs) = (1/N)∑ (ln q_i + H_obs)² q_i(1–q_i) 로 얻어진다. 이러한 결과를 PTERV의 네 개의 엔트로피 항에 적용하면, 전체 편향은 전체 상태 수 B*와 데이터 길이 N에 의존하고, N이 충분히 클 경우 편향이 거의 사라진다.
파라메트릭 유의성 검정에서는 PTERV 추정값을 정규분포 혹은 감마분포로 근사한다. 편향·분산 식을 이용해 평균 μ와 분산 σ²(또는 감마 파라미터 α, β)를 계산하고, 귀무가설 H₀: X와 Y 사이에 인과성이 없다는 가정 하에 p‑값을 구한다. 그러나 시뮬레이션 결과, 이러한 근사는 실제 비선형 종속성 및 고차원 순위 구조를 충분히 반영하지 못해 검정력이 낮았다. 반면, 시간‑시프트 서러게이트를 이용한 무작위 검정은 데이터의 시간적 구조를 보존하면서도 인과성 검정에 높은 민감도와 정확도를 제공하였다.
성능 평가를 위해 두 개의 커플링된 혼돈 시스템(로렌즈와 힐버트)과, 잡음·추세가 포함된 합성 시계열을 사용하였다. 실험에서는 다음과 같은 주요 결과가 도출되었다. 첫째, PTERV는 PSTE보다 높은 검출률을 보였으며, 특히 교란 변수 Z가 존재할 때 부분 인과성을 정확히 식별한다. 둘째, 완전 부분 전이 엔트로피(PTE)는 전반적으로 가장 높은 검출력을 보였지만, 데이터에 선형·비선형 추세가 포함될 경우 과대평가하거나 오검출이 발생한다. 셋째, PTERV는 순위 기반이므로 원본 시계열에 선형 추세가 추가되어도 순위 변환 과정에서 상쇄되어, 추세에 대한 민감도가 낮다. 넷째, 디트렌딩 전처리 단계가 필요 없으며, 이는 실제 경제·기후 데이터와 같이 장기 추세가 흔한 분야에 실용적이다.
결론적으로, PTERV는 다변량 시계열에서 교란 변수를 통제하면서 비선형 인과성을 탐지할 수 있는 효율적인 도구이며, 특히 데이터 전처리 비용을 줄이고 싶을 때 유리하다. 다만, 파라메트릭 검정보다 서러게이트 기반 무작위 검정이 더 신뢰할 수 있기에, 실무에서는 두 방법을 병행하는 것이 권장된다. 또한, PTERV가 추세와 디트렌딩에 강인함을 보인 점은 장기 비정상성을 포함한 실제 데이터 분석에 큰 장점으로 작용한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기