심볼화가 인과 엔트로피와 마코프 차수에 미치는 영향
초록
본 논문은 동적 시스템을 기호화할 때 선택하는 파티션이 인과 엔트로피와 마코프 차수에 비선형·민감하게 영향을 미친다는 사실을 텐트 맵을 통해 실증한다. 파티션 해상도가 높아져도 원 연속 시스템의 마코프 차수와 인과 구조가 반드시 수렴하지 않으며, 기호화 방식에 따라 완전히 다른 인과 네트워크가 도출될 수 있음을 보여준다.
상세 분석
논문은 먼저 연속 동적 시스템 xₜ₊₁ = f(xₜ)를 유한 개의 열린 집합으로 구성된 파티션 A ={A₀,…,A_m}에 의해 기호화하고, 각 구간에 정수 심볼을 부여해 심볼 시퀀스 {sₜ}를 만든다. 이때 파티션이 ‘생성(partition)’이면 모든 심볼 시퀀스가 원래 궤적에 일대일 대응하지만, 마코프 파티션이 아니면 심볼 시퀀스는 마코프성(조건부 독립성)을 보장하지 않는다. 저자는 텐트 맵을 실험 모델로 삼아, 파티션 경계 위치를 미세하게 조정하면서 얻은 심볼 프로세스의 조건부 확률을 정확히 계산하고, 이를 기반으로 인과 엔트로피(CSE)를 정의한다. CSE는 과거 심볼 집합 Jₜ 가 현재 심볼 Sₜ 에 제공하는 정보량을 측정하는 조건부 상호정보량 I(S_Jₜ; Sₜ | S_{t−\Jₜ})이다. 마코프 차수 k 는 가장 작은 k 에 대해 C(t−k → t)=0 이 성립하는 값으로 정의하고, 인과 구조 Pₜ 는 C(t−Pₜ → t)=0 이면서 Pₜ 의 부분집합에서는 성립하지 않는 최소 집합으로 규정한다.
실험 결과는 두 가지 중요한 현상을 드러낸다. 첫째, 파티션을 미세하게 세분화해도 마코프 차수와 인과 구조가 원래 연속 시스템의 값으로 수렴하지 않는다. 파티션 경계가 특정 위치에 놓이면 마코프 차수가 급격히 변하거나, 심지어 0(독립)에서 높은 차수로 전이한다. 둘째, 같은 파티션 해상도라도 경계 위치에 따라 인과 구조가 완전히 달라진다. 예를 들어, 경계가 텐트 맵의 최대값 근처에 놓이면 과거 t−1 만이 현재에 영향을 주는 1차 마코프 구조가 나타나지만, 경계가 다른 위치에 있으면 t−2, t−3 등 여러 과거 시점이 동시에 인과적 역할을 하는 복합 구조가 나타난다. 이러한 비단조적·민감한 의존성은 기호화 과정에서 발생하는 ‘정보 손실’이 단순히 해상도에만 의존하지 않으며, 파티션 설계 자체가 인과 추론 결과를 좌우한다는 점을 강조한다.
또한 저자는 CSE 기반의 두 단계 알고리즘(집합적 탐색 → 불필요한 인과 제거)을 제시해, 조건부 상호정보량을 최대화하는 최소 인과 집합 Pₜ 을 효율적으로 찾는다. 이는 기존의 PC‑알고리즘이나 전통적인 조건부 독립성 검정보다 차원 저주에 덜 취약하며, 무한 데이터 가정 하에서도 정확한 인과 구조를 복원할 수 있음을 시뮬레이션으로 입증한다.
결론적으로, 기호화는 동적 시스템을 통계적으로 다루는 데 유용하지만, 파티션 선택이 인과 엔트로피와 마코프 차수에 미치는 영향을 무시하면 잘못된 인과 모델을 얻을 위험이 있다. 따라서 실험 설계 시 파티션의 위상학적 특성을 신중히 고려하고, CSE와 같은 정보‑이론적 도구를 활용해 인과 구조를 검증하는 것이 필수적이다.
댓글 및 학술 토론
Loading comments...
의견 남기기