수평 가시성 그래프: 무작위 시계열의 정확한 해석
초록
수평 가시성 알고리즘은 시계열을 네트워크로 변환해 복잡계 분석을 가능하게 한다. 저자들은 독립이고 동일한 분포(i.i.d.)를 갖는 무작위 시계열에 대해 그래프의 차수 분포가 P(k)= (1/3)(2/3)^{k-2} 형태의 지수함수임을 정확히 증명한다. 이 결과는 원본 분포와 무관하며, 다른 차수 분포를 보이는 그래프는 비무작위(예: 혼돈) 시계열에 해당한다. 또한, 잡음이 섞인 저차원·고차원 혼돈 시계열을 효과적으로 구별함을 실험적으로 확인한다.
상세 분석
수평 가시성 그래프(HVG)는 기존 가시성 그래프(VG)의 수평 버전으로, 두 데이터 포인트 x_i와 x_j (i<j)가 서로 “보인다”는 조건을 |x_i - x_k| < min(x_i, x_j) for all k with i<k<j 로 단순화한다. 이 기하학적 단순성은 그래프 구조를 정확히 분석할 수 있는 수학적 토대를 제공한다. 논문은 먼저 HVG가 항상 연결 그래프이며, 평균 차수가 4라는 사실을 증명한다. 핵심은 i.i.d. 시계열에 대해 각 노드가 좌우 각각 독립적인 “시야”를 갖는다는 점이다. 노드 i의 차수 k는 좌측에 k_L개의 연속된 데이터가 모두 자신보다 작고, 우측에 k_R개의 연속된 데이터가 모두 자신보다 작으며, k = k_L + k_R + 2 (양쪽 끝을 포함) 로 표현된다. i.i.d. 가정 하에 k_L와 k_R는 기하급수적으로 감소하는 확률을 갖는 독립적인 변수이며, 이를 이용해 차수 분포 P(k) = (1/3)(2/3)^{k-2} 를 유도한다. 이 식은 원본 연속 확률분포 f(x)의 형태와 무관하게 동일하게 적용된다. 따라서 차수 분포가 이 식을 따르지 않을 경우, 해당 시계열은 i.i.d. 가정에 위배된다고 판단할 수 있다.
클러스터링 계수 C는 삼각형의 비율로 정의되며, HVG에서는 각 삼각형이 연속된 세 점이 서로 모두 보이는 경우에만 형성된다. 저자들은 C의 평균값이 3/4라는 정확한 값을 도출하고, 이는 무작위 시계열에 특유한 높은 클러스터링 특성을 의미한다. 평균 최단 경로 길이 ℓ는 그래프가 작은 세계(small‑world) 특성을 보이며, ℓ ≈ (log N)/log(3/2) 로 근사된다. 이는 그래프가 로그 규모로 확장됨을 의미한다.
혼돈 시계열에 대한 실험에서는, 저차원 맵(예: 로지스틱 맵)에서 생성된 데이터가 HVG로 변환될 때 차수 분포가 지수형이지만 기울기가 (2/3)보다 작아짐을 관찰한다. 이는 데이터가 일정한 순서 구조를 가지고 있어 “시야”가 더 넓어지는 효과를 만든다. 잡음이 섞인 경우에도, 잡음 비율이 30% 이하이면 차수 분포가 무작위와 구분 가능하며, 높은 차원의 혼돈(예: 커플드 맵 격자)에서도 비슷한 구별력이 유지된다. 이러한 결과는 별도의 서브레이트 검정이나 잡음 제거 없이도 HVG가 시계열의 복잡성을 효과적으로 포착한다는 강력한 증거가 된다.
마지막으로, 저자들은 피보나치 수열, 소수의 차례, 무작위 수열 생성기 등 여러 수열을 테스트하여, HVG 차수 분포가 이론적 무작위 분포와 일치하면 해당 수열이 통계적으로 무작위라고 판단할 수 있음을 제시한다. 전체적으로, HVG는 시계열 분석에 있어 계산 효율성, 해석 가능성, 그리고 강인성을 동시에 제공하는 유망한 도구임을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기