퍼시스턴스 다이어그램 평균 추정을 위한 프레셰 평균 알고리즘
초록
본 논문은 확률분포 ρ 위에 정의된 퍼시스턴스 다이어그램들의 프레셰 평균을 추정하는 알고리즘을 제시한다. ρ가 유한 개의 디랙 질량의 혼합인 경우, 제안된 알고리즘이 지역 최소점에 수렴함을 증명하고, 관측값으로부터 계산된 평균에 대한 대수법칙을 확립한다. 또한 가우시안 랜덤 필드 시뮬레이션을 통해 경험적 평균이 모집단 평균에 수렴함을 실증한다.
상세 분석
퍼시스턴스 다이어그램은 위상적 특징의 탄생·소멸 시점을 점들의 집합으로 나타내며, 이들 사이의 거리로는 보통 p‑Wasserstein 거리 혹은 bottleneck 거리를 사용한다. 논문은 이러한 거리 공간을 완비 메트릭 공간으로 가정하고, 확률분포 ρ 위에 정의된 프레셰 함수 F(μ)=∫ d²(μ,X) dρ(X) 의 최소점을 찾는 문제를 다룬다. 특히 ρ가 m개의 디랙 질량 ρ=1/m∑{i=1}^m δ{Z_i} 로 표현될 때, 프레셰 평균은 유한 개의 관측 다이어그램들의 최적 매칭을 통해 정의된다.
제안된 알고리즘은 각 반복 단계에서 현재 추정 평균 μ_t와 모든 관측 X_i 사이의 최적 매칭을 구하고, 매칭된 점들의 평균 위치를 새로운 평균 μ_{t+1} 로 업데이트한다. 이는 전통적인 K‑means와 유사하지만, 매칭 과정이 비선형 최적화 문제이므로 수렴성을 보장하기 위해 추가적인 조건이 필요하다. 논문은 매칭이 고정된 경우 평균 업데이트가 프레셰 함수 값을 감소시킨다는 사실을 이용해, 매칭-평균 교대 과정을 통해 지역 최소점에 수렴함을 증명한다.
또한, ρ가 위와 같은 디랙 혼합일 때, 관측값 X_1,…,X_n이 i.i.d. 로 추출되면, 알고리즘으로 얻은 경험적 평균 μ̂_n 은 n→∞ 일 때 ρ의 프레셰 평균 μ*에 거의 surely 수렴한다는 대수법칙을 제시한다. 증명은 프레셰 함수가 강볼록이 아니므로 전통적인 LLN 적용이 어려운 점을 매칭 구조와 유한 차원성에 기반한 균등 수렴 논리를 통해 극복한다.
실험에서는 2차원 가우시안 랜덤 필드의 등고선에서 추출한 퍼시스턴스 다이어그램을 이용해, 샘플 수가 증가함에 따라 경험적 평균이 이론적 평균에 근접함을 시각화하였다. 특히, 평균 다이어그램의 점 위치와 멀티셋 구조가 안정적으로 수렴하는 모습을 관찰했으며, 이는 제안 알고리즘이 실제 데이터에서도 유용함을 시사한다.
이러한 결과는 토포로지 데이터 분석에서 평균 구조를 정의하고, 군집화·분류·변화점 탐지 등에 활용할 수 있는 이론적·실용적 기반을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기