무작위 투영으로 혼합 분포의 L₁ 거리 효율적 근사

본 논문은 Cauchy 무작위 투영을 이용해 제한된 형태(구간별 선형·다항)의 혼합 확률밀도들 사이의 L₁ 거리를 상대 오차 보장으로 빠르게 추정하는 알고리즘을 제시한다. 핵심은 Cauchy 움직임에 대한 확률적 적분을 표본화하는 방법이며, 구간별 선형 밀도에 대해서는 정확한 샘플링, 다항 밀도에 대해서는 근사 샘플링을 제공한다.

저자: Satyaki Mahalanabis, Daniel Stefankovic

본 논문은 “혼합 확률밀도들 사이의 L₁ 거리”를 모든 쌍에 대해 효율적으로 계산하는 문제를 다룬다. 전통적인 정확 알고리즘은 각 밀도가 구간별 선형 형태일 때만 O(m²·n) 시간에 가능하고, 일반적인 혼합 모델(예: 정규 혼합, 커널 밀도 등)에서는 정확한 계산이 어려워 무작위 근사법이 필요하다. 저자들은 Cauchy 무작위 투영(Cauchy random projections, Indyk 2006)을 L₁ 거리 추정에 적용하면서, 이를 “Cauchy 움직임에 대한 확률적 적분”이라는 연속적 형태로 변환한다. 먼저, 밀도 집합 F={f₁,…,f_m}을 정의하고, φ(x)=(f₁(x),…,f_m(x)) 로 만든다. 전역 적분 X=(X₁,…,X_m)=∫_{-∞}^{∞} φ(x) dL(x) (L은 대칭 1‑stable Lévy 과정, 즉 Cauchy 움직임) 를 수행하면 각 X_j는 Cauchy(0,1) 분포를 갖고, 차이 X_j−X_k는 Cauchy(0,‖f_j−f_k‖₁) 를 따른다. 따라서 두 밀도 사이의 L₁ 거리는 해당 Cauchy 분포의 스케일 파라미터와 동일하다. 스케일 파라미터를 추정하기 위해 Lemma 2.1의 기하 평균 추정기를 사용한다. t개의 독립 표본 X^{(1)}_j,…,X^{(t)}_j 로부터 ˆD_{gm}=t·(∏_{i=1}^t |X^{(i)}_j−X^{(i)}_k|)^{1/t} 를 계산하면, ε∈

무작위 투영으로 혼합 분포의 L₁ 거리 효율적 근사

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기