다양체 차원 추정의 최소극대 위험률: 이론적 한계와 실현 가능성

본 논문은 데이터가 지지하는 매끄러운 다양체의 내재 차원을 추정하는 문제에 대해 최소극대 위험(minimax risk)의 상·하한을 제시한다. 두 차원 \(d_1<d_2\) 사이의 가설 검정을 TSP 경로 길이와 Le Cam 보조정리를 이용해 분석하고, 임베딩 차원 \(m\) 에 대한 일반적인 상·하한을 도출한다. 결과는 차원 추정이 샘플 수에 대해 초지수적으로 수렴함을 보여준다.

저자: Jisu Kim, Aless, ro Rinaldo

본 논문은 데이터가 지지하는 매끄러운 다양체의 내재 차원을 추정하는 문제를 최소극대 위험(minimax risk) 관점에서 체계적으로 분석한다. 먼저, 저자들은 차원 \(d\) 가 1부터 임베딩 차원 \(m\) 까지 가능한 상황을 고려하고, 이를 위해 ‘잘 행동하는(well‑behaved)’ 다양체의 정의와 여러 기하학적 정규조건을 도입한다. 핵심 정규조건은 전역 리치 \(\tau_g\)와 국부 리치 \(\tau_\ell\)가 양의 유한값을 갖는다는 것이며, 이는 다양체가 지나치게 휘어지거나 자기교차가 가까워지는 pathological한 경우를 배제한다. 또한 다양체는 유한한 부피와 경계가 없는 컴팩트 집합 안에 포함된다고 가정한다. 문제 정의는 다음과 같다. 확률분포 \(P\) 가 다양체 \(M\) 위에 놓여 있을 때, 그 차원 \(d(P)=\dim(M)\) 를 추정하는 추정기 \(\hat d_n\) 의 위험은 \(\mathbb{E}_P

다양체 차원 추정의 최소극대 위험률: 이론적 한계와 실현 가능성

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기