커널 기반 두 표본 차이 검정: MMD와 효율적 알고리즘
본 논문은 재생 커널 힐베르트 공간(RKHS) 내 단위 구의 함수들을 이용해 두 확률분포의 차이를 측정하는 최대 평균 차이(MMD) 통계량을 제안한다. MMD의 이론적 특성을 증명하고, 대형 데이터에 적합한 2가지 유한표본 검정과 asymptotic 검정을 제시한다. 또한 O(m+n) 선형시간 근사와 그래프 분포 비교, 데이터베이스 속성 매칭 등 다양한 실험을 통해 기존 방법보다 우수함을 입증한다.
저자: Arthur Gretton, Karsten Borgwardt, Malte J. Rasch
본 논문은 두 확률분포 \(p\)와 \(q\) 가 동일한지 여부를 검정하는 새로운 프레임워크를 제시한다. 핵심 아이디어는 재생 커널 힐베르트 공간(RKHS) \(\mathcal{H}\) 의 단위 구에 속하는 함수들을 이용해 두 분포 사이의 평균 차이를 최대로 하는 값을 정의하는 것이다. 이를 “Maximum Mean Discrepancy”(MMD)라 명명하고,
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기