밀도 추정용 분포 요소 트리

본 논문은 데이터 샘플을 기반으로 고차원 확률밀도 함수를 효율적으로 추정하기 위해 ‘분포 요소(Distribution Element, DE)’와 이를 계층적으로 관리하는 트리 구조(DET)를 제안한다. DE는 작은 하이퍼큐보이드 영역 내에서 독립적인 1차원 마진을 이용한 다항식 형태의 밀도 모델이며, 영역 분할은 통계적 적합도 검정과 쌍별 독립성 검정을 통해 자동으로 수행된다. 실험 결과는 기존의 히스토그램, 커널 밀도 추정(KDE), OPT …

저자: Daniel W. Meyer

밀도 추정용 분포 요소 트리
본 논문은 대규모·고차원 데이터셋에 적용 가능한 효율적인 비모수 확률밀도 추정 방법을 제안한다. 기존의 히스토그램은 등폭 구간을 사용해 차원이 증가하면 셀 수가 기하급수적으로 늘어나며, 커널 밀도 추정(KDE)은 전역 밴드폭 선택과 고차원에서의 계산 복잡도 문제로 실용성이 떨어진다. 이러한 한계를 극복하기 위해 저자는 ‘분포 요소(Distribution Element, DE)’라는 개념을 도입하고, 이를 트리 구조(Distribution Element Tree, DET)로 조직한다. DE는 데이터 공간의 작은 하이퍼큐보이드 C_k 를 하나의 기본 단위로 삼으며, 각 차원 i 에 대해 독립적인 마진 밀도 p

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기