조건부 확률 트리 추정 분석 및 알고리즘

이 논문은 레이블 수 n에 대해 로그 시간 O(log n)으로 조건부 확률을 추정하는 방법을 제시한다. 이진 회귀기를 트리 구조에 배치해 각 노드에서 좌·우 서브트리의 확률을 예측하고, 리프까지의 경로 확률을 곱해 최종 레이블 확률을 얻는다. 트리 깊이를 O(log n)으로 유지하면서도 회귀기의 평균 제곱 손실에 비례하는 전체 손실 상한을 증명한다. 또한 새로운 레이블이 등장할 때 온라인으로 트리를 재구성하는 알고리즘을 설계해, 실험적으로 10…

저자: Alina Beygelzimer, John Langford, Yuri Lifshits

본 논문은 “조건부 확률 트리(Conditional Probability Tree, CPT)”라는 새로운 접근법을 제시하여, 레이블 수 n이 매우 큰 경우에도 O(log n) 시간 안에 조건부 확률 P(y|x)를 추정할 수 있는 방법을 개발한다. 기존의 one‑against‑all 방식은 각 레이블마다 별도의 이진 분류기를 학습해야 하므로 O(n) 연산이 필요하고, 스케일이 큰 데이터셋에서는 실용적이지 않다. 저자들은 이 문제를 트리 구조에 이진 회귀기를 배치함으로써 해결한다. **1. 문제 정의와 손실 함수** 입력 공간 X와 레이블 집합 Y={1,…,n}이 주어지고, 목표는 조건부 확률 P(y|x)를 추정하는 것이다. 추정기 Q(y|x)에 대한 평균 제곱 손실 ℓ_P(Q)=E_{(x,y)∼P}

조건부 확률 트리 추정 분석 및 알고리즘

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기