라벨 의존 비용을 고려한 분류를 위한 보정된 대리 손실
본 논문은 라벨별 비용이 다른 이진 분류 문제에서, 임의의 대리 손실에 대해 대리 후회(regret)와 실제 비용 민감 분류 위험 사이의 관계를 정량화한다. 두 가지 접근법—Bartlett 등(2006)의 마진 기반 일반화와 Steinwart(2007)의 보정 함수 프레임워크—을 확장하여, 대리 손실이 “보정(calibrated)” 조건을 만족할 때만 의미
초록
본 논문은 라벨별 비용이 다른 이진 분류 문제에서, 임의의 대리 손실에 대해 대리 후회(regret)와 실제 비용 민감 분류 위험 사이의 관계를 정량화한다. 두 가지 접근법—Bartlett 등(2006)의 마진 기반 일반화와 Steinwart(2007)의 보정 함수 프레임워크—을 확장하여, 대리 손실이 “보정(calibrated)” 조건을 만족할 때만 의미 있는 후회 경계가 존재함을 보인다. 특히 불균형 마진 손실(uneven margin losses)에 적용해, 불균형 힌지, 제곱오차, 지수, 시그모이드 손실이 언제 적절히 보정되는지를 구체적으로 분석한다.
상세 요약
이 논문은 비용 민감 이진 분류(cost‑sensitive binary classification)라는 실용적 상황을 이론적으로 정교화한다. 전통적인 비용‑무시(class‑insensitive) 설정에서는 0‑1 손실에 대한 최소 위험(minimum risk)과 마진 기반 대리 손실 사이의 보정(calibration) 관계가 잘 알려져 있다. 그러나 라벨마다 서로 다른 비용이 부여되는 경우, 위험 함수는 (R_c(f)=\pi_+c_+ \mathbb{E}
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...