결측 특성을 가진 데이터에 강인한 온라인·배치 학습 알고리즘
본 논문은 결측 특성이 존재하는 상황에서 활용 가능한 새로운 온라인 및 배치 학습 방법을 제안한다. 온라인 설정에서는 매 라운드 관측된 특성 부분집합에 따라 비교 가설을 동적으로 조정하고, 배치 설정에서는 결측값을 대체하는 임퓨테이션 함수를 동시에 학습하도록 비볼록 문제를 볼록화한다. 두 경우 모두 이론적 성능 보장을 제공하며, UCI 데이터셋 실험을 통해 기존 베이스라인 대비 우수한 정확도를 입증한다.
저자: Afshin Rostamizadeh, Alekh Agarwal, Peter Bartlett
**1. 연구 배경 및 동기**
현대 데이터 과학에서 결측 특성은 흔히 발생하는 문제이며, 이를 무시하거나 단순히 평균·최빈값 대체와 같은 전처리 방식에 의존하면 모델 성능이 크게 저하될 수 있다. 기존 연구는 주로 **배치(imputation) 기반** 접근이나 **완전 관측 가정** 하의 온라인 학습에 초점을 맞추었다. 그러나 실제 서비스 환경에서는 데이터가 실시간으로 유입되고, 각 샘플마다 관측 가능한 특성 집합이 달라지는 경우가 많다. 따라서 결측 특성을 동시에 다루는 **온라인**과 **배치** 학습 방법이 필요하다.
**2. 온라인 학습 프레임워크**
- **문제 정의**: 매 라운드 \(t\)에 관측된 특성 집합 \(\mathcal{O}_t\subseteq
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기