협업 필터링과 무작위 결측 가정
초록
본 논문은 온라인 라디오 서비스 이용자를 대상으로 무작위 표본의 평점을 수집해, 기존에 사용자 선택에 의해 기록된 평점과 비교한다. 분석 결과, 무작위 평점은 선택된 평점과 통계적 특성이 크게 다르며, 다수 사용자가 “노래에 대한 의견이 평점 선택에 영향을 미친다”고 응답해 결측이 무작위(MAR) 가정이 위배됨을 확인한다. 또한 결측 메커니즘을 명시적으로 모델링한 추천 알고리즘이 무작위 평점에 대해 예측 정확도를 크게 향상시킴을 실험적으로 입증한다.
상세 분석
이 연구는 협업 필터링에서 가장 흔히 간과되는 전제인 ‘Missing at Random(MAR)’ 가정의 실효성을 실증적으로 검증한다. 기존의 평점 데이터는 사용자가 직접 선택한 아이템에 대해만 기록되기 때문에, 평점이 존재하지 않는 경우가 ‘무작위’라고 가정하는 것이 일반적이다. 그러나 이러한 가정은 실제 사용자 행동과 일치하지 않을 가능성이 크다. 논문은 이를 확인하기 위해 두 단계의 실험을 설계하였다. 첫 번째 단계에서는 현재 서비스 이용자를 대상으로 무작위로 선정된 곡에 대해 평점을 요청함으로써, 진정한 무작위 표본을 확보하였다. 두 번째 단계에서는 동일한 사용자에게 기존 시스템에서 제공되는 ‘선택 평점’ 데이터를 수집하고, 두 데이터셋 간의 통계적 차이를 비교하였다.
분석 결과, 무작위 평점은 평균 평점이 낮고, 평점 분포가 보다 균등하게 나타나는 반면, 선택 평점은 특정 구간(예: 4~5점)에 집중되는 경향을 보였다. 이는 사용자가 자신이 좋아하는 곡에만 평점을 매기는 ‘선택 편향(selection bias)’이 존재함을 의미한다. 또한, 사후 설문조사에서 68% 이상의 사용자가 “곡에 대한 호감도가 평점을 매길 의사에 영향을 미친다”고 답했으며, 이는 MAR 가정이 ‘Missing Not at Random(MNAR)’에 가깝다는 강력한 증거가 된다.
이러한 결측 메커니즘을 무시하고 기존의 행렬 분해 기반 협업 필터링 모델을 그대로 적용하면, 학습 단계에서 관측된 평점만을 사용하게 되므로 모델이 실제 사용자 선호를 왜곡된 형태로 학습하게 된다. 논문은 이를 보완하기 위해 결측 확률을 파라미터화한 ‘Missing Data Model’을 제안한다. 구체적으로, 각 사용자‑아이템 쌍에 대해 평점을 남길 확률을 베타 분포 형태로 모델링하고, 이 확률을 손실 함수에 가중치로 적용한다. EM 알고리즘을 이용해 결측 메커니즘 파라미터와 사용자·아이템 잠재 요인을 동시에 추정한다.
실험에서는 무작위 평점 표본을 테스트 셋으로 사용했으며, 제안 모델이 기존 베이스라인(예: Probabilistic Matrix Factorization, Weighted Regularized Matrix Factorization) 대비 RMSE를 평균 12% 이상 감소시켰다. 특히, 평점이 희소한 사용자와 아이템에 대해 개선 효과가 두드러졌다. 이는 결측 메커니즘을 명시적으로 고려함으로써, 관측되지 않은 데이터에 대한 편향을 보정하고, 보다 일반화된 예측 모델을 구축할 수 있음을 시사한다.
이 논문의 주요 기여는 (1) 실제 서비스 환경에서 무작위 평점 표본을 확보한 최초의 대규모 사용자 연구, (2) MAR 가정이 현실에서 크게 위배됨을 정량·정성적으로 입증, (3) 결측 메커니즘을 통합한 협업 필터링 프레임워크를 제시하고, 이를 통해 예측 정확도를 실질적으로 향상시킨 점이다. 향후 연구에서는 시간에 따른 결측 패턴 변화, 컨텍스트(예: 청취 상황)와 결합한 다중 모드 결측 모델, 그리고 실시간 추천 시스템에의 적용 가능성을 탐색할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기