사용자 선호와 수익 목표를 동시에 만족하는 최적 데이터 추천 설계
본 논문은 사용자 선호(유틸리티 분포)와 시스템이 요구하는 기대 수익을 동시에 만족하는 데이터 추천 확률분포를 최적화한다. 상대 엔트로피(KL divergence)를 최소화하는 방식으로 추천 분포를 설계하고, 이 최적 분포가 메시지 중요도 측정(MIM)의 정규화 형태와 동일함을 증명한다. 중요도 계수(importance coefficient)를 조정함으로써 작은 확률 사건에 더 큰 가중치를 부여하거나, 반대로 큰 확률 사건에 집중하는 등 다양한…
저자: Shanyun Liu, Yunquan Dong, Pingyi Fan
본 논문은 무선 모바일 인터넷 환경에서 데이터 푸시·추천 시스템이 직면한 두 가지 핵심 과제, 즉 ‘사용자 선호에 맞는 정확한 데이터 제공’와 ‘시스템이 요구하는 기대 수익 달성’ 사이의 균형을 정량적으로 분석한다. 이를 위해 먼저 데이터 클래스를 N개의 카테고리로 구분하고, 원시 데이터 발생 확률 Q, 사용자 선호 확률 U(utility distribution), 그리고 시스템이 실제로 푸시할 데이터의 확률 P(추천 분포)를 정의한다.
핵심 가정은 추천 시퀀스가 장기적으로 사용자 선호 분포 U와 일치할수록 사용자 경험이 향상된다는 점이다. 정보 이론에 따르면, 두 확률분포 사이의 상대 엔트로피 D(P‖U) 가 작을수록 추천 시퀀스가 U의 전형 집합 T(U) 에 포함될 확률이 높아진다(Pr{r_n∈T(U)} = 2^{-nD(P‖U)}). 따라서 ‘추천 정확도’를 최대화하려면 D(P‖U) 를 최소화하는 것이 목표가 된다.
하지만 실제 서비스에서는 광고 등 비수익성 데이터도 푸시해야 하며, 각 푸시 유형마다 비용 (Cp, Cn, Cm)과 수익 (Rp, Rad)이 다르게 설정된다. 논문은 이러한 비용·수익 구조를 바탕으로 ‘단일 데이터 푸시당 기대 수익 β’를 정의하고, 최적화 문제에 다음과 같은 제약을 추가한다.
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기