대규모 배치 추천을 위한 적응형 품질다양성 균형

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 사용자 피드백 모델이 사전에 알려진 상황에서 품질(관련성)과 다양성 사이의 트레이드오프를 효율적으로 조절하는 B‑DivRec 알고리즘을 제안한다. DPP와 퍼지 디누딩 절차를 결합해 대규모 아이템 풀(수백만 개)에서도 선형 시간 복잡도로 배치를 생성하며, 사용자 피드백에 따라 트레이드오프 파라미터 λ을 온라인 학습기로 적응적으로 업데이트한다. 영화 추천과 약물 재활용 두 실제 데이터셋에서 품질과 다양성 모두에서 기존 방법을 능가함을 실험적으로 입증한다.

상세 분석

논문은 먼저 품질‑다양성 트레이드오프(QDT) 문제를 수학적으로 정의하고, 이를 Determinantal Point Process(DPP)의 L‑행렬 형태로 표현한다. 핵심 아이디어는 Lλ,f(S;h) = (Q_h,S)^{2λ}·f(k,S,H)^{2(1‑λ)}·(Q_h,S)^{2(1‑λ)} 로, λ∈

대규모 배치 추천을 위한 적응형 품질다양성 균형

초록

상세 분석

댓글 및 학술 토론

의견 남기기