그래프와 TV 정규화를 활용한 비음수 행렬 분해 기반 노래 추천 시스템

본 논문은 비음수 행렬 분해(NMF)와 그래프 기반 총변동(Total Variation, TV) 정규화를 결합하여, 플레이리스트와 곡 간의 유사성을 동시에 활용하는 하이브리드 노래 추천 모델을 제안한다. KL 발산을 손실 함수로 사용하고, 프라임-듀얼 최적화 기법으로 효율적인 학습을 구현한다. 실험 결과, 기존의 순수 협업 필터링, 그래프 기반 코사인 유사도, 그리고 Tikhonov 정규화를 적용한 GNMF 대비 MPR과 카테고리 정확도 모두에…

저자: Kirell Benzi, Vassilis Kalofolias, Xavier Bresson

그래프와 TV 정규화를 활용한 비음수 행렬 분해 기반 노래 추천 시스템
본 논문은 음악 스트리밍 서비스에서 사용되는 플레이리스트 기반 노래 추천 문제를 행렬 완성(matrix completion) 관점에서 접근한다. 기존의 협업 필터링 기법은 사용자‑아이템 행렬의 저차원 구조를 추정하는데 초점을 맞추었으며, 대표적인 방법으로 비음수 행렬 분해(NMF)가 있다. 그러나 순수 NMF는 데이터가 매우 희소하고, 곡 간의 내용적 유사성을 반영하지 못한다는 한계가 있다. 반면, 그래프 기반 정규화는 아이템(곡)이나 사용자(플레이리스트) 간의 사전 지식을 그래프 형태로 인코딩함으로써, 구조적 정보를 보강한다. 본 연구는 이 두 접근을 결합하여, 협업 필터링의 저차원 잠재 요인 학습 능력과 그래프 기반 콘텐츠 필터링의 풍부한 외부 정보를 동시에 활용한다. ### 1. 문제 정의 및 모델 설계 플레이리스트 n개와 곡 m개의 이진 포함 행렬 C∈{0,1}^{n×m} 를 정의한다. C_{ij}=1 은 i번째 플레이리스트에 j번째 곡이 포함됨을 의미한다. 암시적 피드백 상황을 반영하기 위해 마스크 Ω∈{ε,1}^{n×m} 를 도입하고, ε=0.1 로 설정한다. 목표는 비음수 행렬 A∈ℝ_{+}^{n×r}, B∈ℝ_{+}^{r×m} (r≪min(n,m)) 를 찾아 C≈AB 를 만족시키는 것이다. 손실 함수는 가중 KL 발산을 사용한다:  L_{KL}(C,AB)=∑_{i,j}

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기