아이템 계층 구조를 활용한 희소성 극복 추천 모델 NCDREC

본 논문은 아이템 공간을 거의 분해 가능(Nearly‑Decomposable) 구조로 바라보고, 블록 단위의 직접·간접 관계를 정량화한 뒤 평점 행렬에 저‑랭크 교란을 가한다. 이를 통해 생성된 NCDREC은 SVD 기반 순위 추출과 마코프 체인 기반 콜드‑스타트 보강을 결합해, MovieLens와 Yahoo! R2Music 데이터에서 정확도·다양성·희소성 내성 모두에서 기존 최첨단 방법들을 능가함을 실험적으로 입증한다.

저자: Athanasios N. Nikolakopoulos, John D. Garofalakis

아이템 계층 구조를 활용한 희소성 극복 추천 모델 NCDREC
본 논문은 협업 필터링(CF) 기반 추천 시스템이 직면한 대표적 문제인 데이터 희소성(sparsity)을 해결하기 위해, 아이템 공간을 ‘Nearly‑Decomposable’(NCD) 구조로 모델링하고 이를 활용한 새로운 순위 기반 알고리즘 NCDREC을 제안한다. 서론에서는 전통적인 CF가 평점 행렬 R∈ℝ^{n×m} 의 결측값을 예측하거나 직접적인 유사도 기반 순위를 생성하는 방식으로, 사용자‑아이템 간 상호작용이 극히 제한될 경우 성능이 급격히 저하되는 ‘long‑tail’ 및 콜드‑스타트 문제를 겪는다고 설명한다. 기존의 그래프‑기반 전이 모델(예: ItemRank, Katz, Random Walk with Restart)도 전이 경로를 활용해 희소성을 완화하려 했지만, 아이템 간 구조적 계층성을 충분히 반영하지 못한다는 한계가 있다. 이에 저자는 Herbert Simon의 ‘Nearly Completely Decomposable’ 개념을 차용해 아이템 집합 V를 K개의 블록 D₁…D_K 로 분할한다. 각 블록은 장르, 카테고리, 지리적 위치 등 도메인 지식에 기반해 정의될 수 있으며, 블록 간 중첩을 허용해 복합적인 관계를 모델링한다. 블록 집합 D는 아이템‑블록 매핑 행렬 A_D (m×K) 로 표현되며, 이를 행 정규화한 X와 사용자‑블록 평점 집계 n_{k u_i} 를 이용해 Z 행렬을 구성한다. Z의 (i,k) 원소는 사용자 u_i 가 블록 D_k 에 속한 아이템에 부여한 평점의 평균을 n_{k u_i} 로 정규화한 값이다. NCD 선호 행렬 W는 W = Z Xᵀ 로 정의되며, 이는 사용자가 평가한 아이템의 평점을 동일 블록에 속한 다른 아이템들로 전파한다. 원본 평점 행렬 R에 ε·W (ε≪1) 를 더해 교란된 행렬 G = R + εW 를 만든 뒤, G에 대해 저‑랭크 특이값 분해(SVD) G ≈ U_f Σ_f V_fᵀ 를 수행한다. 여기서 f는 선택된 차원 수이며, 사용자 i에 대한 최종 추천 벡터는 U_f(i,:)·Σ_f 로 얻는다. 이 과정은 NCD‑aware 아이템 유사성 행렬의 저차원 고유공간을 이용해 순위를 생성하므로, 평점 예측 정확도보다 아이템 순서의 품질에 초점을 맞춘다. 희소성이 극심해 교란만으로는 충분치 않은 경우, 특히 신규 사용자(콜드‑스타트)에게는 전이 행렬 S를 이용한 마코프 체인 모델을 도입한다. S는 세 부분으로 구성된다: (1) 사용자 평점 기반 재시작 벡터 ωᵀ, (2) 직접 아이템 인접성 행렬 H, (3) NCD 근접 행렬 D. 최종 전이 행렬은 S = (1−α) e ωᵀ + α

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기