컨텍스트 인식 추천을 위한 범용 인수분해 프레임워크
초록
본 논문은 사용자·아이템 외에 다양한 컨텍스트 정보를 활용할 수 있는 일반화된 인수분해 프레임워크(GFF)를 제안한다. GFF는 선형 선호 모델을 입력으로 받아 각 차원에 대한 잠재 특징 행렬을 동시에 학습하며, 명시적·암묵적 피드백 모두에 적용 가능하도록 가중치 함수를 설계하였다. 4차원 컨텍스트 실험과 다섯 개 실데이터셋을 통해 기존 모델보다 높은 정확도를 입증하고, 확장된 버전은 다차원 데이터스페이스 모델(MDM)과 완전 호환된다.
상세 분석
GFF는 기존 컨텍스트 인식 추천 알고리즘이 갖는 두 가지 한계를 동시에 해소한다. 첫째, 대부분의 기존 인수분해 기법이 명시적 평점에만 최적화되어 실제 서비스에서 흔히 발생하는 암묵적 피드백(클릭, 구매, 조회 등)을 다루기 어렵다는 점이다. GFF는 손실 함수에 존재·부재 가중치를 별도로 정의하고, 누락된 상호작용에 대한 가중치를 차원별로 분해함으로써 암묵적 데이터의 희소성을 효과적으로 보정한다. 둘째, 컨텍스트 차원이 추가될 때 선호 모델의 설계 자유도가 급격히 감소한다는 점이다. GFF는 “선형”이라는 최소한의 제약만을 두어, N‑way 도트곱, 쌍별 상호작용, 혹은 그 조합 등 다양한 선호 모델을 동일한 학습 파이프라인에 삽입할 수 있다. 이때 각 차원의 잠재 특징 행렬은 ALS(Alternating Least Squares) 기반의 좌표 하강법으로 효율적으로 업데이트되며, 차원 수와 특성 수에 대해 거의 선형적인 확장성을 보인다.
논문은 4차원(사용자, 아이템, 시간, 위치) 컨텍스트를 기준으로 여러 모델을 비교한다. 기본 N‑way 모델은 사용자·아이템·시간·위치 벡터의 원소별 곱을 합산하는 방식이며, 쌍별 모델은 모든 차원 쌍에 대한 도트곱을 합산한다. 실험 결과, 시간·위치와 같은 동적 컨텍스트를 개별적으로 가중치화한 모델이 기존 SVD++이나 FM보다 평균 5~7% 높은 HR@10/Recall@10을 기록한다. 특히, 가중치 함수 w₀를 차원별 평균 활성도와 결합한 “가중치 분해” 전략이 누락 데이터에 대한 과적합을 방지하고 일반화 성능을 크게 향상시켰다.
또한 GFF는 MDM과의 완전 호환성을 위해 확장 버전을 제시한다. MDM은 차원을 다중 속성으로 구성할 수 있는데, 기존 SA‑MDM(단일 속성) 기반 인수분해는 이러한 속성 간 상호작용을 무시한다. 확장 GFF는 각 속성을 별도 차원으로 매핑하고, 속성 간 교차 가중치를 추가함으로써 메타데이터(장르, 작가), 소셜 네트워크, 세션 정보 등을 자연스럽게 통합한다. 초기 실험에서는 아이템 메타데이터를 포함한 모델이 순수 컨텍스트 모델 대비 NDCG가 3% 상승하는 효과를 보였다.
전체적으로 GFF는 (1) 암묵적 피드백 지원, (2) 자유로운 선호 모델 정의, (3) 차원·속성 확장성, (4) 효율적인 ALS 기반 학습이라는 네 가지 핵심 설계 목표를 달성한다. 이는 실무에서 다양한 컨텍스트와 데이터 스키마를 가진 서비스에 바로 적용할 수 있는 범용 프레임워크로 평가된다.
댓글 및 학술 토론
Loading comments...
의견 남기기