관심 기반 vs 사회적 네트워크 기반 사람 추천: 효율과 새로움의 비교
초록
본 논문은 독일의 대형 SNS인 Utopia.de에서 수집한 데이터를 활용해, 사용자의 활동 기반 관심도와 기존 친구·친구‑친구(FoF) 구조를 이용한 두 종류의 사람 추천 알고리즘을 비교한다. 정밀도·재현율을 기준으로 기존 친구 관계 재현 능력을 평가하고, 설문조사를 통해 사용자 만족도를 측정한다. 결과는 관심 기반 추천이 새로운 사람을 더 많이 제시하지만 친구 재현에서는 FoF보다 낮으며, 사회·관심을 결합한 하이브리드 방식이 전반적으로 가장 균형 잡힌 성능을 보임을 보여준다.
상세 분석
이 연구는 사람 추천 시스템을 두 축으로 구분한다. 첫 번째는 전통적인 소셜 네트워크 기반, 즉 친구‑친구(FoF) 연결성을 활용한 방식이며, 두 번째는 사용자가 플랫폼 내에서 수행한 활동을 카테고리별로 집계해 관심 프로파일을 만든 뒤 코사인 유사도 혹은 피어슨 상관계수로 유사 사용자를 찾는 관심 기반 방식이다. 데이터는 Utopia.de의 334명 활성 사용자(평균 친구 수 11.9명, 평균 FoF 270명, 평균 카테고리 활동 87.6건)에서 추출했으며, 최소 3명의 친구와 8명의 FoF, 최소 3번의 카테고리 활동을 가진 사용자만 실험에 포함했다.
FoF 알고리즘은 두 사용자가 공유하는 친구 수를 양쪽 평균 친구 수로 정규화한 2·f∧/(f₁+f₂) 식으로 유사도를 계산한다. 관심 기반은 각 카테고리 Cᵢ에 대해 사용자가 만든·댓글·‘worth living’ 포인트 등을 집계한 후, 전체 활동 대비 비율 Aᵢ=actᵢ/Pᵢ 로 정규화한다. 이 벡터를 코사인 혹은 피어슨으로 비교해 유사도를 산출하고, 임계값 이상이면서 아직 친구가 아닌 사용자를 후보로 제시한다.
평가 방법은 10‑fold 교차 검증으로, 전체 친구 관계를 10%씩 제외하고 남은 90%를 학습에 사용한다. 각 실행에서 상위 10명의 추천을 생성하고, 제외된 친구 관계가 얼마나 재현되는지를 TP, FP, FN으로 구분해 정밀도, 재현율, F‑Measure를 계산한다. 전체 3340개의 사용자‑런 중 1921개의 경우에만 충분한 데이터가 확보돼 평가가 이루어졌다.
실험 결과, FoF는 친구 재현 측면에서 높은 정밀도와 재현율을 보였지만, 추천된 인물이 기존 네트워크에 이미 포함된 경우가 많아 ‘새로움’ 측면에서는 낮았다. 반면 관심 기반은 재현율이 다소 떨어졌지만, 기존에 연결되지 않은 사용자를 많이 제시해 새로운 네트워크 형성 가능성을 높였다. 하이브리드 모델(사회적 연결도와 관심 유사도를 가중 결합)에서는 두 접근법의 장점을 살려 정밀도·재현율 모두에서 평균 이상의 성능을 기록했다. 설문 조사에서는 사용자들이 실제로 제시된 추천을 얼마나 유용하게 느꼈는지를 물었으며, 전반적으로 모든 모델에 대해 긍정적인 평가가 나왔지만, 하이브리드가 약간 더 높은 만족도를 얻었다.
이 논문의 주요 시사점은 (1) 활동 기반 관심 프로파일이 충분히 풍부하면, 친구 리스트가 적은 ‘패시브’ 사용자에게도 의미 있는 추천이 가능하다는 점, (2) 순수 소셜 네트워크 기반은 기존 관계를 강화하는 데는 강하지만, 새로운 연결을 촉진하는 데는 한계가 있다는 점, (3) 두 정보를 결합한 하이브리드 접근이 실용적인 균형점을 제공한다는 점이다. 또한 평가 지표로 친구 재현을 사용한 것이 실제 추천 목표(친구, 토론 파트너, 전문가 등)와 완전히 일치하지 않을 수 있음을 인정하고, 향후 연구에서는 다중 목표 평가와 실시간 사용자 피드백을 반영한 동적 모델링이 필요함을 제안한다.
댓글 및 학술 토론
Loading comments...
의견 남기기