소셜 네트워크 리더십 순위 Delicious 사례 연구
초록
본 논문은 소셜 북마크 서비스 Delicious에서 사용자가 다른 사용자를 ‘리더’로 구독함으로써 정보 탐색 범위를 넓히는 현상을 분석한다. 기존 웹 페이지 순위 알고리즘인 PageRank가 사람 간 연결 구조에서는 효과가 떨어짐을 지적하고, 파라미터 없이 자동 적응하는 새로운 알고리즘 LeaderRank를 제안한다. 실험 결과 LeaderRank가 영향력 순위 정확도, 조작에 대한 내성, 잡음 데이터에 대한 강인성 측면에서 PageRank를 능가함을 보여준다.
상세 분석
LeaderRank는 기존 PageRank의 ‘랜덤 서퍼’ 모델을 사람 간 관계에 맞게 변형한 것이다. PageRank는 각 노드가 일정 확률로 임의의 다른 노드로 이동하는 가정하에 전이 행렬을 구성하고, ‘damping factor’라는 파라미터를 통해 텔레포트 확률을 조절한다. 그러나 소셜 네트워크에서는 사용자가 스스로 선택한 구독 관계가 존재하고, 무작위 텔레포트는 현실적인 행동을 반영하지 못한다. LeaderRank는 네트워크에 가상의 ‘슈퍼노드’를 추가하고, 모든 노드가 이 슈퍼노드와 양방향으로 연결되도록 한다. 초기에는 각 노드에 동일한 점수를 부여하고, 슈퍼노드에만 잔여 점수를 모아두었다가 반복적인 점수 전파 과정을 통해 최종 점수를 계산한다. 이때 전이 행렬은 정규화된 출입 차수에 기반하므로 파라미터 설정이 필요 없으며, 네트워크 구조 자체가 점수 흐름을 결정한다.
실험은 Delicious에서 수집한 5만 명 이상의 사용자와 1백만 개 이상의 북마크 데이터를 기반으로 수행되었다. 리더십 관계는 사용자가 다른 사용자의 컬렉션을 구독한 정보를 이용해 구축했으며, 실제 영향력은 사용자가 추천한 아이템이 다른 사용자에게 채택된 횟수로 측정하였다. LeaderRank와 PageRank를 동일한 네트워크에 적용한 뒤, 상위 1 % 사용자를 골라 실제 채택률과 비교했을 때 LeaderRank가 평균 12 % 높은 정확도를 보였다.
또한 조작 실험에서는 가짜 계정을 다수 생성해 특정 사용자를 과도하게 연결시키는 ‘스파밍’ 공격을 시뮬레이션했다. PageRank는 이러한 연결이 많아질수록 순위가 급격히 상승했지만, LeaderRank는 슈퍼노드와의 균형 전파 메커니즘 덕분에 순위 변동이 미미했다. 잡음 데이터에 대한 민감도 테스트에서는 일부 구독 관계를 무작위로 삭제·추가했을 때, LeaderRank의 순위 변동 폭이 PageRank보다 30 % 이하로 작았다. 이는 LeaderRank가 네트워크 전반의 구조적 특성을 더 잘 포착하고, 국부적인 변동에 강인함을 의미한다.
결과적으로 LeaderRank는 파라미터 의존성을 없애고, 사람 간 신뢰·관심 흐름을 자연스럽게 모델링함으로써 소셜 네트워크에서 영향력 순위를 산정하는 데 적합한 도구임을 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기