소셜미디어에서 영향력과 수동성

트위터 대규모 데이터를 분석해 사용자의 정보 전파 행동을 기반으로 영향력과 수동성을 동시에 측정하는 알고리즘을 제안한다. 대부분 사용자가 수동적 소비자임을 확인하고, 제안된 영향력 지표가 URL 클릭 예측에서 기존 인기 기반 지표보다 우수함을 실증한다.

소셜미디어에서 영향력과 수동성

초록

트위터 대규모 데이터를 분석해 사용자의 정보 전파 행동을 기반으로 영향력과 수동성을 동시에 측정하는 알고리즘을 제안한다. 대부분 사용자가 수동적 소비자임을 확인하고, 제안된 영향력 지표가 URL 클릭 예측에서 기존 인기 기반 지표보다 우수함을 실증한다.

상세 요약

본 논문은 소셜미디어, 특히 트위터에서 정보가 어떻게 확산되는지를 정량적으로 이해하고자 한다. 기존 연구들은 주로 팔로워 수, 리트윗 횟수, 멘션 등 ‘인기’ 지표에 의존해 사용자의 영향력을 평가했지만, 이러한 접근법은 사용자가 실제로 정보를 전파하는 행동을 무시한다는 한계가 있다. 저자들은 먼저 트위터 전체 사용자 중 2.5백만 명을 대상으로 20억 건 이상의 트윗과 리트윗 데이터를 수집하였다. 이를 통해 “대다수 사용자는 수동적 소비자이며, 자신이 본 정보를 네트워크에 전달하지 않는다”는 사실을 발견했다. 즉, 단순히 많은 팔로워를 보유하고 있더라도 실제 전파에 기여하지 않으면 영향력이 낮을 수 있다.

이를 해결하기 위해 저자들은 ‘Influence–Passivity (IP) 모델’을 설계하였다. 모델은 각 사용자 i에 대해 두 개의 변수 I_i(영향력)와 P_i(수동성)를 정의한다. I_i는 i가 다른 사용자에게 정보를 전달한 횟수와 그 정보가 얼마나 널리 퍼졌는지를 가중합한 값이며, P_i는 i가 받은 정보를 재전파하지 않은 비율을 기반으로 산출한다. 알고리즘은 반복적인 행렬 연산을 통해 I와 P를 동시에 수렴시킨다. 핵심 아이디어는 영향력은 ‘전달 능력’과 ‘전달받은 정보의 활용도’를 동시에 고려해야 한다는 점이다.

실험에서는 IP 모델이 기존 PageRank, HITS, 팔로워 수 기반 지표와 비교했을 때 URL 클릭률을 예측하는 ROC-AUC가 현저히 높았다. 특히, 높은 I값을 가진 사용자는 실제로 URL 클릭을 유도하는 경우가 많았으며, 반대로 높은 P값을 가진 사용자는 클릭을 거의 유발하지 못했다. 또한, 인기와 영향력 사이의 상관관계가 낮다는 것을 통계적으로 입증함으로써, “인기 ≠ 영향력”이라는 기존 가설을 정량적으로 반박하였다. 마지막으로, 모델의 파라미터 민감도 분석을 통해 P값이 과도하게 높게 설정될 경우 과소평가되는 현상을 확인하고, 적절한 정규화 기법을 적용해 안정적인 결과를 도출하였다.

이 논문은 소셜미디어 분석에 있어 ‘전파 행동’ 자체를 핵심 변수로 삼음으로써, 마케팅, 여론 형성, 위기 대응 등 실무적 응용 가능성을 크게 확장한다. 또한, 사용자 수동성을 정량화한 점은 향후 사용자 행동 모델링에 새로운 패러다임을 제시한다는 점에서 학술적 의의가 크다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...