정보 전파의 시간적 스케일링 발견
초록
본 연구는 대규모 소셜 미디어 데이터를 분석해, 두 사용자 간 최신 상호작용 이후 경과 시간(지연)이 길어질수록 메시지 전파 확률이 거듭 감소한다는 파워‑러프(멱법칙) 관계를 밝혀냈다. 이를 기반으로 제안한 ‘Decay 모델’은 시간에 따라 변하는 전파 확률을 추정해 기존 방법 대비 예측 오류를 6.7%→2.6%로 낮추고, 바이럴 마케팅에서 9.7% 더 많은 고객을 확보한다.
상세 분석
이 논문은 정보 전파를 미시적 관점에서 “전파 확률 = 정보 매력도 × 개인 간 상호작용”이라는 두 요인의 곱으로 모델링한다. 기존 연구는 정보 매력도의 시간적 변화를 풍부히 다루었지만, 개인 간 상호작용의 시간 의존성은 정적 가정에 머물러 있었다. 저자들은 Sina Weibo의 50만 사용자·120만 팔로우 관계·800만 메시지 데이터를 활용해, 각 팔로우 관계(edge)에서 사용자가 메시지를 리트윗(전파)하거나 무시(비전파)한 사건을 추출하고, 해당 사건 발생 시점부터 가장 최근의 상호작용까지의 시간 차(지연 τ)를 측정하였다.
분석 결과, 리트윗 사건은 짧은 지연 구간에 집중되고 긴 지연 구간에서는 거의 발생하지 않는 ‘버스티(bursty)’ 패턴을 보였다. 특히 모든 양성 사례의 지연 분포가 파워‑러프 형태( P(τ) ∝ τ^‑α )를 따르며, α≈0.71이라는 일관된 지수값을 나타냈다. 이는 정적 포아송 프로세스가 예측하는 지수분포와는 현저히 다른 동적 특성이다.
또한, 각 edge마다 전파 확률 Pr(δ=1|τ)와 지연 τ 사이의 관계를 로그‑로그 플롯으로 시각화했을 때, 동일한 멱법칙 형태이지만 지수값이 edge마다 다름을 확인했다. 즉, 개인 간 상호작용 강도와 지속성은 개별 관계에 따라 다르게 스케일링된다. 이를 수학적으로는
Pr(δ=1) = q_e · τ^‑α_e
와 같이 표현했으며, q_e는 시간에 무관한 기본 전파 확률, α_e는 각 edge에 특화된 감쇠 지수이다.
위 발견을 토대로 제안된 ‘Decay 모델’은 베이지안 프레임워크 하에 q_e와 α_e를 최대 사후 확률(MAP) 추정한다. 사전 분포는 전체 네트워크에서 관측된 평균 감쇠 지수(≈0.71)를 활용해 데이터 희소성 문제를 완화한다. 모델은 기존 정적 베르누리·EM 기반 방법보다 AUC가 93.3%→97.4%로 상승하고, 퍼플렉시티도 현저히 낮아졌으며, 특히 훈련 데이터가 제한적일 때 성능 격차가 크게 나타난다.
바이럴 마케팅 실험에서는 예측된 전파 확률을 기반으로 영향력 최대화 알고리즘(CELF++)을 적용해 초기 시드 집합을 선정하였다. Decay 모델이 제시한 시드 집합은 실제 5일간 관측된 전파 네트워크에서 2,590개의 노드를 활성화시켜, 가장 좋은 베이스라인인 Static PC Bernoulli(2,361노드)보다 9.7% 더 큰 확산 효과를 보였다.
결론적으로, 개인 간 상호작용의 시간적 감쇠가 멱법칙적으로 스케일링된다는 새로운 법칙을 발견함으로써, 정적 전파 모델의 한계를 극복하고 실시간 예측 및 마케팅 전략에 실질적 이점을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기