카운팅 프로세스 기반 트위터 영향력 측정 모델
트위터 사용자의 원본 게시·리트윗·멘션 행동을 다변량 카운팅 프로세스로 모델링하고 각 사용자의 장기 영향력과 반응성을 파라미터 α와 β 로 표현한다 추정은 부분 우도와 뉴턴 알고리즘으로 수행하며 도출된 영향력 지표는 팔로워 네트워크 상에서의 위험도 변화량을 정량화한다 미국 상원 의원 및 주요 언론 계정을 대상으로 실증 분석을 수행해 기존 PageRank 기반 지표보다 입법적 중요도와의 연관성이 높음을 확인한다
저자: Donggeng Xia, Shawn Mankad, George Michailidis
트위터와 같은 소셜 미디어는 방대한 텍스트와 시간 스탬프, 사용자 간 상호작용이라는 복합 데이터를 제공한다
이러한 데이터에서 특정 사용자가 플랫폼 내에서 얼마나 큰 영향을 미치는지를 정량화하는 문제는
마케팅·정책·언론 등 다양한 분야에서 핵심적인 관심사이다
전통적으로는 팔로워 수나 PageRank·HITS와 같은 네트워크 기반 알고리즘이 사용되었지만
팔로워 수는 실제 상호작용을 반영하지 못하고 PageRank는 팔로우 관계만을 이용해
‘인기’와 ‘영향력’을 혼동한다는 한계가 있다
본 논문은 이러한 한계를 극복하기 위해
사용자의 세 가지 행동인 원본 게시·리트윗·멘션을
다변량 상호작용 카운팅 프로세스로 모델링한다
각 계정 j 에 대해 주제 l 별로 누적 리트윗·멘션 횟수 N_j(t,l) 를 관찰하고
그 발생 강도를 위험도 λ_{j,l}(t) 로 표현한다
위험도는 베이스라인 λ_{0,l}(t) 와 팔로우 관계 L_{ij} , 그리고 두 파라미터 α_i 와 β_j 로 구성된 지수 함수 형태이다
α_i 는 계정 i 가 자신의 게시물로 타 사용자를 끌어들이는 장기적인 ‘생성력’
β_j 는 계정 j 가 타 계정의 게시물에 반응하는 ‘감수성’
M_i(t,l)=A_i(t,l)+N_i(t,l) 은 해당 주제에 대한 총 활동량을 나타내며
log(M_i+1) 를 사용해 활동량이 큰 계정의 효과를 완화한다
모델 추정은 Andersen‑Gill 프레임워크의 부분 우도(Partial Likelihood)를 이용한다
전체 로그 우도 LL 은 α와 β 에 대한 연속 미분이 가능하므로
Newton‑type 알고리즘을 설계해 그라디언트와 헤시안을 명시적으로 계산한다
스텝 크기 τ 를 라인 서치를 통해 최적화하고
α₁=0 으로 식별성을 확보한다
복잡도는 주제 수 Γ , 계정 수 n , 최대 관측 횟수 m_n 에 따라 O(Γ·n³·m_n) 로 평가된다
통계적 이론적 분석에서는
시간 구간
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기