카운팅 프로세스 기반 트위터 영향력 측정 모델

트위터 사용자의 원본 게시·리트윗·멘션 행동을 다변량 카운팅 프로세스로 모델링하고 각 사용자의 장기 영향력과 반응성을 파라미터 α와 β 로 표현한다 추정은 부분 우도와 뉴턴 알고리즘으로 수행하며 도출된 영향력 지표는 팔로워 네트워크 상에서의 위험도 변화량을 정량화한다 미국 상원 의원 및 주요 언론 계정을 대상으로 실증 분석을 수행해 기존 PageRank 기반 지표보다 입법적 중요도와의 연관성이 높음을 확인한다

저자: Donggeng Xia, Shawn Mankad, George Michailidis

카운팅 프로세스 기반 트위터 영향력 측정 모델
트위터와 같은 소셜 미디어는 방대한 텍스트와 시간 스탬프, 사용자 간 상호작용이라는 복합 데이터를 제공한다 이러한 데이터에서 특정 사용자가 플랫폼 내에서 얼마나 큰 영향을 미치는지를 정량화하는 문제는 마케팅·정책·언론 등 다양한 분야에서 핵심적인 관심사이다 전통적으로는 팔로워 수나 PageRank·HITS와 같은 네트워크 기반 알고리즘이 사용되었지만 팔로워 수는 실제 상호작용을 반영하지 못하고 PageRank는 팔로우 관계만을 이용해 ‘인기’와 ‘영향력’을 혼동한다는 한계가 있다 본 논문은 이러한 한계를 극복하기 위해 사용자의 세 가지 행동인 원본 게시·리트윗·멘션을 다변량 상호작용 카운팅 프로세스로 모델링한다 각 계정 j 에 대해 주제 l 별로 누적 리트윗·멘션 횟수 N_j(t,l) 를 관찰하고 그 발생 강도를 위험도 λ_{j,l}(t) 로 표현한다 위험도는 베이스라인 λ_{0,l}(t) 와 팔로우 관계 L_{ij} , 그리고 두 파라미터 α_i 와 β_j 로 구성된 지수 함수 형태이다 α_i 는 계정 i 가 자신의 게시물로 타 사용자를 끌어들이는 장기적인 ‘생성력’ β_j 는 계정 j 가 타 계정의 게시물에 반응하는 ‘감수성’ M_i(t,l)=A_i(t,l)+N_i(t,l) 은 해당 주제에 대한 총 활동량을 나타내며 log(M_i+1) 를 사용해 활동량이 큰 계정의 효과를 완화한다 모델 추정은 Andersen‑Gill 프레임워크의 부분 우도(Partial Likelihood)를 이용한다 전체 로그 우도 LL 은 α와 β 에 대한 연속 미분이 가능하므로 Newton‑type 알고리즘을 설계해 그라디언트와 헤시안을 명시적으로 계산한다 스텝 크기 τ 를 라인 서치를 통해 최적화하고 α₁=0 으로 식별성을 확보한다 복잡도는 주제 수 Γ , 계정 수 n , 최대 관측 횟수 m_n 에 따라 O(Γ·n³·m_n) 로 평가된다 통계적 이론적 분석에서는 시간 구간

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기