카운팅 프로세스 기반 트위터 영향력 측정 모델

트위터와 같은 소셜 미디어는 방대한 텍스트와 시간 스탬프, 사용자 간 상호작용이라는 복합 데이터를 제공한다 이러한 데이터에서 특정 사용자가 플랫폼 내에서 얼마나 큰 영향을 미치는지를 정량화하는 문제는 마케팅·정책·언론 등 다양한 분야에서 핵심적인 관심사이다 전통적으로는 팔로워 수나 PageRank·HITS와 같은 네트워크 기반 알고리즘이 사용되었지만 팔로워 수는 실제 상호작용을 반영하지 못하고 PageRank는 팔로우 관계만을 이용해 ‘인기’와 ‘영향력’을 혼동한다는 한계가 있다 본 논문은 이러한 한계를 극복하기 위해 사용자의 세 가지 행동인 원본 게시·리트윗·멘션을 다변량 상호작용 카운팅 프로세스로 모델링한다 각 계정 j 에 대해 주제 l 별로 누적 리트윗·멘션 횟수 N_j(t,l) 를 관찰하고 그 발생 강도를 위험도 λ_{j,l}(t) 로 표현한다 위험도는 베이스라인 λ_{0,l}(t) 와 팔로우 관계 L_{ij} , 그리고 두 파라미터 α_i 와 β_j 로 구성된 지수 함수 형태이다 α_i 는 계정 i 가 자신의 게시물로 타 사용자를 끌어들이는 장기적인 ‘생성력’ β_j 는 계정 j 가 타 계정의 게시물에 반응하는 ‘감수성’ M_i(t,l)=A_i(t,l)+N_i(t,l) 은 해당 주제에 대한 총 활동량을 나타내며 log(M_i+1) 를 사용해 활동량이 큰 계정의 효과를 완화한다 모델 추정은 Andersen‑Gill 프레임워크의 부분 우도(Partial Likelihood)를 이용한다 전체 로그 우도 LL 은 α와 β 에 대한 연속 미분이 가능하므로 Newton‑type 알고리즘을 설계해 그라디언트와 헤시안을 명시적으로 계산한다 스텝 크기 τ 를 라인 서치를 통해 최적화하고 α₁=0 으로 식별성을 확보한다 복잡도는 주제 수 Γ , 계정 수 n , 최대 관측 횟수 m_n 에 따라 O(Γ·n³·m_n) 로 평가된다 통계적 이론적 분석에서는 시간 구간

카운팅 프로세스 기반 트위터 영향력 측정 모델

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기