장기 트위터 데이터로 안정적 인플루언서 구분

장기 트위터 데이터로 안정적 인플루언서 구분
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 6개월 간의 리트윗 데이터를 활용해 현재 영향력이 높은 트위터 사용자를 ‘안정적 인플루언서’와 ‘일시적 인플루언서’로 구분한다. 소스 스프레더와 브로커 두 유형을 별도로 분석하고, 과거·현재 영향점수, 팔로워·리트윗 네트워크 특성 등을 특징으로 사용해 LightGBM 모델을 구축하였다. 예측 성능은 소스 스프레더에서 AUC 0.89, 브로커에서 AUC 0.81을 기록했으며, 현재 영향력이 가장 중요한 변수임을 확인했다.

상세 분석

이 논문은 기존 인플루언서 탐지 연구가 주로 단기 데이터에 의존하거나 한 종류의 영향만을 고려했던 점을 보완한다. 저자들은 19,000명 규모의 트위터 사용자를 대상으로 2021년 10월부터 2022년 12월까지의 팔로우 관계와 리트윗 활동을 수집했으며, 매월 사용자별 ‘소스 스프레더 점수(자신이 만든 트윗의 총 리트윗 수)’와 ‘브로커 점수(사용자가 리트윗한 트윗이 이후에 발생시킨 추가 리트윗 수)’를 정의하였다. 각 월 상위 10% 사용자를 각각 소스 스프레더와 브로커로 분류하고, 연속 m개월(기본값 6개월) 동안 이 지위를 유지한 경우를 ‘안정적 인플루언서’로, 그렇지 않은 경우를 ‘일시적 인플루언서’로 라벨링했다.

특징 설계는 크게 네트워크 구조와 동적 영향 두 축으로 나뉜다. 팔로워 네트워크와 리트윗 네트워크 각각에서 인-디그리, PageRank, 커뮤니티 규모를 4개월(10~1월) 동안 시계열 형태로 추출했으며, ‘고유 사용자 비율(리트윗을 수행한 고유 사용자 수 대비 총 리트윗 수)’과 ‘영향점수 변화율(log 비율)’을 추가했다. 이러한 다차원 특징을 바탕으로 LightGBM 기반 이진 분류기를 학습시켰으며, 7:3 비율로 훈련·검증 데이터를 나누고 5‑fold 교차 검증으로 하이퍼파라미터를 튜닝했다.

예측 결과는 두 유형 모두 높은 성능을 보였지만, 소스 스프레더에서는 현재 영향점수(당월 총 리트윗 수)가 가장 큰 기여도를 보였고, 브로커에서는 네트워크 중심성(특히 PageRank)보다 현재 브로커 점수가 더 중요한 변수로 작용했다. 또한, 과거 영향 지속 기간이 길수록 안정적 인플루언서가 될 확률이 크게 증가한다는 사실을 정량적으로 확인했다(예: 10월부터 지속적으로 인플루언서였던 사용자는 6개월 연속 유지 확률이 74%에 달함).

이 연구는 실무적 시사점도 제공한다. 마케팅 캠페인에서 장기 계약을 고려할 때, 단순히 현재 팔로워 수나 일시적인 리트윗 급증에 의존하기보다, 과거 3~4개월간의 영향 지속성 및 현재 영향점수를 종합적으로 평가하면 보다 안정적인 파트너를 선별할 수 있다. 또한, 브로커 유형은 단일 중심성 지표만으로는 특성을 파악하기 어려워, 복합적인 행동 패턴(리트윗 전파 경로) 분석이 필요함을 강조한다.


댓글 및 학술 토론

Loading comments...

의견 남기기