트위터 사용자 중요도·영향력·관련성 측정: 2018 브라질 대통령 후보 네트워크 분석
초록
본 연구는 2018년 브라질 대통령 선거 기간 동안 후보자와 관련된 트위터 데이터를 수집·구축한 복합 네트워크를 대상으로, 정점의 차수와 팔로워·팔로잉 수를 결합한 중요도 지표를 제안하고, 메모틱 알고리즘(MADOC)으로 커뮤니티를 탐지한다. 결과는 후보자와 언론인 등 주요 인물들의 영향력 구조와 팔로우/언팔로우 전략을 시각화한다.
상세 분석
본 논문은 소셜 미디어가 정치 캠페인에 미치는 영향을 정량화하기 위해 복합 네트워크 이론을 적용하였다. 데이터 수집 단계에서는 트위터 API를 이용해 2018년 8월 3일부터 10월 29일까지 매일 5 000개의 트윗을 추출, 총 61일간 3.89 백만 개의 유향·가중 에지를 포함하는 265 548개의 정점(해시태그, 링크, 미디어, 트윗, 사용자)으로 구성된 그래프를 구축하였다. 정점은 사용자, 트윗, 해시태그 등 다양한 유형을 포함하였으며, 사용자 정점에 대해 ‘팔로워 수’와 ‘팔로잉 수’를 별도 속성으로 저장하였다.
중요도 측정은 두 단계로 이루어진다. 첫 번째는 네트워크 토폴로지를 반영한 차수(k)이며, 두 번째는 팔로워와 팔로잉을 정규화한 I_norm을 곱해 최종 중요도 I(v)=k(v)·I_norm(v)로 정의한다. I_norm은 각각의 팔로워와 팔로잉 수를 전체 네트워크에서 최대값으로 나눈 후 제곱 평균을 취해 0‒1 사이의 값으로 스케일링한다. 이 방식은 단순 차수 중심성에 소셜 미디어 특유의 확산 능력(팔로워)과 상호작용 가능성(팔로잉)을 동시에 반영한다는 점에서 의미가 있다.
커뮤니티 탐지는 모듈러리티 최적화를 목표로 하는 메모틱 알고리즘 MADOC을 적용하였다. 메모틱 알고리즘은 유전 알고리즘의 전역 탐색과 지역 탐색을 결합해 복잡한 최적화 문제에 대한 근사 해를 제공한다. 논문에서는 Q=0.492의 모듈러리티 값을 얻어 30개의 중첩되지 않은 커뮤니티를 도출했으며, 각 커뮤니티는 후보자 혹은 언론인 중심으로 형성된 것을 시각적으로 확인하였다.
결과 분석에서는 차수 상위 20개의 정점이 주로 후보자와 유명 언론인(예: Jair Bolsonaro, Marina Silva, Ciro Gomes, Danilo Gentili 등)임을 확인했다. 팔로워 수와 팔로잉 수를 별도로 제시한 표와 그림을 통해, 일부 후보자는 팔로워는 많지만 팔로잉이 적은 전형적인 ‘인플루언서’ 형태를 보였으며, 반대로 Alvaro Dias와 같은 인물은 팔로잉 수가 비정상적으로 높아 팔로우/언팔로우 전략을 의심할 수 있었다. 또한, 미국 대통령 트럼프(@realdonaldtrump)와 같은 외부 인물은 네트워크 내 직접적인 연결이 없었지만 멘션을 통해 간접적으로 영향력을 행사하고 있음을 확인했다.
이러한 분석은 트위터 상에서 정치적 메시지의 확산 경로와 핵심 매개자를 식별하는 데 유용하며, 팔로워·팔로잉 전략이 실제 영향력과 어떻게 상관관계가 있는지를 정량적으로 보여준다. 다만, 데이터 수집이 후보자 공식 인증 계정에 국한되었고, 리트윗·멘션 외의 비공개 상호작용을 포착하지 못한 점, 그리고 정점 가중치를 단순히 팔로워·팔로잉 수에만 의존한 점은 향후 연구에서 보완이 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기