온라인 소셜 미디어로 보는 백신 감정과 전염병 위험
초록
이 연구는 2009년 가을부터 2010년 초까지 101,853명의 트위터 사용자를 대상으로 백신에 대한 감정을 분석하고, 지역별 CDC 백신 접종률과 높은 상관관계를 보였으며, 감정이 동질적인 사용자끼리 네트워크를 형성한다는 동질성(assortativity)을 확인하였다. 감정이 군집화될 경우, 실제 접종률도 군집화되어 전염병 발생 위험이 크게 증가한다는 시뮬레이션 결과를 제시한다.
상세 분석
본 논문은 트위터 데이터를 활용해 백신에 대한 긍정·부정·중립 감정을 자동 분류하고, 이를 시공간적 감정 점수로 전환한 뒤 전통적인 CDC 조사와 비교함으로써 온라인 감정이 실제 예방접종 행동을 반영한다는 근거를 제시한다. 477,768개의 트윗 중 318,379개를 백신 관련으로 판별했으며, 그 중 35,884개는 긍정, 26,667개는 부정, 나머지는 중립으로 분류하였다. 감정 점수는 (긍정‑부정)/(전체) 로 정의했으며, 2009년 10월 중순부터 양의 값을 유지해 백신 출시와 맞물렸다.
지역별 상관분석에서는 HHS 10개 지역에서 감정 점수와 CDC가 추정한 접종률 사이의 가중 피어슨 r=0.78(p=0.017)을 기록했으며, 주 단위에서도 r=0.52(p=0.0046)이라는 유의한 양의 상관관계를 보였다. 이는 트위터 감정이 실제 접종 행동을 대리할 수 있음을 시사한다.
네트워크 분석에서는 팔로우 관계를 기반으로 39,284명의 ‘감정 보유 사용자’ 네트워크를 구축하였다. 감정 동질성 지표인 assortativity coefficient r=0.144는 무작위 재배열(10,000번)에서 얻은 최대값 0.0056보다 현저히 높아, 같은 감정을 가진 사용자 간 정보 흐름이 과도하게 집중됨을 입증한다. 또한, 각 노드의 동질성 인입 비율 f 평균이 0.601으로, 무작위 네트워크 평균(≈0.531)보다 유의하게 높았다(p<10⁻⁹⁵).
커뮤니티 탐색에서는 spin‑glass 알고리즘으로 34,025명의 거대 컴포넌트를 여러 커뮤니티로 분할했으며, 대부분의 커뮤니티가 전체 평균 부정 비율(p(-)=0.396)보다 현저히 높은(최대 0.764) 혹은 낮은(최소 0.266) 부정 비율을 보였다(Fisher 정확 검정 p<10⁻⁶). 이는 감정이 지리·사회적 군집을 형성한다는 증거다.
이러한 감정 군집이 실제 백신 접종 군집으로 이어질 경우, 전염병 확산 위험이 급증한다는 점을 고해상도 접촉 네트워크 시뮬레이션으로 검증하였다. 접종률을 일정하게 유지하면서 assortativity r을 변화시켰을 때, r>0.14(실제 트위터 네트워크와 유사)에서는 5% 이상 감염되는 대규모 발병 확률이 무작위 경우에 비해 10배 이상 증가하였다. 이는 특히 집단 면역 한계에 근접한 상황에서 감정·접종 군집이 위험을 크게 확대함을 의미한다.
연구는 온라인 데이터가 실시간·저비용으로 감정 및 행동 패턴을 파악할 수 있는 가능성을 보여주지만, 트위터 이용자와 일반 인구 사이의 대표성 차이, 텍스트 해석의 모호성, 감정 분류 정확도 한계 등 몇 가지 제약도 명시한다. 그럼에도 불구하고 대규모 데이터와 네트워크 정보를 결합함으로써 공중보건 정책—특히 지역 맞춤형 커뮤니케이션 전략—에 활용할 수 있는 실용적 인사이트를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기