2011 도호쿠 대지진 트위터 데이터 분석을 통한 공공 감정 및 조기 경보 연구
초록
**
본 논문은 2011년 3월 9일부터 5월 31일까지 도쿄 지역에서 수집한 150만 건 이상의 트위터 메시지를 분석한다. 영어와 일본어 트윗을 각각 키워드 필터링해 지진·쓰나미, 방사능, 공포(불안) 세 가지 사건을 추적하고, 트윗 양과 시점이 실제 재난 발생과 얼마나 일치하는지를 검증한다. 결과는 두 언어 모두 재난 발생 직후 급증하며, 일본어 트윗이 조기 경보 역할을 수행하고, 불안감은 약 2주 내에 정상 수준으로 회복함을 보여준다.
**
상세 분석
**
본 연구는 트위터 API를 활용해 2011년 3월 9일부터 5월 31일까지 도쿄 지역에서 발행된 트윗을 수집하였다. 총 48 870건의 영어 트윗과 1 611 753건의 일본어 트윗이 확보되었으며, 이는 기존 연구보다 훨씬 큰 규모다. 데이터 전처리는 두 단계로 이루어졌다. 첫째, 지진·쓰나미, 방사능, 불안(Anxiety)과 관련된 키워드 리스트를 각각 영어와 일본어로 구성하였다. 키워드 선정은 사전 조사와 현장 전문가 의견을 반영했으며, 표 1에 상세히 제시된다. 둘째, 일일 트윗 수를 전체 트윗 수로 나누어 정규화된 비율(f(event))을 계산함으로써 일일 변동성을 보정하였다.
시간적 분석에서는 주요 사건(3월 11일 지진·쓰나미, 3월 12·15일 방사능 관련 폭발, 4월 11·12일 추가 방사능 사고)과 트윗 피크를 비교하였다. 일본어 트윗은 지진 발생 1분 25초 후에 최초로 포착되었으며, 영어 트윗은 약 2분 30초 후에 나타났다. 이는 일본어 사용자가 현지 상황을 더 빠르게 공유한다는 점을 시사한다. 또한, 방사능 관련 트윗은 일본어가 3월 12·15일에 급증한 반면, 영어 트윗은 3일~4일 뒤에 피크를 보였다. 이는 외국인 거주자와 현지 주민 간 정보 인식 차이를 반영한다.
불안 감지에서는 트윗 빈도가 지진 직후 최고조에 달하고, 이후 2주 내에 급격히 감소한다. 특히 4월 11일 방사능 사고 이후 약간의 재상승이 있었지만, 일본어 트윗에서는 큰 변동이 없었다. 이는 일본인 주민이 재난 상황에서도 비교적 침착하게 정보를 처리했음을 의미한다.
통계적으로는 영어와 일본어 트윗 간 상관계수가 0.85 이상으로 높은 양의 상관관계를 보였으며, 이는 두 언어 사용자가 동일한 사건에 대해 동시다발적으로 반응한다는 것을 뒷받침한다. 다만, 트윗 양의 절대적 차이(일본어가 압도적으로 많음)와 키워드 리스트의 제한성은 연구의 한계로 지적된다. 향후 자동화된 키워드 추출 및 감성 분석 모델을 적용하면 더 정교한 재난 감시 체계 구축이 가능할 것으로 기대된다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기