코로나19 구글 트렌드 분석: 두 차례 전 세계 관심 급증
초록
본 논문은 2020년 1월 15일부터 3월 24일까지 구글 트렌드(GT)에서 “Coronavirus” 검색 주제를 추출해 전 세계 및 중국, 한국, 이탈리아, 이란 5개 지역의 관심 변화를 분석한다. 첫 번째 관심 피크는 1월 31일, 두 번째 피크는 3월 16일이며 두 번째 파동이 첫 번째보다 6배 규모로 확대되었다. 국가별 GT 데이터와 WHO 신규 확진자 수 사이에 높은 상관관계가 확인되었으며, GT가 감염 확산을 선행 예측할 수 있음을 제시한다.
상세 분석
이 연구는 구글 트렌드라는 공개 데이터베이스를 활용해 전염병에 대한 대중의 정보 탐색 행동을 ‘역공학’ 방식으로 정량화한다는 점에서 의미가 크다. 데이터 수집은 2020년 1월 15일 이후부터 시작했으며, “Coronavirus”라는 검색 토픽을 선택함으로써 언어와 지역을 초월한 관련 키워드 전체를 포괄했다. GT는 0~100 사이의 정규화된 검색량을 제공하는데, 이는 절대 검색량이 아닌 상대적 관심도를 나타낸다.
첫 번째 파동은 1월 31일에 전 세계적으로 최고점(100점)에 도달했으며, 이 시점은 중국 우한에서 초기 감염이 보고된 직후이다. 흥미롭게도, GT 피크 이후 6일 동안 WHO가 보고한 신규 확진자 수가 지속적으로 증가했으며, 이는 대중의 정보 탐색이 실제 감염 확산을 선행한다는 가설을 뒷받침한다.
두 번째 파동은 2월 21일에 시작돼 3월 16일에 정점에 이르렀다. 이때의 피크는 첫 번째 피크의 6배에 달했으며, 이는 이탈리아, 이란, 한국 등 중국 외 지역에서 급격히 확산된 감염 상황과 맞물린다. 국가별 상관관계 분석에서 1차 파동(1월 15일2월 18일)에는 중국, 한국, 이탈리아와 전 세계 사이에 강한 양의 상관관계(r > 0.7, p < 0.01)가 나타났고, 2차 파동(2월 19일3월 24일)에서는 이란과의 상관관계가 특히 두드러졌다(전 세계‑이란 r = 0.777, p < 0.01). 이는 각 국가에서 발생한 급증이 전 세계적인 관심 증가에 직접적인 영향을 미쳤음을 시사한다.
제한점으로는 중국 내 구글 사용 제한으로 인해 GT 데이터가 불완전할 수 있다는 점, 그리고 급변하는 팬데믹 상황에서 데이터가 실시간으로 업데이트되지 않아 시점에 따라 결과가 달라질 수 있다는 점을 언급한다. 또한, GT는 검색 의도와 실제 행동(예: 검진, 방역 조치) 사이의 직접적인 인과관계를 밝히지 못한다는 한계도 있다.
이러한 결과는 공공 보건 당국이 구글 트렌드와 같은 디지털 역학 데이터를 실시간 감시 체계에 통합함으로써, 전염병 확산을 조기에 감지하고 대응 전략을 수립하는 데 활용할 수 있음을 보여준다. 특히, 검색량 급증이 보고된 신규 확진자 증가를 선행한다는 점은 ‘디지털 선행 지표’로서의 가능성을 강조한다.
댓글 및 학술 토론
Loading comments...
의견 남기기