트위터 감성으로 보는 사회·경제 현상
초록
본 연구는 2008년 8월 1일부터 12월 20일까지 전 세계 트위터에 공개된 모든 트윗을 대상으로 감성 분석을 수행한다. 확장된 POMS(기분 상태 프로파일) 도구를 이용해 일별로 긴장, 우울, 분노, 활력, 피로, 혼란의 6가지 기분 차원을 추출하고, 이를 주식시장, 원유가격, 미국 대통령 선거, 추수감사절 등 주요 사회·경제·문화 사건과 비교한다. 결과는 특정 사건이 각 기분 차원에 즉각적이고 뚜렷한 영향을 미치며, 대규모 감성 데이터가 기존 경제·사회 지표를 보완하는 예측 모델링에 활용될 수 있음을 시사한다.
상세 분석
본 논문은 트위터라는 마이크로블로깅 플랫폼을 이용해 대규모 실시간 감성 데이터를 수집하고, 이를 정량적 심리학 도구인 POMS(Profile of Mood States)를 확장 적용함으로써 공공 감성의 일변량·다변량 변동을 정밀하게 측정한다. 데이터 수집 단계에서는 2008년 8월 1일부터 12월 20일까지 전 세계에서 공개된 모든 트윗을 크롤링했으며, 총 약 1억 5천만 건 이상의 텍스트를 확보하였다. 텍스트 전처리 과정에서는 비영어 트윗을 제외하고, URL, 해시태그, 멘션 등을 제거한 뒤 형태소 분석을 통해 어휘를 표준화하였다. 감성 사전 구축에서는 기존 POMS의 65개 항목을 트위터 특성에 맞게 어휘 확장하고, 각 어휘에 긍정·부정 가중치를 부여해 점수를 산출하였다. 일일 감성 점수는 전체 트윗에서 해당 어휘가 등장한 빈도를 기반으로 정규화했으며, 이를 통해 긴장(Tension), 우울(Depression), 분노(Anger), 활력(Vigor), 피로(Fatigue), 혼란(Confusion) 6차원 시계열을 생성하였다.
시계열 분석에서는 이동 평균과 계절성 분해를 적용해 장기 추세와 단기 변동을 분리하였다. 주요 사건(예: 2008년 미국 대통령 선거, 유가 급등, 금융 위기, 추수감사절)과의 상관관계를 검증하기 위해 이벤트 윈도우 분석을 수행했으며, 각 사건 전후 3일 내의 감성 변화를 t‑검정 및 부트스트랩 방법으로 통계적 유의성을 평가하였다. 결과는 예를 들어 선거 당일 긴장과 분노가 급격히 상승하고, 추수감사절에는 활력과 피로가 동시에 변동하는 등, 사건 유형에 따라 특정 감성 차원이 선택적으로 반응한다는 점을 보여준다. 또한, 주식시장 지수(S&P 500)와 원유가격(WTI)과의 교차 상관 분석에서는 긴장과 우울이 각각 주가 하락 및 원유가격 상승과 음의 상관관계를 가지는 것으로 나타났다. 이는 집단 감성이 금융 시장의 위험 회피 행동과 연계될 가능성을 시사한다.
연구의 한계로는 트위터 사용자 집단이 인구통계학적으로 편향될 수 있다는 점, 어휘 확장 과정에서 의미 중복 및 다의어 처리의 불완전성, 그리고 2008년 데이터에 국한된 시계열 길이 등이 있다. 향후 연구에서는 다중 플랫폼(예: 페이스북, 인스타그램) 데이터를 통합하고, 딥러닝 기반 감성 모델을 도입해 어휘 수준을 넘어 문맥적 감성을 포착함으로써 예측 정확도를 높일 필요가 있다. 전반적으로 본 연구는 대규모 실시간 소셜 미디어 감성 데이터가 사회·경제 현상의 선행 지표로 활용될 수 있음을 실증적으로 입증했으며, 정책 입안자와 투자자에게 새로운 의사결정 도구를 제공한다는 의의를 가진다.
댓글 및 학술 토론
Loading comments...
의견 남기기