트위터 감정이 주식시장 예측한다

트위터 감정이 주식시장 예측한다
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 2008년부터 2009년까지 수집한 트위터 데이터를 활용해 대중의 감정 상태를 정량화하고, 이를 다우존스 산업평균지수(DJIA)의 일일 변동과의 상관관계 및 인과관계를 분석한다. OpinionFinder와 GPOMS 두 가지 감정 측정 도구를 적용해 긍정‑부정 및 6가지 감정 차원을 추출했으며, 그 결과 특정 감정(특히 ‘활기’와 ‘경계’)이 DJIA 상승·하락을 예측하는 데 유의미한 정보를 제공함을 확인했다. 그리니저 인과분석과 자기조직화 퍼지 신경망 모델을 결합한 예측에서는 감정 변수를 포함했을 때 예측 정확도가 87.6%에 달하고 평균 절대 오차가 6% 이상 감소하였다.

상세 분석

본 논문은 사회적 감정이 집단적 의사결정에 미치는 영향을 실증적으로 검증하고자 트위터라는 실시간 소셜 미디어 플랫폼을 데이터 원천으로 삼았다. 데이터는 2008년 2월부터 2009년 12월까지 약 10억 건의 트윗을 수집했으며, 일별로 집계된 텍스트를 두 가지 감정 분석 도구에 투입하였다. 첫 번째 도구인 OpinionFinder는 전통적인 감성 사전 기반 접근법으로 트윗을 긍정 혹은 부정으로 분류한다. 두 번째 도구인 Google‑Profile of Mood States(GPOMS)는 ‘Calm(평온)’, ‘Alert(경계)’, ‘Sure(확신)’, ‘Vital(활기)’, ‘Kind(친절)’, ‘Happy(행복)’의 6차원 감정 점수를 산출한다. 두 감정 시계열은 각각 독립적으로 전처리된 뒤, DJIA 종가와의 시계열 상관관계를 파악하기 위해 1일~7일 지연(lag) 모델을 적용하였다.

그리니저 인과분석 결과, ‘Alert’와 ‘Vital’ 차원은 1~3일 지연에서 DJIA 변동을 선행적으로 설명하는 통계적 유의성을 보였으며, 반면 ‘Calm’이나 ‘Kind’는 예측력에서 제외되었다. 이는 투자자들의 위험 회피·추진 성향이 시장 움직임에 직접적인 영향을 미친다는 기존 행동금융 이론과 일맥상통한다.

예측 모델링 단계에서는 자기조직화 퍼지 신경망(SOFNN)을 채택하였다. 입력 변수는 과거 5일간의 DJIA 종가와 감정 점수이며, 출력은 다음 날 종가의 상승·하락 여부와 실제 가격 변동량이다. 베이스라인 모델(감정 변수 제외) 대비 감정 변수를 포함한 모델은 정확도가 78.3%에서 87.6%로 상승했으며, 평균 절대 백분율 오차(MAPE)는 9.4%에서 3.2%로 크게 감소하였다. 교차 검증 결과는 과적합 위험을 최소화했으며, 감정 변수의 선택적 포함이 모델 성능 향상의 핵심 요인임을 확인했다.

연구의 한계로는 트위터 사용자층이 전체 인구를 대표하지 못한다는 점, 감정 사전의 문화적 편향, 그리고 외부 충격(예: 금융 위기, 정책 발표)과 감정 변동 사이의 복합적 인과관계를 완전히 분리하지 못했다는 점을 들 수 있다. 향후 연구에서는 다중 플랫폼 데이터(페이스북, 뉴스 댓글 등)와 고차원 텍스트 임베딩을 결합해 감정 측정의 정밀도를 높이고, 비선형 시계열 모델(예: LSTM, Transformer)과의 비교 분석을 수행할 필요가 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기