사용자 감정이 트위터 캠페인 전파에 미치는 영향

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

**
본 연구는 트위터 캠페인 팔로워의 감정(긍정·부정·중립)과 그들이 캠페인 메시지를 리트윗하는 비율 사이의 상관관계를 실증적으로 분석한다. 프래킹(시추) 논쟁을 사례로 삼아 감정 예측 모델을 구축하고, 감정 강도와 리트윗율 사이에 통계적으로 유의한 양의 상관관계가 있음을 확인하였다. 또한 감정 기반 타깃팅이 무작위 혹은 주제 기반 타깃팅보다 높은 리트윗 성공률을 보이는 온라인 실험 결과를 제시한다.

상세 분석

**
이 논문은 소셜미디어 캠페인에서 팔로워의 감정이 행동으로 전이되는 메커니즘을 정량화하려는 시도로, 기존 연구가 강조한 활동량·관계·위치와는 별개로 ‘감정(감성)’이라는 심리적 변수를 중심에 놓았다. 연구자는 프래킹(시추) 논쟁이라는 논쟁적 주제를 선택해 네 개의 캠페인(두 개는 친프래킹, 두 개는 반프래킹)으로 데이터를 수집하였다. 데이터 수집 단계는 크게 두 부분으로 나뉜다. 첫째, 캠페인 계정의 최근 트윗과 팔로워들의 최근·역사적 트윗을 크롤링해 토픽 관련 트윗과 일반 트윗을 구분하였다. 둘째, 감정 라벨링을 위해 ‘리트윗=동의’라는 가정을 적용, 프래킹에 대해 1000명씩 긍정·부정·중립 사용자를 선정하고, 이들의 과거 트윗을 이용해 3‑클래스(긍정·부정·중립) 감정 예측 모델을 학습하였다. 특징은 unigram 빈도이며, WEKA의 SVM이 92% 정확도(F1=0.925)를 기록했다.

감정 예측 모델의 실제 적용에서는 200명의 팔로워를 무작위 추출해 크라우드소싱으로 인간 라벨을 만든 뒤, 모델과의 일치율이 87.3%에 불과함을 보고, 라벨링 노이즈와 도메인 편향을 인정한다. 그럼에도 불구하고, 감정 점수(긍정=1, 중립=0, 부정=-1)와 감정 강도(확률×점수)를 정규화된 리트윗 비율과 Pearson 상관분석했을 때, 모든 캠페인에서 감정 폴라리티와 토픽 관련 리트윗 비율 사이에 p<0.05 수준의 양의 상관관계(r≈0.6~0.8)가 관측되었다. 일반 트윗에 대해서는 상관이 약했지만, 감정 강도는 일관되게 더 높은 상관값을 보이며 감정의 강도가 행동 예측에 더 유용함을 시사한다.

예측 모델 구축에서는 감정 폴라리티와 강도를 독립 변수로, 정규화된 리트윗 비율을 종속 변수로 하는 회귀와 분류를 수행했다. 회귀에서는 로지스틱 회귀가 MAE 0.23~~0.28(토픽) 및 0.25~~0.28(일반)으로 가장 낮은 오차를 보였으며, 감정 강도 사용 시 오차가 더 감소했다. 분류에서는 AUC가 0.67~0.80 사이였고, 감정 강도 기반 모델이 전반적으로 높은 성능을 기록했다.

마지막으로 온라인 실험에서는 감정 점수 상위 500명(감정‑랭크‑탑)에게 캠페인 메시지를 전송하고, 무작위 500명, 트위터 스트림에서 무작위 500명, ‘프래킹’ 키워드 언급자 500명 등 네 개의 대조군과 비교했다. 결과는 감정‑랭크‑탑 그룹이 평균 2~3배 높은 리트윗율을 보였으며, 이는 감정 기반 타깃팅이 기존 무작위 혹은 단순 주제 기반 타깃팅보다 효과적임을 실증한다.

전체적으로 이 연구는 (1) 감정 예측 모델이 비교적 높은 정확도를 보이며, (2) 감정 점수와 강도가 팔로워의 리트윗 행동을 예측하는 유의미한 변수임을, (3) 감정 기반 타깃팅이 캠페인 전파 효율을 크게 향상시킬 수 있음을 입증한다. 다만 라벨링 노이즈, 단일 주제(프래킹) 의존성, 그리고 리트윗을 ‘동의’로 단순화한 가정 등 한계점도 명시한다. 향후 연구에서는 다중 주제, 다양한 행동 지표(해시태그 사용, 멘션 등) 및 사용자 인구통계와 네트워크 구조를 통합한 다변량 모델을 탐색할 필요가 있다.

사용자 감정이 트위터 캠페인 전파에 미치는 영향

초록

상세 분석

댓글 및 학술 토론

의견 남기기