소셜 네트워크를 활용한 사용자 수준 감성 분석

소셜 네트워크를 활용한 사용자 수준 감성 분석
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

트위터의 팔로우·팔로워 관계와 @멘션 네트워크를 이용해 사용자 수준 감성 분류 모델을 구축하고, 텍스트 기반 SVM에 비해 통계적으로 유의한 성능 향상을 입증하였다.

상세 분석

본 논문은 사용자 간 사회적 연결성이 감성 의견의 동질성을 높인다는 가설을 검증하고, 이를 그래프 기반 인퍼런스 모델에 통합한다. 저자들은 트위터 데이터를 활용해 두 종류의 네트워크, 즉 t‑follow(팔로우/팔로워)와 @‑mention(멘션) 그래프를 구축하였다. 각각의 그래프는 방향성(directed)과 상호성(mutual) 두 가지 정의로 세분화되어, 사용자가 일방적으로 팔로우하거나 멘션한 경우와 상호 연결된 경우를 구분한다. 이러한 네트워크 구조를 factor‑graph 형태로 모델링하고, 사용자와 해당 사용자의 트윗을 각각 노드로 두어 사용자‑트윗 의존성(factor)과 사용자‑사용자 의존성(h factor)을 동시에 학습한다. 반지도 학습(semi‑supervised) 설정하에 소수의 라벨된 사용자만을 이용해 전체 그래프에 라벨을 전파하며, 파라미터 추정에는 라벨 전파와 최대우도 추정이 결합된 변분 EM 방식을 적용한다. 실험에서는 ‘Obama’, ‘Sarah Palin’, ‘Glenn Beck’, ‘Lakers’, ‘Fox News’ 등 다섯 개 주제에 대해 800여 명의 사용자와 수천 개의 연결을 분석했으며, 네트워크 연결이 존재할 경우 동일 감성일 확률이 무작위 대비 0.8 이상으로 크게 상승함을 확인했다. 특히 t‑follow 그래프가 @‑graph보다 연결 강도가 높아 감성 전파에 더 유리했지만, 일부 주제에서는 상호 @‑mention이 오히려 성능을 끌어올렸다. 모델 비교에서는 텍스트 특징만을 이용한 선형 SVM 대비, 네트워크 정보를 포함한 그래프 모델이 평균 3~5%의 정확도 향상을 보였으며, 통계적 유의성(p<0.01)도 확보했다. 논문은 또한 에지 품질이 충분히 높을 경우, 적은 수의 고품질 연결만으로도 의미 있는 성능 개선이 가능함을 제시한다. 이러한 결과는 감성 분석에서 사회적 관계 정보를 활용하는 것이 특히 짧은 텍스트(트윗)로 인한 정보 부족을 보완할 수 있음을 시사한다.


댓글 및 학술 토론

Loading comments...

의견 남기기