주제 수준 의견 영향 모델

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 중국 최대 마이크로블로깅 플랫폼인 텐센트에서 사용자 의견 전파 메커니즘을 분석하고, 토픽과 사회적 직접 영향을 동시에 고려한 토픽‑레벨 의견 영향 모델(TOIM)을 제안한다. TOIM은 사용자 간의 과거 상호작용을 기반으로 의견 전파 확률을 학습하고, 보수적 전파(CP)와 비보수적 전파(NCP) 두 가지 알고리즘을 통해 간접 영향까지 모델링한다. 실험 결과, TOIM은 기존 베이스라인 대비 예측 정확도와 F1 점수에서 유의미하게 우수함을 보였다.

상세 분석

TOIM은 토픽 모델링과 사회적 영향 모델을 하나의 베이지안 프레임워크에 통합한 점이 가장 큰 혁신이다. 먼저 LDA 기반 토픽 추출 과정을 통해 각 마이크로블로그 포스트를 다중 토픽 분포로 변환하고, 각 토픽에 대해 긍정·부정 의견 라벨을 사전 학습된 감성 사전과 사용자별 과거 발언 패턴을 이용해 할당한다. 이후 사용자 간 직접 영향력은 ‘팔로우’, ‘멘션’, ‘리트윗’ 등 상호작용 로그를 가중치화한 행렬로 표현되며, 이는 시간에 따라 누적되는 ‘진행 의견(Progressive Opinion)’이라는 잠재 변수와 결합된다. TOIM은 이 잠재 변수를 EM 알고리즘으로 추정하면서, 토픽별 의견 확률과 사회적 영향 확률을 동시에 업데이트한다.

전파 단계에서는 두 가지 전략을 제시한다. 보수적 전파(CP)는 인접 사용자에게서 받은 의견을 그대로 전달하되, 신뢰도 가중치를 곱해 확률을 조정한다. 반면 비보수적 전파(NCP)는 인접 사용자의 의견을 평균화하고, 토픽 간 연관성을 고려해 교차 전파를 허용한다. 이 두 방법은 실제 데이터에서 큰 차이를 보이지 않았지만, 복잡한 네트워크 구조에서 NCP가 더 높은 회수율을 제공한다는 점이 주목할 만하다.

실험은 텐센트 마이크로블로깅에서 수집한 1억 건 이상의 포스트 중 일부를 샘플링해 수행했으며, 베이스라인으로는 전통적인 LDA‑SVM, 감성 사전 기반 단일 토픽 모델, 그리고 단순 사회 네트워크 전파 모델을 사용했다. 평가 지표는 정확도, 정밀도, 재현율, F1‑score이며, TOIM은 특히 재현율과 F1‑score에서 12%~18% 향상을 기록했다. 이는 토픽 수준에서 의견을 세분화하고, 직접·간접 영향을 모두 고려한 것이 예측 성능을 크게 끌어올렸음을 의미한다.

주제 수준 의견 영향 모델

초록

상세 분석

댓글 및 학술 토론

의견 남기기