트위터 극단주의 콘텐츠 탐지를 위한 급진적 사고 신호 분석
본 논문은 ISIS 선전물에서 추출한 텍스트·심리·행동 신호를 활용해 트위터 상의 급진적 발언을 자동으로 식별하는 모델을 제안한다. TF‑IDF와 word2vec 기반의 텍스트 특징, LIWC를 이용한 심리적 특성, 사용자 활동·네트워크 지표를 결합한 다중 특성 접근법이 높은 정확도를 보이며, 특히 심리적 특성이 가장 구별력이 높음을 확인하였다.
저자: Mariam Nouh, Jason R. C. Nurse, Michael Goldsmith
본 논문은 온라인 소셜 네트워크, 특히 트위터에서 급진적·극단주의 콘텐츠를 자동으로 탐지하기 위한 종합적인 방법론을 제시한다. 연구 배경으로는 테러리스트와 급진주의 단체가 인터넷을 활용해 대규모 선전·선동을 전개하고, 이를 통해 잠재적 신병을 모집한다는 점을 들며, 이러한 선전물의 조기 탐지가 사회 안전에 필수적임을 강조한다.
**1. 관련 연구**에서는 기존의 급진적 계정 탐지 연구가 주로 키워드 기반 텍스트 분석에 의존했으며, 이는 어휘 회피나 다의어 문제에 취약하다는 한계를 지적한다. 또한, 심리학적 접근을 통해 텍스트가 저자의 정서·성격을 반영한다는 점을 언급하면서, LIWC와 같은 도구가 심리적 특성 추출에 활용될 수 있음을 소개한다.
**2. 데이터 수집 및 전처리** 단계에서는 ISIS가 발행한 영문 매거진 *Dabiq*를 급진적 언어 모델링의 원본 자료로 사용한다. 매거진 텍스트를 전처리한 뒤, TF‑IDF와 word2vec을 각각 적용해 두 종류의 텍스트 특징을 생성한다. TF‑IDF는 unigram·bigram·trigram을 대상으로 상위 k‑gram을 선택하고, word2vec은 skip‑gram 방식으로 100차원 임베딩을 학습한다. 트위터 데이터는 2015년 파리 테러 당시 Kaggle에서 공개된 pro‑ISIS 계정 트윗 17,000건(100여 명)과, 일반 트렌드 주제에서 수집한 비극단적 트윗을 대조군으로 사용한다.
**3. 특성 설계**는 세 축으로 구성된다.
- **텍스트 특성(F_T)**: TF‑IDF 기반 n‑gram 점수, word2vec 임베딩 평균·최대값, 폭력·욕설 사전 비율, 전부 대문자 단어 비율 등을 포함한다.
- **심리적 특성(F_P)**: LIWC 사전을 이용해 요약 변수(Analytic, Clout, Tone, Authentic), 빅 파이브(OCEAN), 감정(긍정·부정·분노·불안·슬픔), 개인 동기(권력·보상·위험·성취·소속), 인칭대명사 사용량 등을 추출한다. 각 사용자의 프로파일과 ISIS 매거진 평균 프로파일 간의 Minkowski 거리를 계산해 추가 특성으로 활용한다.
- **행동 특성(F_B)**: 트윗 빈도, 팔로워·팔로잉 비율, 해시태그 사용량, 멘션 기반 상호작용 그래프(G_M)에서의 중심성(도-degree, betweenness, HITS‑Hub) 등을 포함한다.
**4. 모델 학습 및 평가**에서는 추출된 특성을 입력으로 하여 랜덤 포레스트, 서포트 벡터 머신, XGBoost 등 여러 분류기를 실험한다. 실험은 두 가지 시나리오(1) 전체 특성 결합, (2) 각 특성군별 단독 사용)로 진행했으며, 교차 검증을 통해 정확도, 정밀도, 재현율, F1 점수를 측정한다. 결과는 다음과 같다.
- 텍스트 임베딩을 포함한 모델이 TF‑IDF만 사용했을 때보다 약 7~9% 높은 정확도를 보였다.
- 심리적 특성만 사용했을 때도 85% 이상의 정확도를 달성했으며, 이는 가장 구별력이 높은 신호임을 시사한다.
- 행동 특성은 단독으로는 중간 수준의 성능을 보였지만, 텍스트·심리 특성과 결합될 경우 전체 성능을 약 3% 향상시켰다.
- 최종적으로 텍스트(F_T)+심리(F_P)+행동(F_B) 전체를 결합한 모델이 92% 이상의 정확도와 0.88 이상의 F1 점수를 기록했다.
**5. 논의**에서는 심리적 특성이 급진적 콘텐츠를 구분하는 핵심 요소라는 점을 강조한다. 이는 단순 단어 빈도보다 사용자의 내재된 정서·성격 상태를 반영하기 때문이다. 또한, word2vec 기반 임베딩이 의미적 연관성을 포착해 분류 성능을 크게 끌어올린다는 점을 확인했다. 그러나 데이터가 ISIS 영문 선전물에 국한되고, 라벨링이 키워드 기반이므로 다른 급진주의 그룹이나 다언어 환경에 대한 일반화는 추가 연구가 필요하다.
**6. 결론 및 향후 연구**에서는 제안한 다중 신호 프레임워크가 트위터와 같은 실시간 소셜 플랫폼에서 급진적 계정 탐지에 적용 가능함을 제시한다. 향후 연구 방향으로는 (1) 다국어·다문화 데이터셋 구축, (2) 심리적 특성의 실시간 추적을 위한 경량화 모델, (3) 플랫폼 정책과 연계한 자동 차단·경고 시스템 설계 등을 제안한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기