성차별 트윗 작성 시 감정 유형과 강도 분석: NLP 기반 심리 상태 탐색
초록
본 연구는 Sharifirad와 Matwin이 정의한 네 가지 성차별 트윗(간접 괴롭힘, 정보 위협, 성적 괴롭힘, 신체적 괴롭힘) 카테고리를 대상으로, SemEval‑2018 감정 트윗 데이터셋을 활용해 감정 유형과 강도를 자동으로 분류한다. 다양한 머신러닝·딥러닝 모델을 비교·평가한 뒤 최고 성능 모델을 각 성차별 카테고리에 적용해 작성자의 정서 상태를 추정한다. 이는 성차별 트윗에 대한 정서 분석을 최초로 심층 수행한 연구로, 온라인 혐오 발언의 심리적 배경을 이해하는 데 기여한다.
상세 분석
본 논문은 기존 성차별 연구가 ‘친절한 성차별’과 ‘적대적 성차별’이라는 두 축에만 머물러 다양한 하위 유형을 간과한다는 점을 지적하고, Sharifirad와 Matwin(2018)이 제시한 네 가지 세분화된 카테고리(간접 괴롭힘, 정보 위협, 성적 괴롭힘, 신체적 괴롭힘)를 NLP 연구에 적용한다는 점에서 독창성을 갖는다. 데이터는 SemEval‑2018 Task 1 “Affect in Tweets”에서 제공된 감정 라벨(anger, fear, joy, sadness 등)과 강도 점수(0‑1) 를 이용했으며, 이 데이터는 원래 일반 트윗에 대한 감정 분석을 목적으로 수집된 것이므로, 성차별 트윗에 직접 라벨링된 데이터가 부족한 상황을 보완하기 위해 전이 학습 방식을 채택한다.
모델링 단계에서는 전통적인 TF‑IDF 기반 선형 SVM, 랜덤 포레스트, Gradient Boosting과 최신 딥러닝 모델인 Bi‑LSTM, CNN‑RNN 하이브리드, 그리고 사전 학습된 BERT 기반 변형(bert‑base‑uncased)을 비교한다. 각 모델은 감정 유형(다중 클래스)과 감정 강도(회귀) 두 가지 태스크에 대해 별도 학습되며, 교차 검증을 통해 최적 하이퍼파라미터를 탐색한다. 평가 지표는 다중 클래스 분류의 경우 F1‑macro, 회귀의 경우 Pearson 상관계수와 RMSE를 사용한다. 실험 결과, BERT‑based 모델이 TF‑IDF + SVM보다 약 7 % 높은 F1‑score와 0.12 향상된 상관계수를 기록했으며, 특히 ‘분노’와 ‘혐오’ 감정에 대한 감지력이 크게 개선되었다.
선정된 최우수 모델을 각 성차별 카테고리별 트윗에 적용한 결과, 간접 괴롭힘 트윗은 주로 ‘불안’과 ‘분노’가 혼합된 낮은 강도 감정을 보이는 반면, 신체적 괴롭힘 트윗은 ‘분노’와 ‘혐오’가 높은 강도로 나타났다. 정보 위협 카테고리는 ‘두려움’과 ‘불안’이 주를 이루며, 성적 괴롭힘은 ‘희열’과 ‘분노’가 동시에 높은 복합 감정을 드러냈다. 이러한 정서 프로파일은 성차별 발언이 단순히 공격적인 언어를 넘어서, 작성자의 심리적 동기와 감정 상태를 반영한다는 가설을 뒷받침한다.
또한 논문은 데이터 편향 문제와 라벨링 오류 가능성을 논의한다. SemEval 데이터는 일반 트윗에 기반하므로, 성차별 트윗 특유의 은어·코드워드가 감정 사전과 매칭되지 않을 위험이 있다. 이를 보완하기 위해 저자들은 사전 학습 단계에서 성차별 관련 키워드 리스트를 추가하고, 감정 사전 확장을 위한 도메인 적응 기법을 제안한다. 마지막으로, 윤리적 고려사항으로 모델이 악용될 경우 특정 사용자 그룹을 표적화하거나 감시하는 데 사용될 위험성을 언급하고, 투명한 모델 공개와 책임 있는 사용 가이드를 제시한다.
전반적으로 본 연구는 성차별 트윗에 대한 감정 유형·강도 분석을 최초로 수행함으로써, 혐오 발언 탐지와 심리 상태 추정 사이의 연결 고리를 제공한다. 향후 연구에서는 다국어 데이터셋 확대, 실시간 스트리밍 분석, 그리고 감정‑동기 연계 모델링을 통해 보다 정교한 위험도 평가 체계를 구축할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기