언어가 드러내는 정체성 융합과 폭력 경로의 문화적 차이

언어가 드러내는 정체성 융합과 폭력 경로의 문화적 차이
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 인공지능 기반 언어 분석 도구인 CLIFS를 활용해 영국·싱가포르 참여자들의 텍스트에서 정체성 융합 수준을 추정하고, 극단주의 선언문을 대상으로 두 가지 폭력 경로(이데올로기적 융합 vs 피해자‑주도 융합)를 규명한다. CLIFS는 기존 지표보다 높은 상관관계와 낮은 오차를 보이며, 문화·도메인 간 일반화 가능성을 입증한다.

상세 분석

이 논문은 정체성 융합(identity fusion)이 폭력 행동을 예측하는 핵심 심리 메커니즘이라는 기존 이론을 언어학적 데이터와 최신 대형 언어 모델(LLM)을 결합한 새로운 측정법, Cognitive Linguistic Identity Fusion Score(CLIFS)로 검증한다. CLIFS는 네 가지 핵심 구성요소를 통합한다. 첫째, 기존 연구에서 도출된 인지언어학적 패턴을 사전 정의한다. 둘째, ModernBERT 기반 임베딩을 활용해 인간이 아직 명시적으로 규정하지 않은 미묘한 의미 신호를 포착한다. 셋째, 미세조정된 BERT 분류기로 얻은 ‘고융합’ 확률을 제공한다. 넷째, 마스크드 언어 모델을 이용한 암시적 은유 탐지를 통해 ‘가족‑같은 관계(Fictive‑Kinship)’, ‘자기‑집단 겹침(Fusion Proximity)’, 그리고 자기→집단·집단→자기 방향성 점수(SI→T, ST→I)를 정량화한다.

실험은 두 개의 외부 데이터셋(영국·싱가포르 MTurk 설문, 현장 인터뷰)과 극단주의 선언문(9개 기존 + 9개 신규)에서 수행되었다. 텍스트 길이가 짧은 경우 NLTK 기반 전처리로 최소 단어·문장 수를 설정해 필터링했으며, 384 토큰 제한을 넘는 긴 텍스트는 300단어 이하의 문장 보존 청크로 분할했다. 비교 대상은 Unquestioning Affiliation Index(UAI), 그 변형 nUAI, 그리고 Violence Risk Index‑Fusion(VRI‑Fusion)이다.

결과는 모든 필터링 조건에서 CLIFS가 VIFS(Verbal Identity Fusion Scale) 점수와 가장 높은 스피어만 상관(r_s=0.310.55)과 가장 낮은 평균 절대 오차(MAE=1.111.75)를 기록함을 보여준다. 반면 기존 지표는 통계적으로 유의미한 상관을 거의 보이지 못했으며, 특히 VRI‑Fusion은 전혀 의미 있는 예측력을 나타내지 못했다. 이는 은유 기반 특성이 고차원 임베딩보다 융합 감지를 더 효율적으로 수행한다는 점을 시사한다.

폭력 경로 분석에서는 ‘이데올로기적’ 집단과 ‘피해자’ 집단 간 CLIFS 점수 평균 차이가 미미했지만, 은유 특성에서 뚜렷한 차이가 발견되었다. 피해자 집단은 Fusion Proximity와 ST→I 점수가 상대적으로 높아 ‘자신을 집단에 투사’하는 경향이 강했으며, 반면 이데올로기 집단은 Fictive‑Kinship 점수가 더 높아 집단을 가족처럼 인식한다는 특징을 보였다. 이러한 차이는 정체성 융합이 비대칭적이거나 비가족적 형태로도 나타날 수 있음을 뒷받침한다.

이론적으로는 기존 CIFT(Comprehensive Identity Fusion Theory)의 확장을 지지하며, 융합 대상이 사회적 집단을 넘어 가치·이념 등 추상적 개념으로 확장될 수 있음을 실증한다. 실용적 측면에서는 CLIFS가 대규모 텍스트 스트림에서 자동으로 고위험 개인을 탐지할 수 있는 스케일러블한 도구임을 강조한다. 특히 문화·언어적 다양성을 포괄하는 일반화 능력은 기존 규칙 기반 혹은 단순 단어 빈도 모델이 갖는 한계를 극복한다는 점에서 의미가 크다.


댓글 및 학술 토론

Loading comments...

의견 남기기