온라인 유인 대화의 단계별 언어 특성 분석
초록
본 연구는 아동 대상 온라인 유인 채팅을 여섯 단계의 유인 이론에 따라 수작업으로 라벨링하고, LIWC를 활용해 각 단계별 심리언어적 특성을 정량화하였다. 관계 형성 단계가 가장 빈번하게 나타났으며, 단계 전이 확률과 단어 카테고리 연관성을 통해 기존 키워드 기반 탐지의 한계를 보완할 수 있는 통찰을 제공한다.
상세 분석
이 논문은 사이버 범죄 중 아동 대상 온라인 유인(online grooming) 현상을 학문적으로 조명하기 위해 두 가지 주요 연구축을 설정한다. 첫째는 유인 대화를 전통적인 ‘키워드 탐지’가 아닌, 심리언어학적 관점에서 단계별로 분류하고 분석한다는 점이다. 둘째는 실제 현장에서 수집된 75개의 채팅 로그를 여섯 단계(관계 형성, 신뢰 구축, 친밀감 조성, 성적 제안, 성적 행동, 종료)로 라벨링한 후, LIWC(Linguistic Inquiry and Word Count) 도구를 이용해 정량적 프로파일을 구축한다는 점이다.
데이터 전처리 과정에서 연구진은 익명화와 개인정보 제거를 철저히 수행했으며, 라벨링은 두 명 이상의 전문가가 교차 검증하는 방식으로 신뢰성을 확보했다. 라벨링 기준은 기존 유인 이론을 토대로 구체적인 발화 패턴과 의도적 표현을 기준으로 정의했으며, 단계 간 전이 확률을 마코프 전이 행렬로 모델링했다. 이는 대화 흐름이 선형이 아니라 복합적인 순환 구조를 가질 수 있음을 보여준다.
LIWC 분석 결과, 관계 형성 단계에서는 사회적 연결을 나타내는 단어(‘친구’, ‘우리’)와 감정 표현(‘좋아’, ‘행복’)가 높은 빈도로 등장한다. 반면 성적 제안 단계에서는 성적 의미를 내포한 단어와 신체 부위 언급이 급증한다. 흥미롭게도 성적 행동 단계에서도 직접적인 성적 용어보다는 은유적 표현과 암시가 주를 이루어, 단순 키워드 매칭만으로는 탐지가 어려운 점을 강조한다.
또한, 각 단계별 LIWC 카테고리와 전이 확률 사이에 통계적 상관관계를 검증했으며, 예를 들어 ‘친밀감’ 카테고리 점수가 높을수록 다음 단계가 ‘성적 제안’으로 전이될 확률이 유의하게 증가한다는 결과를 도출했다. 이러한 발견은 실시간 대화 모니터링 시스템에 단계별 위험 점수를 부여함으로써, 초기 단계에서의 선제적 개입 가능성을 시사한다.
연구의 한계로는 샘플 규모가 제한적이며, 주로 영어권 포럼에서 수집된 데이터라 문화적 차이에 대한 일반화가 어려울 수 있다는 점을 들었다. 또한 라벨링 과정에서 주관적 판단이 개입될 여지가 있어, 향후 자동화된 단계 분류 모델 구축이 필요하다.
전반적으로 이 논문은 온라인 유인 대화를 심리언어학적 프레임워크와 정량적 도구(LIWC)를 결합함으로써, 기존의 표면적 키워드 탐지를 넘어선 다층적 위험 인식 모델을 제시한다는 점에서 학술적·실무적 의의가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기