인지 왜곡 자동 탐지 및 분류 모델

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 15가지 인지 왜곡을 자동으로 식별하고 분류하기 위한 머신러닝 프레임워크를 제시한다. 크라우드소싱과 실제 온라인 치료 프로그램에서 수집한 두 개의 자유 텍스트 데이터셋을 활용했으며, 왜곡 여부 판별에서는 가중 F1 = 0.88, 15가지 왜곡 카테고리 분류에서는 크라우드소싱 데이터에서 0.68, 온라인 상담 데이터에서 0.45의 가중 F1 점수를 기록했다. 또한, 차별적 단어·구절 분석, 비지도 클러스터링·토픽 모델링을 통해 왜곡 간의 주제적 연관성을 탐색하고, 실무 적용 시 발생하는 윤리·프라이버시 문제를 논의한다.

상세 분석

본 연구는 인지심리학에서 정의되는 ‘인지 왜곡’이라는 개념을 자연어 처리(NLP)와 결합해, 자동화된 진단 보조 도구로 활용하고자 한다. 데이터는 두 갈래로 구성되는데, 첫 번째는 크라우드소싱 플랫폼을 통해 일반인에게 자유롭게 서술하게 한 15,000여 개의 문장(또는 단락)이며, 두 번째는 실제 온라인 치료 프로그램에 참여한 환자들의 상담 기록 3,200여 개이다. 두 데이터 모두 전문 심리학자에 의해 15가지 왜곡(예: 전부 아니면 전무, 흑백 사고, 과잉 일반화 등)과 ‘비왜곡’ 라벨이 부여되었으며, 라벨링 일관성을 확보하기 위해 Cohen’s κ = 0.82 이상의 상호 신뢰도를 달성했다.

전처리 단계에서는 토큰화, 맞춤법 교정, 불용어 제거와 함께, 감정 어휘 사전을 활용해 감성 점수를 부여하였다. 모델링에는 사전학습된 한국어 BERT(KcBERT)와 RoBERTa 기반의 다중 라벨 분류기를 사용했으며, 왜곡 여부 이진 분류와 15-클래스 다중 분류를 각각 별도 헤드로 구성했다. 손실 함수는 이진 분류에 대해 BCEWithLogitsLoss, 다중 분류에 대해 CrossEntropyLoss를 적용했으며, 클래스 불균형을 완화하기 위해 가중치를 역비율로 조정하였다. 하이퍼파라미터 튜닝은 5‑fold 교차 검증을 통해 학습률(2e‑5), 배치 크기(16), 에포크 수(4)를 최적화했다.

성능 평가는 가중 F1, 정확도, 리콜, 프리시전 등 다각도로 진행했으며, 이진 분류에서는 0.88의 가중 F1를 달성해 기존 베이스라인(0.53) 대비 현저히 높은 정확도를 보였다. 다중 분류에서는 크라우드소싱 데이터에서 0.68, 온라인 상담 데이터에서 0.45의 가중 F1를 기록했는데, 후자는 데이터 규모와 텍스트 길이, 그리고 치료 상황 특유의 은유·암시적 표현이 많아 모델이 포착하기 어려운 점이 원인으로 분석된다.

특히, 라벨별 중요 단어·구절을 SHAP값과 LIME을 통해 시각화함으로써, ‘전부 아니면 전무’는 “항상”, “절대”와 같은 절대어가, ‘과잉 일반화’는 “모두”, “항상 그렇다” 등이 핵심 특징으로 작용함을 확인했다. 이러한 설명 가능성은 치료사가 자동화 도구를 신뢰하고 환자와의 대화에 활용하는 데 중요한 근거가 된다.

비지도 분석으로는 TF‑IDF 기반 K‑means 클러스터링과 LDA 토픽 모델링을 수행했으며, 결과적으로 일부 왜곡이 의미적으로 겹치는 군집을 형성함을 발견했다. 예를 들어, ‘흑백 사고’와 ‘전부 아니면 전무’가 동일 클러스터에 속해, 실제 임상에서는 이 두 왜곡이 동시에 나타나는 경우가 빈번함을 시사한다. 이는 기존 진단 매뉴얼에서 구분된 카테고리를 재검토하고, 통합적 치료 전략을 설계하는 데 데이터‑드리븐 근거를 제공한다.

실제 임상 적용 시에는 개인정보 보호, 모델 편향, 오탐지에 따른 부정적 심리 효과 등 윤리적·법적 문제가 대두된다. 연구진은 데이터 익명화, 사전 동의 절차, 모델 결과에 대한 인간 전문가 검증 단계 도입 등을 권고했으며, 자동화 도구는 ‘보조’ 역할에 머물러야 함을 강조했다.

전반적으로 본 논문은 인지 왜곡 자동 탐지 분야에서 최초에 대규모 한국어 데이터와 최신 트랜스포머 모델을 적용했으며, 성능 향상뿐 아니라 설명 가능성, 왜곡 간 관계 탐색, 실무 적용 시 고려사항까지 포괄적으로 다룬 점이 의의이다. 향후 연구에서는 멀티모달(텍스트 + 음성) 데이터, 지속적 학습(continual learning) 기법, 그리고 환자 맞춤형 피드백 시스템 구축을 통해 치료 효율성을 더욱 높일 수 있을 것으로 기대된다.

인지 왜곡 자동 탐지 및 분류 모델

초록

상세 분석

댓글 및 학술 토론

의견 남기기