치료사처럼 하지만 아니다 레딧 AI 정신건강 이야기
초록
본 연구는 47개의 정신건강 서브레딧에서 5,126개의 게시물을 분석해, 사용자가 LLM 기반 AI를 감정 지원 및 치료 도구로 어떻게 평가하고 관계를 형성하는지를 조사한다. 기술수용모델(TAM)과 치료동맹 이론을 결합한 주석 체계를 구축하고, LLM‑인간 하이브리드 파이프라인으로 감정, 태도, 과업·목표·유대 정렬을 대규모로 측정한다. 결과는 결과와 신뢰, 응답 품질이 지속적 참여를 좌우하며, 감정적 유대만으로는 긍정적 감정이 충분히 설명되지 않음을 보여준다.
상세 분석
이 논문은 두 가지 이론적 프레임워크, 즉 기술수용모델(TAM)과 치료동맹 이론을 융합해 AI‑기반 정신건강 지원에 대한 사용자 평가를 정량화한다. TAM의 핵심 변수(유용성, 사용 용이성, 신뢰, 위험 인식 등)와 치료동맹의 세 축(과업, 목표, 유대)을 각각 13개의 주석 차원으로 세분화하고, 각 차원을 범주형 라벨과 자유 텍스트 설명으로 코딩한다. 데이터 수집 단계에서는 4.7 백만 건의 레딧 게시물을 키워드 필터링 후 LLM(GPT‑4o mini)으로 2차 검증을 거쳐 5,126개의 경험·탐색 게시물을 최종 선정하였다. 인간 주석자와 LLM을 활용한 자동 주석 과정에서 Cohen’s κ가 0.37–0.60, Gwet’s AC1이 0.64–0.94에 달해 라벨 일관성을 확보하였다. 분석 결과, ‘결과 실현성(긍정적 변화)’과 ‘신뢰’, ‘응답 품질’이 긍정적 감정 및 지속 사용 의도와 가장 높은 상관관계를 보였으며, ‘유대’ 차원은 감정적 연결을 제공하지만 단독으로는 긍정적 결과를 예측하지 못했다. 특히, AI를 ‘동반자’로 활용하는 경우 과업·목표 정렬이 부족하고, 의존성·증상 악화 위험이 보고되는 등 정렬 불일치가 부정적 결과와 연관됨을 확인했다. 이러한 발견은 AI 설계 시 기능적 정확성·신뢰성 강화와 사용자의 치료 목표와의 명확한 정렬이 필요함을 시사한다.
댓글 및 학술 토론
Loading comments...
의견 남기기