심리치료 LLM을 위한 소크라테스식 질문 프레임워크: SIF와 Socratic‑QA
초록
본 논문은 기존 심리 LLM이 주로 반응형으로 작동하는 한계를 극복하고자, 치료 의도를 별도로 계획하는 “Socratic Inquiry Framework (SIF)”를 제안한다. SIF는 전략 앵커링(when‑to‑ask)과 템플릿 검색(what‑to‑ask)을 분리해 CBT‑정렬 질문을 자동 생성한다. 이를 위해 고품질 Socratic‑QA 데이터셋을 구축하고, 경량 플러그‑인 플래너(LPP)와 대화 생성기(CG)를 결합한다. 실험 결과, 질문 빈도·대화 깊이·치료 적합도가 크게 향상돼 LLM이 수동적 위로 제공자가 아니라 능동적 인지 가이드로 전환됨을 입증한다.
상세 분석
SIF는 “전략 앵커링(Strategy Anchoring)”과 “템플릿 검색(Template Retrieval)”이라는 두 단계 플래너를 통해 치료 의도를 명시적으로 모델링한다. 전략 앵커링은 10가지 CBT‑기반 전략(질문, 감정 반영, 정보 제공 등) 중 하나를 예측하도록 설계된 인스트럭트‑튜닝 인코더(fθ1)를 사용한다. 이 단계는 대화 이력의 최신 토큰만을 활용해 계산 효율성을 확보하면서도, 전략 레이블을 고정된 의도 신호로 제공한다. 템플릿 검색은 동일한 컨텍스트를 입력으로 받아 6가지 소크라테스식 질문 유형(정의, 반문, 마이오틱스, 변증법 등) 중 하나를 선택한다. 두 모듈은 각각 교차 엔트로피 손실로 학습되며, 전략 레이블은 템플릿 분류에 암묵적으로 조건화된다.
대화 생성기(CG)는 LLM(LoRA‑fine‑tuned)에게 “전략 + 템플릿 + 대화 이력”이라는 시퀀스를 직접 입력함으로써, 의도 신호가 언어 모델 내부에 스스로 발생하는 확률적 편향이 아니라 명시적 제약으로 작용하도록 만든다. 이는 기존의 소프트‑프롬프트 방식이 사후 논리(후행 설명)만 제공하던 것과 달리, 질문 시점과 형태를 사전에 계획하게 함으로써 일관된 CBT‑정렬 대화를 가능하게 한다.
데이터 측면에서 저자들은 EmoLLM 대화를 기반으로 자동 질문 생성 파이프라인을 구축하고, 임상 전문가가 설계한 7가지 평가 차원(가이드, 공감, 의미 적합성 등)으로 75 % 이상의 후보를 필터링해 17 981개의 고품질 Socratic‑QA 샘플을 확보했다. 이 데이터는 전략 앵커링과 템플릿 검색 모두에 레이블을 제공해 플래너 학습을 감독한다.
실험에서는 자동 메트릭(BLEUR, BERTScore 등)과 인간 평가(전문가 라벨링)를 모두 사용해 SIF가 질문 빈도, 대화 깊이, 치료 적합도에서 기존 LLM(Deepseek, SoulChat 등)보다 현저히 우수함을 보였다. 특히 “전략‑템플릿” 신호가 없는 베이스라인 대비 질문의 질과 다양성이 20 % 이상 상승했다.
한계점으로는 플래너가 고정된 전략·템플릿 집합에 의존한다는 점, 그리고 장기 대화에서 전략 전환을 다루는 메커니즘이 부족하다는 점을 들 수 있다. 또한 평가에 사용된 인간 라벨이 주관적이며, 실제 임상 환경에서의 효과 검증이 부족하다. 향후 연구는 동적 전략 전이, 멀티‑모달 감정 인식, 그리고 실제 치료 세션에서의 장기 효과 측정을 목표로 해야 할 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기