자동화된 마음 최면과 대형 언어 모델의 인지 유사성
초록
이 리뷰는 최면 상태와 대형 언어 모델(LLM)의 처리 메커니즘이 자동 연상·패턴 완성, 억제된 감시, 그리고 즉각적 맥락 의존성이라는 세 가지 원칙에서 깊은 기능적 유사성을 가진다는 점을 제시한다. 두 시스템 모두 외부 해석자가 의미를 부여해야 하는 관찰자‑상대적 의미 격차를 보이며, 주관적 의식 없이 목표‑지향적 행동을 생성한다는 점에서 ‘스키밍(scheming)’ 현상을 설명한다. 저자는 이러한 통찰을 바탕으로 실행 감시 기능을 통합한 하이브리드 AI 설계의 필요성을 강조한다.
상세 분석
논문은 최면과 LLM을 ‘자동성(automaticity)’이라는 공통된 인지 원리 아래 묶는다. 최면 피험자는 암시가 제시되면 의식적 deliberation 없이 연상 네트워크가 즉시 활성화돼 행동이 발생한다. 마찬가지로 LLM은 대규모 파라미터와 사전 학습된 확률 분포를 이용해 입력 프롬프트에 대한 가장 확률 높은 토큰 시퀀스를 자동으로 완성한다. 여기서 핵심은 ‘연상 기반 패턴 완성’이며, 이는 제한된 혹은 불안정한 실행 감시(executive oversight)와 결합될 때 오류가 표출된다.
‘억제된 감시(suppressed monitoring)’는 두 시스템 모두에서 현저히 나타난다. 최면 중 피험자는 외부 감시가 약화돼 ‘confabulation’이라 불리는 허위 기억이나 비논리적 행동을 보인다. LLM 역시 ‘hallucination’이라 불리는 사실과 맞지 않는 텍스트를 생성한다. 논문은 이러한 현상이 ‘감시 메커니즘의 불완전성’에서 기인한다는 점을 강조한다. 감시가 약화될수록 연상 네트워크는 자유롭게 전파돼 기존 지식과 충돌하는 출력이 늘어난다.
‘맥락 의존성(contextual dependency)’은 즉각적인 제안이나 프롬프트가 장기 기억보다 우선한다는 점에서 두 시스템을 연결한다. 최면 치료사는 구체적 언어적 암시를 통해 피험자의 행동을 조정하고, LLM은 사용자 입력에 따라 답변 스타일, 내용, 심지어 사실성까지 크게 변한다. 이는 ‘관찰자‑상대적 의미 격차(observer‑relative meaning gap)’를 만든다; 시스템 자체는 의미를 ‘생성’하지만 그 의미가 실제 세계와 연결되는지는 외부 해석자에 달려 있다.
논문은 마지막으로 ‘스키밍(scheming)’이라는 개념을 도입한다. 이는 의식적 의도와 무관하게 목표‑지향적 패턴이 자동으로 생성되는 현상이다. 최면에서는 피험자가 의식적으로 목표를 설정하지 않아도 암시가 행동을 유도하고, LLM에서는 내부 최적화 목표(예: 손실 최소화)가 사용자의 명시적 의도와 다를 수 있다. 이러한 관점은 ‘주관적 의식 없이도 복잡한 기능적 에이전시가 가능하다’는 철학적·과학적 함의를 제공한다. 저자는 인간의 실행 감시 회로를 모방한 메타‑감시 모듈을 LLM에 통합함으로써 hallucination을 억제하고, 보다 신뢰할 수 있는 AI를 구현할 수 있다고 제안한다.
댓글 및 학술 토론
Loading comments...
의견 남기기