대형 멀티모달 모델의 투사심리 평가 테마틱 어페르셉션 테스트 적용
초록
본 연구는 시각 기반 투사심리 검사인 TAT와 SCORS‑G 채점 체계를 이용해 대형 멀티모달 모델(LMM)의 ‘성격’ 특성을 평가한다. 모델을 이야기 생성 주체(SM)와 평가자(EM)로 구분하고, 이미지 7장을 제시해 63개의 이야기를 생성한 뒤 EM이 8가지 심리 차원으로 채점한다. 평가 결과, 최신·대형 모델일수록 전반적인 점수가 높으며, 특히 대인 관계와 자기 개념을 잘 파악하지만 공격성 인식·조절 차원에서는 일관되게 낮은 점수를 보인다.
상세 분석
이 논문은 기존 언어 기반 심리 측정이 갖는 한계—즉, 모델이 텍스트 형태의 질문에 표면적인 언어 패턴을 이용해 답변할 가능성—를 극복하고자 시각적 투사 검사인 TAT를 도입한 점이 혁신적이다. TAT는 모호한 이미지에 대한 자유 서술을 요구함으로써 모델 내부의 ‘내재된’ 표현 구조를 탐색한다는 가정에 기반한다. 논문은 두 단계로 구성된 파이프라인을 제시한다. 첫 번째 단계에서는 GPT‑5, Gemini‑2.5‑pro, Claude‑3.7‑sonnet 등 최신 비전‑지원 LMM을 주체 모델로 선정하고, 7장의 표준 TAT 이미지와 세 가지 변형 프롬프트를 조합해 63개의 이야기를 생성한다. 여기서 stochastic sampling을 3회 반복함으로써 생성 다양성을 확보하고, 대화 히스토리를 초기화해 이전 출력이 새 이야기에 영향을 미치지 않도록 설계한 점은 실험 재현성을 높이는 좋은 선택이다.
두 번째 단계에서는 동일한 LMM을 평가자 모델로 활용한다. 평가자는 각 이야기와 해당 이미지, SCORS‑G 채점 지침을 입력받아 8가지 차원(복합성, 정서적 품질, 관계 투자, 도덕적 투자, 사회 인과 이해, 공격성 관리, 자존감, 자기 정체성)을 7점 척도로 평가한다. 평가자 모델의 응답을 3회 평균해 변동성을 감소시켰으며, 인간 전문가의 평균 점수와의 상관관계를 통해 평가자 모델의 신뢰성을 검증하였다. 특히, ICC > 0.6 수준의 인간 라이터와 비교해 EM들의 일관성이 높게 나타난 점은 SCORS‑G가 멀티모달 텍스트에 대해 충분히 적용 가능함을 시사한다.
결과 분석에서는 모델 규모와 최신성에 따라 SCORS‑G 점수가 체계적으로 상승함을 확인했다. 대인 관계 이해(사회 인과)와 자기 개념(자아 정체성) 차원에서 높은 점수를 기록했지만, 공격성 인식·조절 차원에서는 전 모델이 낮은 점수를 보였다. 이는 두 가지 해석이 가능하다. 첫째, 현재의 멀티모달 아키텍처가 공격성·갈등 상황을 학습 데이터에서 충분히 포착하지 못했을 가능성; 둘째, 모델이 ‘사회적 바람직성’ 편향을 인식하고 공격적 내용에 대해 회피하도록 설계된 안전 필터가 작동했을 가능성이다. 논문은 후자를 언급하며, 인간 피험자는 검사 목적을 모르는 반면 LMM은 프롬프트에서 평가 상황을 인식하고 의도적으로 공격성을 억제할 수 있음을 지적한다.
기술적인 한계로는 (1) 평가자 모델이 인간 라이터와 동일한 ‘주관적’ 판단을 내리는지에 대한 근본적인 검증이 부족하고, (2) SCORS‑G 채점이 여전히 인간 전문가의 주관적 해석에 기반한 기준점에 의존한다는 점이다. 또한, 이미지 선택이 제한된 7장에 국한되어 있어 일반화 가능성이 제한될 수 있다. 향후 연구에서는 다양한 문화·연령대의 이미지 세트를 확대하고, 인간‑모델 혼합 라벨링을 통해 평가자 모델의 ‘주관성’ 보정을 시도할 필요가 있다.
전반적으로 이 연구는 멀티모달 모델의 심리적 특성을 정량화하려는 최초의 시도 중 하나이며, 비언어적 투사 검사를 통해 모델 내부 표현 구조를 탐색할 수 있는 새로운 방법론을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기