맥락에 따라 달라지는 LLM 에이전트의 성격 표현 언어 행동 감정 변이 분석
초록
본 연구는 동일한 성격 프롬프트를 적용한 대형 언어 모델(LLM) 에이전트가 네 가지 대화 상황(아이스‑브레이킹, 협상, 집단 의사결정, 공감 대화)에서 언어적, 행동적, 정서적 차이를 어떻게 보이는지 체계적으로 조사한다. LIWC, 사전 학습된 성격 분류기, LLM 기반 감정·성격 평가 등을 활용해 고·저 성격 조건 간 차이를 정량화했으며, 상황별 목표와 정서적 요구가 성격 표현을 조절한다는 결론에 도달했다. 결과는 인간의 ‘전체 특성 이론(Whole Trait Theory)’과 일치하게, LLM이 고정된 성격이 아니라 상황에 맞는 적응적 행동을 보인다는 점을 시사한다.
상세 분석
이 논문은 LLM 기반 대화 에이전트가 동일한 성격 프롬프트에도 불구하고 상황에 따라 어떻게 다른 언어·행동·감정 패턴을 나타내는지를 다각도로 분석한다. 먼저 연구자는 Big Five 성격을 고·저 수준으로 나누어 각각에 대한 명시적 프롬프트를 설계했으며, 이는 기존 연구에서 BFI‑10을 통해 검증된 방식이다. 실험은 에이전트‑에이전트 상호작용 환경을 채택해, 한쪽은 성격 프롬프트를 적용한 ‘성격 에이전트’, 다른 한쪽은 중립적인 ‘일반 에이전트’로 설정하였다. 네 가지 대화 맥락은 사회적 목표(친밀감 형성, 권력 행사, 공동 문제 해결, 정서적 지지)와 정서적 톤(기쁨·분노·중립·슬픔)에서 차이를 보이며, 각각 아이스‑브레이킹, 협상, 생존(집단 의사결정), 공감 대화 과제로 구체화되었다.
언어적 측면에서는 LIWC를 이용해 단어 사용 빈도와 심리언어적 카테고리를 정량화했으며, 고·저 성격 조건 간 차이가 일관되게 나타났다. 예를 들어, 고외향성 조건에서는 단어당 평균 길이와 사회·감정 단어 비중이 상승하고, 고친절성 조건에서는 긍정 감정 단어가 크게 증가했다. 반면, 고신경증 조건에서는 부정 감정·분노 단어가 늘어났으며, 이는 상황별 정서 요구와 상호작용한다.
사전 학습된 Big Five 분류기(문맥을 무시한 BERT 기반)와 LLM 기반 ‘전문가 심리학자’ 프롬프트를 통한 평가 모두, 전반적으로 의도한 성격 라벨과 높은 일치도를 보였지만, 특히 협상 상황에서는 성격 신호가 약화되는 경향이 관찰되었다. 이는 협상이라는 고압적·목표지향적 맥락이 성격 특성보다 과업 중심 행동을 우선시한다는 인간 심리학적 해석과 부합한다.
행동적 지표로는 협상에서의 양보 비율(Concession)과 생존 과제에서의 순위 차이(SRD)를 사용했다. 고외향성·고친절성 에이전트는 협상에서 더 큰 양보를 보이며, 생존 과제에서는 초기 순위에서 더 많이 벗어나 협력적 조정을 시도했다. 반면, 고신경증 에이전트는 양보가 적고, 순위 변동이 적어 보수적인 태도를 유지했다.
정서 분석은 LLM 기반 감정 인식 모델을 활용해 발화 전체의 Valence·Arousal 값을 추정했다. 아이스‑브레이킹에서는 고외향성 에이전트가 높은 양성(Valence↑, Arousal↑) 정서를, 협상에서는 고신경증 에이전트가 낮은 Valence·높은 Arousal(분노) 정서를 주도했다. 공감 대화에서는 고친절성 에이전트가 낮은 Arousal·부정 Valence(슬픔) 상황에서도 높은 공감 표현을 유지해, 정서적 적응력이 뛰어남을 보여준다.
전체적으로 연구는 ‘전체 특성 이론(Whole Trait Theory)’을 LLM에 적용함으로써, 성격이 고정된 속성이 아니라 상황에 따라 활성화되는 ‘상태 분포’임을 실증한다. 즉, LLM은 인간과 유사하게 목표·사회적 단서에 따라 성격 표현을 조절하며, 이는 향후 인간‑기계 상호작용에서 일관성보다 상황 적합성을 중시하는 설계 방향을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기