감정 엔트로피 기반 온라인 대화 모델

감정 엔트로피 기반 온라인 대화 모델

초록

본 논문은 IRC 채팅 데이터를 감정 라벨링하여 대화의 감정 분포 엔트로피가 증가하는 현상을 발견하고, 이를 대화 길이의 파워‑law 분포와 연결한다. 엔트로피 성장 규칙을 기반으로 시뮬레이션을 수행해 실제 데이터와 높은 일치를 보였으며, 엔트로피 조절을 통해 인위적으로 대화 지속 시간을 연장하는 방법을 제안한다.

상세 분석

이 연구는 먼저 대규모 IRC 로그에 감정 어노테이션을 적용해 각 발화가 긍정, 부정, 중립 중 하나로 분류되었다. 시간 순서대로 감정 라벨을 집계하면, 대화가 진행될수록 감정 종류별 확률분포가 점점 평탄해지는 경향을 보였으며, 이는 샤논 엔트로피가 지속적으로 증가함을 의미한다. 저자들은 이러한 엔트로피 증가가 대화 참여자들의 감정 상태가 다양화되는 메커니즘이라고 가정하고, 엔트로피가 일정 임계값에 도달하면 대화가 자연스럽게 종료된다는 가설을 세웠다. 이를 수학적으로 표현하기 위해 감정 확률벡터 p(t) 에 대한 엔트로피 H(t)=−∑p_i(t)log p_i(t) 를 정의하고, 매 발화마다 감정 전이 확률을 기반으로 p(t) 를 업데이트한다. 전이 확률 행렬은 실제 데이터에서 추정된 마코프 체인 형태이며, 감정 전이는 이전 발화의 감정에 따라 일정 확률로 변한다. 시뮬레이션에서는 초기 엔트로피를 낮게 설정하고, 매 단계마다 감정 전이를 수행하면서 H(t) 를 계산한다. 대화 종료 조건은 H(t) 가 사전에 정의된 임계값 H_c 를 초과하거나, 연속 k 단계 동안 엔트로피 변화가 미미할 경우로 설정하였다. 결과적으로 시뮬레이션된 대화 길이 분포는 실제 IRC 대화에서 관찰된 파워‑law 꼬리를 잘 재현했으며, 특히 α≈1.5 ~ 2.0 범위의 지수값을 얻었다. 또한, 인위적으로 엔트로피 증가 속도를 조절하면 대화 지속 시간을 연장하거나 단축할 수 있음을 확인했다. 이는 엔트로피가 대화 흐름을 제어하는 핵심 변수임을 실증적으로 뒷받침한다. 논문은 마지막으로 엔트로피 기반 조절 메커니즘을 채팅봇이나 온라인 토론 플랫폼에 적용해 사용자의 참여도를 높이는 실용적 방안을 제시한다.