대화 파트너 예측 가능성 연구
초록
본 논문은 사무실 내 적외선 센서가 기록한 대면 대화 데이터를 이용해 개인별 대화 파트너 순서의 예측 가능성을 정보 이론적 방법으로 정량화한다. 현재 대화 상대만 알면 다음 상대를 예측할 수 있는 정보량이 평균 28.4% 감소한다는 결과를 제시한다. 예측 가능성은 대화 간 간격의 장기 꼬리 분포(버스트성)와 개인의 네트워크 내 위치(커뮤니티 내부 vs. 브리지)와 연관된다.
상세 분석
이 연구는 두 개의 일본 기업 사무실에서 수집한 적외선 기반 얼굴‑대면 인터랙션 로그를 활용한다. 각 참가자는 적외선 모듈이 부착된 명찰을 착용하고, 3 m 이내 120° 앞쪽에 있는 다른 명찰과 1 분 이상 신호를 교환하면 대화 이벤트가 기록된다. 데이터셋 D1(N=163, 73일)과 D2(N=211, 120일)에는 각각 51 879건·125 345건의 대화가 포함된다. 연구자는 대화의 시간적 순서를 무시하고, 각 개인에 대해 “파트너 시퀀스”(시간 순서대로 등장한 대화 상대 ID)의 엔트로피를 세 단계로 정의한다.
- 무작위 엔트로피 H₀는 파트너 수 kᵢ에 대한 로그2(kᵢ)로, 모든 파트너를 동등하게 선택했을 때의 불확실성을 나타낸다.
- 비상관 엔트로피 H₁는 실제 파트너 선택 확률 Pᵢ(j) 를 사용해 –∑₍j∈Nᵢ₎ Pᵢ(j) log₂ Pᵢ(j) 로 계산된다. 이는 파트너 선호도가 반영된 엔트로피이며, H₁ ≤ H₀가 항상 성립한다.
- 조건부 엔트로피 H₂는 현재 파트너 j 이후에 선택되는 다음 파트너 ℓ의 조건부 확률 Pᵢ(ℓ|j)를 이용해 –∑ⱼ∈Nᵢ Pᵢ(j) ∑ₗ∈Nᵢ Pᵢ(ℓ|j) log₂ Pᵢ(ℓ|j) 로 정의한다.
이 세 엔트로피 사이의 차이 상호 정보 Iᵢ = H₁ – H₂는 현재 파트너를 알 때 다음 파트너를 예측할 수 있는 정보량을 의미한다. Iᵢ가 0이면 현재 파트너가 다음 파트너에 전혀 영향을 주지 않는 것이고, Iᵢ가 H₁에 가까우면 완전 결정적이다.
연구 결과, 모든 개인에 대해 Iᵢ > 0이며 평균적으로 H₂가 H₁보다 28.4% 감소한다. 이는 대화 파트너 선택이 완전히 무작위가 아니라 일정한 규칙성을 가진다는 증거이다. 그러나 이 예측 가능성의 대부분은 버스트성(burstiness), 즉 대화 간 인터벌이 파워‑law 형태의 장기 꼬리 분포를 보이는 현상에 기인한다. 각 파트너 쌍별 인터벌을 무작위로 섞는 부트스트랩 실험에서 Iᵢ의 약 79.5%가 보존되었으며, 이는 버스트성이 Iᵢ에 크게 기여함을 보여준다.
버스트성을 제거하기 위해 동일 파트너와의 연속 대화를 하나의 이벤트로 합치는 “병합” 절차를 적용했을 때도 Iᵢ는 여전히 양의 값을 유지한다(평균 I_merge ≈ 0.12 bit). 이는 버스트 외에도 구조적 요인이 예측 가능성에 작용함을 의미한다.
구조적 요인 분석에서는 전체 대화 네트워크(정적 그래프)에서 각 개인의 클러스터링 계수와 **강한 연결(가중치 상위 5%)**을 이용해 커뮤니티 내부에 위치한 사람과 여러 커뮤니티를 연결하는 브리지 역할을 하는 사람을 구분한다. 결과적으로, 높은 클러스터링과 다수의 삼각형에 둘러싸인 개인은 Iᵢ가 낮아 예측이 어려운 반면, 브리지 역할을 하는 개인은 Iᵢ가 높아 다음 파트너를 보다 잘 예측할 수 있었다. 이는 사회적 역할이 대화 흐름의 순차적 구조에 영향을 미친다는 중요한 통찰을 제공한다.
마지막으로, 데이터 크기가 작을 경우 엔트로피 추정에 편향이 발생할 수 있음을 인지하고, 100회 이상의 부트스트랩을 통해 통계적 유의성을 검증하였다. 모든 실험에서 Iᵢ는 1% 수준에서 무작위 시퀀스보다 유의하게 큰 값을 보였다.
요약하면, 대화 파트너 선택은 (1) 버스트성에 의해 강하게 결정되고, (2) 개인의 네트워크 위치에 따라 추가적인 예측 가능성이 존재한다는 두 가지 메커니즘이 복합적으로 작용한다는 결론에 도달한다.
댓글 및 학술 토론
Loading comments...
의견 남기기