인간 전략 행동의 결정론적 규칙 탐색

인간 전략 행동의 결정론적 규칙 탐색

초록

이 논문은 실험경제학과 데이터 마이닝을 결합해 인간 피험자들의 전략적 선택에서 결정론적 패턴을 추출한다. 기존 게임이론이 경험이 풍부한 참가자에게만 부분적으로 맞는 한계를 지적하고, 심리학적 가정 없이 순수 데이터 기반 규칙을 찾는 방법을 제시한다. 반복된 혼합 전략 제로섬 게임과 반복된 최후통첩 게임 두 데이터셋을 분석해, 인간이 무작위 혼합 전략을 따르지 않고 일정한 결정론적 규칙을 보임을 확인한다.

상세 분석

본 연구는 인간의 전략적 행동을 설명하기 위해 전통적인 게임이론이 제시하는 내쉬균형과 같은 확률적 혼합전략 모델을 비판적으로 검토한다. 특히, 실험 참가자들이 충분한 훈련이나 경험이 없을 경우, 이론적 균형이 실제 선택과 크게 괴리된다는 점을 여러 선행 연구에서 보고했음에도 불구하고, 대부분의 모델은 여전히 심리학적 전제에 의존하거나 사후 검증을 통해 ‘설명된’다고 주장한다. 저자는 이러한 접근법의 한계를 극복하고자, 인간 행동을 ‘결정론적’이라고 가정하고, 어떠한 심리학적 편향도 사전 가정하지 않은 순수 데이터 마이닝 절차를 설계하였다.

데이터 전처리 단계에서는 각 실험 라운드에서 피험자가 선택한 행동을 시간 순서대로 정렬하고, 이전 라운드의 선택과 상대방의 반응을 특징 벡터로 변환하였다. 이후 의사결정 트리, 규칙 기반 학습기, 그리고 빈도 기반 연관 규칙 마이닝 기법을 적용해, 특정 상황에서 반복적으로 나타나는 행동 규칙을 자동으로 추출했다. 특히, 의사결정 트리 모델은 과적합을 방지하기 위해 사전 가지치기와 교차 검증을 수행했으며, 최종 규칙 집합은 인간이 직관적으로 활용할 수 있는 형태(예: “상대가 최근 2번 협상을 거부했을 때, 다음 라운드에 높은 제안을 한다”)로 변환되었다.

첫 번째 데이터셋은 반복된 혼합 전략 제로섬 게임으로, 이론적으로는 각 라운드마다 50% 확률로 선택이 무작위화되어야 하지만, 마이닝 결과는 피험자들이 ‘상대의 최근 행동에 따라 보상 기대치를 조정하는’ 결정론적 패턴을 보임을 밝혔다. 예를 들어, 상대가 연속으로 특정 전략을 사용하면 피험자는 그 전략을 회피하거나 반대로 동일 전략을 선택하는 경향이 발견되었다.

두 번째 데이터셋은 반복된 최후통첩 게임으로, 전통적인 경제학 모델은 제안자가 최소한의 금액을 제시하고 수락자는 이를 받아들이는 것이 합리적이라고 본다. 그러나 마이닝 결과는 제안자가 ‘상대가 이전에 거절한 제안 수준보다 약간 높은 금액을 제시’하고, 수락자는 ‘제안이 일정 수준 이하이면 거절, 그 이상이면 수락’하는 규칙을 따르는 것으로 나타났다. 이는 인간이 공정성, 보복, 그리고 기대 보상 등을 복합적으로 고려한다는 점을 데이터 기반으로 확인한 것이다.

전체적으로, 이 연구는 인간 전략 행동이 완전한 확률 혼합이 아니라, 과거 경험과 상대의 행동에 기반한 결정론적 규칙에 의해 크게 좌우된다는 중요한 통찰을 제공한다. 또한, 심리학적 가설 없이도 데이터 마이닝을 통해 의미 있는 행동 규칙을 도출할 수 있음을 실증적으로 입증하였다. 이러한 접근은 향후 인간-컴퓨터 상호작용, 자동 협상 시스템, 그리고 행동 경제학 모델링에 새로운 방법론적 토대를 제공한다.