네트워크 인플루언스 다이어그램으로 보는 에이전트 사고와 의사결정

네트워크 인플루언스 다이어그램으로 보는 에이전트 사고와 의사결정

초록

본 논문은 에이전트의 신념과 의사결정 과정을 모델링하기 위한 그래픽 언어인 네트워크 인플루언스 다이어그램(NID)을 제안한다. NID는 각 에이전트의 정신모델을 노드로 표현하고, 이들 노드가 서로의 모델을 참조함으로써 복잡한 상호신념 구조와 제한된 합리성을 포착한다. 베이지안 게임과 동등한 표현력을 가지면서도 구조적 압축을 제공하며, 실제 실험에서 사전 지식이 없는 상대를 모델링하는 상황에서 기존 방법보다 우수한 성능을 보였다.

상세 분석

NID는 기존 베이지안 게임의 확장형으로, 게임 이론에서 요구되는 전략 공간을 그래프 형태로 시각화한다는 점에서 혁신적이다. 각 노드는 ‘정신모델’이라는 개념을 도입해, 에이전트가 다른 에이전트의 의사결정 과정을 어떻게 인식하고 예측하는지를 명시한다. 이때 정신모델은 또 다른 정신모델을 참조할 수 있어, 재귀적 신념 구조(예: “그가 내가 그를 속일 것이라고 생각한다”)를 자연스럽게 표현한다. 이러한 재귀적 연결은 전통적인 베이지안 게임에서는 차원 폭이 급격히 증가해 표현이 비효율적인 반면, NID는 그래프의 연결성만으로 동일 정보를 압축한다.

또한 NID는 ‘제한된 합리성(bounded rationality)’을 모델링할 수 있다. 예를 들어, 특정 노드에 계산 비용이나 인지 제한을 부여함으로써 에이전트가 최적 전략 대신 휴리스틱 기반 전략을 선택하도록 설계할 수 있다. 이는 실제 인간이나 제한된 AI 에이전트의 행동을 보다 현실적으로 모사한다는 장점을 제공한다.

논문은 NID의 균형 개념을 두 단계로 구분한다. 첫 단계는 ‘전략 균형’으로, 각 에이전트가 자신의 정신모델에 기반해 최적 전략을 계산하는 상황을 정의한다. 두 번째 단계는 ‘행동 균형’으로, 실제 실행되는 행동이 전략 균형과 일치하지 않을 수 있음을 인정한다. 이 구분은 기존 게임 이론에서 전략과 실제 행동을 동일시하는 한계를 극복하고, 행동 데이터와 모델 예측 사이의 차이를 정량화할 수 있게 한다.

실험 부분에서는 상대방 모델링이 필요한 경쟁 게임에서 NID 기반 에이전트를 적용하였다. 사전 지식이 전혀 없는 상황에서도 NID는 상대의 행동 패턴을 빠르게 추정하고, 이에 맞는 전략을 동적으로 조정함으로써 기존 고정 전략 에이전트보다 높은 승률을 기록했다. 이는 NID가 복잡한 다중 에이전트 환경에서 실시간 적응과 예측에 유리함을 실증한다.

전체적으로 NID는 표현력, 압축성, 그리고 제한된 합리성 모델링이라는 세 축에서 기존 베이지안 게임 및 인플루언스 다이어그램을 능가한다. 다만, 그래프 구조가 복잡해질 경우 노드 간 순환 참조를 처리하기 위한 계산 비용이 증가할 수 있으며, 이를 해결하기 위한 효율적인 알고리즘 설계가 향후 연구 과제로 남는다.