LLM 기반 다중에이전트 협력 붕괴 방지를 위한 명성 네트워크 RepuNet

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 대형 언어 모델(LLM) 기반 다중에이전트 시스템에서 발생하는 협력 붕괴 현상을 명성 시스템으로 해결하고자 한다. 제안된 RepuNet은 에이전트 수준의 명성 업데이트와 시스템 수준의 네트워크 재구성을 동시에 다루는 이중‑레벨 프레임워크이며, 직접 상호작용과 간접적인 가십을 통해 명성을 형성·갱신한다. 세 가지 사회적 딜레마 시나리오(감옥 딜레마, 자발적 참여, 투자 거래)에서 RepuNet을 적용한 결과, 협력이 지속되고 탐욕적·불성실한 에이전트는 네트워크에서 고립되는 등 풍부한 집단 행동이 나타났다. 실험 결과와 소거 연구를 통해 각 모듈의 기여도가 입증되었다.

상세 분석

RepuNet은 기존의 명성 기반 협력 촉진 메커니즘을 LLM 기반 에이전트에 맞게 재구성한 점이 가장 큰 혁신이다. 먼저 에이전트‑레벨에서는 직접 만남 후 ‘ShapeRepuPeer’ 프롬프트를 이용해 피어 명성을 생성·갱신하고, 자기‑명성도 동시에 업데이트한다. 이는 전통적인 수식 기반 명성 모델을 LLM의 자연어 생성 능력에 의존하도록 바꿈으로써, 인간과 유사한 정성적 평가를 가능하게 한다. 두 번째 시스템‑레벨에서는 명성 점수에 따라 네트워크 엣지를 유지·추가·삭제한다. 고명성 에이전트와는 연결을 강화하고, 저명성·불성실 에이전트는 차단함으로써 ‘네트워크 재배선’이 자동으로 이루어진다. 이러한 이중‑레벨 설계는 직접 상호작용과 가십(긍정·부정) 두 경로를 동시에 활용해 정보 확산 속도를 높이고, 명성의 최신성을 보장한다.

실험은 세 가지 점진적 난이도 시나리오에서 진행되었다. 감옥 딜레마에서는 단일 결함 후 연쇄적 배신이 발생하는데, RepuNet을 적용하면 에이전트가 상대의 명성을 고려해 협력을 선택하고, 반복적인 가십을 통해 부정적 행동이 빠르게 식별된다. 자발적 참여 시뮬레이션에서는 공동 자원 고갈을 방지하기 위해 고명성 에이전트가 자원을 지속적으로 공유하고, 저명성 에이전트는 네트워크에서 격리된다. 투자 거래 게임에서는 신뢰 기반 투자 라운드가 명성에 의해 조절되어, 장기적인 수익률이 크게 향상된다.

소거 연구에서는 (1) 가십 모듈 제거, (2) 네트워크 재배선 비활성화, (3) 자기‑명성 업데이트 제외 등 각각을 제외했을 때 협력 비율이 급격히 감소하고, 경우에 따라 완전 붕괴가 발생함을 확인했다. 이는 RepuNet의 각 구성 요소가 상호 보완적으로 작동한다는 증거이다.

한계점으로는 현재 구현이 프롬프트 설계와 LLM 호출 비용에 크게 의존한다는 점, 그리고 명성 점수 μ를 -1~1 범위로 단순화함으로써 복합적인 신뢰 요인을 충분히 포착하지 못할 가능성이 있다. 또한, 가십이 주로 긍정적 내용에 치우치는 현상이 인간 사회와 차이를 보이며, 이는 LLM의 사전 학습 데이터 편향과 연관될 수 있다. 향후 연구에서는 비용 효율적인 프롬프트 최적화, 다중 차원 명성 모델, 그리고 실제 인간-LLM 혼합 환경에서의 검증이 필요하다.

LLM 기반 다중에이전트 협력 붕괴 방지를 위한 명성 네트워크 RepuNet

초록

상세 분석

댓글 및 학술 토론

의견 남기기