AI 에이전트 집단 행동 몰트북 사례
초록
본 논문은 AI 전용 소셜 플랫폼 ‘몰트북’에서 46 000명 이상의 활성 에이전트가 생성한 369 000개 게시물과 3 백만 건 댓글을 분석한다. 활동량, 인기 지표, 토론 구조, 시간적 참여 패턴 등 인간 온라인 커뮤니티에서 관찰되는 통계적 규칙이 대부분 재현되는 동시에, 업보트와 토론 규모 사이의 서브리니어 스케일링 등 인간과 차별되는 특성도 발견한다.
상세 분석
논문은 먼저 몰트북의 성장 과정을 12일간 추적해 지수적 사용자 증가와 일일 활동량의 안정화를 확인한다. API 제한으로 전체 댓글의 24 %만 저장했음에도 불구하고, 저장된 데이터와 API가 제공한 총 댓글 수가 동일한 시간적 패턴을 보이며 샘플링 편향이 최소임을 입증한다. 활동량의 헤비테일 분포는 댓글당 게시물 수(α≈1.72), 서브몰트당 게시물 수(α≈1.68), 구독자 수(α≈2.00)에서 모두 파워‑로우를 보이며, 인간 Reddit 사용자와 거의 일치한다. 이는 AI 에이전트가 개별 행동은 다르더라도 집단 수준에서는 유사한 비대칭성을 만든다는 증거다.
특히 인기 스케일링 분석에서 업보트 평균이 토론 규모에 대해 서브리니어(β≈0.78)로 증가하는 반면, 직접 답글 수는 거의 선형(β≈0.94)이다. 이는 AI 에이전트가 토론에 참여는 활발히 하지만, 긍정적 피드백인 업보트를 부여하는 행동은 제한적이거나 설계된 보상 구조에 의해 억제될 가능성을 시사한다. 토론 트리 구조는 정규화된 깊이와 폭 사이에 음의 상관관계를 보이며, d/√n ∝ (w/√n)⁻¹ 형태의 임계 분기 과정과 일치한다. 69.5 %의 게시물이 깊이 1을 기록해 대부분의 대화가 ‘플랫’ 형태임을 확인한다.
시간적 역학에서는 댓글 성장률 γ(t)가 t⁻¹ 형태로 감소한다는 점에서 인간 트위터·레딧과 동일한 ‘제한된 주의’ 메커니즘을 공유한다. 이는 플랫폼 구조와 사용자 정체성(인간 vs AI)에 관계없이 주의 자원이 급격히 희석된다는 보편적 법칙을 뒷받침한다.
또한, 등록된 150만 에이전트 중 실제 활동한 46 000명은 3.1 %에 불과하며, 인간 운영자가 평균 88개의 에이전트를 관리한다는 보안 보고서가 제시된다. 이는 ‘봇‑계정’ 과다 등록과 자동화된 에이전트 검증 부재가 데이터 해석에 미치는 영향을 경고한다.
전반적으로 연구는 AI 에이전트 집단이 인간과 유사한 통계적 패턴을 보이면서도, 보상 메커니즘·업보트 행동·토론 깊이 등에서 차별적인 특성을 나타낸다는 두 가지 핵심 인사이트를 제공한다. 이러한 차이는 향후 AI 기반 소셜 시스템 설계 시 인간‑AI 상호작용의 균형을 맞추는 정책적·기술적 고려사항으로 활용될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기