테라링구아: LLM 에이전시 생태계에서 열린 진화와 문화 축적 연구
테라링구아는 자원 제한과 유한 수명을 가진 지속형 격자 세계에서 LLM 기반 에이전트가 움직이고, 에너지와 정보를 교환하며, 텍스트 기반 아티팩트를 생성·수정하도록 설계된 시뮬레이션이다. 비간섭적 AI 인류학자가 에이전트 행동, 집단 구조, 아티팩트 계통을 자동 분석함으로써, 협력 규범, 분업, 거버넌스 시도, 그리고 누적 문화 라인age가 어떻게 등장하는지를 규명한다. 실험 결과는 자원 압력과 아티팩트 영속성이 열린‑엔드(open‑ended)…
저자: Giuseppe Paolo, Jamieson Warner, Hormoz Shahrzad
본 논문은 인공지능 에이전트가 실제 디지털 생태계에서 장기적으로 상호작용하며 문화와 제도를 형성하는 과정을 이해하고, 이를 설계에 활용하고자 하는 목표에서 출발한다. 이를 위해 저자들은 ‘테라링구아(TerraLingua, TL)’라는 새로운 시뮬레이션 환경을 구축하였다. TL은 2차원 격자 세계이며, 각 셀은 제한된 양의 에너지(광물·식량)와 공간을 제공한다. 에이전트는 대형 언어 모델(LLM) 기반으로, 움직임, 자원 채집, 에너지 교환, 의사소통, 번식, 그리고 텍스트 기반 아티팩트(문서·코드·규칙 등) 생성·수정을 수행한다. 에이전트마다 유한 수명이 주어지고, 에너지 부족 시 사망한다. 번식은 일정 에너지와 ‘유전적’ 성격 특성(OCEAN·HEXACO) 조합을 통해 이루어지며, 자손은 부모의 성격을 부분적으로 물려받는다.
핵심 차별점은 아티팩트의 영속성이다. 에이전트가 만든 텍스트 객체는 격자에 남아 다른 에이전트가 읽고 수정하거나 재사용한다. 이러한 외부 기억은 문화적 누적을 가능하게 하며, 아티팩트 라인age(버전 기록·인용 관계)를 통해 진화적 트리를 형성한다. 아티팩트는 단순 메모에서 시작해, 에너지 거래 프로토콜, 협력 규칙, 심지어 거버넌스 헌법까지 복잡성을 확대한다.
시뮬레이션 데이터를 인간이 직접 분석하기엔 규모가 방대하므로, 저자들은 ‘AI 인류학자’를 도입했다. AI 인류학자는 비간섭 관찰자로서, LLM을 활용해 (1) 개별 에이전트 행동 로그와 대화 내용을 라벨링하고 행동 유형을 분류, (2) 에이전트 간 네트워크 구조·역할 분화를 분석, (3) 아티팩트 텍스트 변이와 인용 네트워크를 추적한다. 이를 통해 정량적 지표(협력 비율, 번식 성공률, 아티팩트 전이율 등)와 정성적 보고서(규범·갈등·거버넌스 서술)를 자동 생성한다.
실험은 다양한 초기 조건과 자원 풍부도, 수명 길이, 성격 분포 등을 변형해 10여 차례 수행되었다. 주요 발견은 다음과 같다. 첫째, 자원 제한과 사망 위험이 존재할 때 에이전트는 에너지 공유와 보상 메커니즘을 스스로 도입해 협력 규범을 형성한다. 둘째, 특정 아티팩트(예: 효율적인 채굴 도구)를 전문화한 에이전트 집단이 등장하면서 작업 분업이 발생하고, 이는 전체 생산성을 크게 향상시킨다. 셋째, 아티팩트 기반 규칙(‘거버넌스 헌법’)이 충돌 해결에 사용되면서 초기 형태의 제도적 구조가 나타난다. 넷째, 초기 몇 차례의 혁신—예를 들어 에너지 전송 프로토콜이나 공동 작업 템플릿—이 이후 문화 라인age와 사회 조직을 결정짓는 ‘키 혁신’ 역할을 한다. 동일 초기 파라미터라도 무작위 초기 변이로 인해 서로 다른 문화적 경로가 갈라지는 경로 의존성이 관찰되었다.
성격 특성 실험에서는 높은 개방성·외향성을 가진 에이전트가 새로운 아티팩트를 탐색하고 도입하는 비율이 높았으며, 높은 친화성·정직성을 가진 에이전트가 규범을 전파하고 유지하는 데 핵심적인 역할을 함을 확인했다. 이는 인간 사회에서 성격이 문화 전파와 조직 형태에 미치는 영향과 유사한 메커니즘을 시뮬레이션에서도 재현한다는 점에서 의미가 크다.
논문은 기존 LLM 기반 사회 시뮬레이션(Interactive Simulacra, Sotopia 등)이 정적인 역할·목표에 의존하거나 문화적 저장소가 부족했던 점을 비판하고, 테라링구아가 자원 압력, 영구 아티팩트, 성격 기반 이질성, 그리고 비간섭 메타‑분석을 결합함으로써 진정한 열린 진화(open‑ended)와 누적 문화(cumulative culture)를 연구할 수 있는 통합 플랫폼을 제공한다는 점을 강조한다. 또한 코드와 데이터셋을 공개함으로써 재현성과 확장성을 확보했으며, 향후 연구 방향으로는 (1) 더 복잡한 물리·경제 모델 도입, (2) 인간‑에이전트 혼합 생태계 구축, (3) 안전·윤리적 거버넌스 메커니즘 설계 등을 제시한다.
결론적으로, 테라링구아는 LLM 에이전트가 자율적으로 문화와 제도를 축적하고, 자원 제한이라는 자연 선택 압력 하에서 지속적인 혁신을 이루는 과정을 실험적으로 검증한 최초의 시스템이라 할 수 있다. 이는 인공지능이 단순 목표 최적화를 넘어, 장기적 발견과 사회적 가치를 창출하도록 설계되는 데 중요한 이론적·실용적 토대를 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기