고속 대규모 멀티에이전트 전투 시뮬레이터 TABX

고속 대규모 멀티에이전트 전투 시뮬레이터 TABX
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

TABX는 JAX 기반 GPU 가속을 활용한 고처리량 전투 시뮬레이터로, 환경 파라미터와 유닛 특성을 코드 수정 없이 동적으로 재구성할 수 있다. 부분 가시성, 비대상 공격, 이질적 지형 등 복합적인 전술 요소를 제공해 MARL 알고리즘의 협업·대립 능력을 체계적으로 평가한다.

상세 분석

TABX는 기존 MARL 벤치마크가 갖는 정적 시나리오와 제한된 파라미터 공간을 극복하기 위해 설계되었다. JAX를 이용한 전역 벡터화와 GPU 병렬 실행 덕분에 수십만 에피소드를 초당 처리할 수 있어, 실험 비용을 크게 낮춘다. 환경은 네 가지 주요 차원—유닛 스펙, 지형 구역, 휴리스틱 정책, 물리 파라미터—으로 구성되며, 각 차원은 JSON‑형식 설정 파일 혹은 GUI를 통해 실시간으로 바뀔 수 있다. 특히 팬형 시야와 히트박스 기반 비대상 공격 메커니즘은 관측 불확실성을 인위적으로 증가시켜, 에이전트가 위치·방향을 협조적으로 조정하도록 강제한다. 지형 효과(용암·늪·덤불)는 이동 속도 감소, 지속 피해, 비대칭 은폐 등을 제공해 전략적 깊이를 더한다.

휴리스틱 적군은 ‘암살자·레인저·힐러’ 역할별 행동 원칙을 조합해 다양한 난이도 레벨을 생성한다. 이는 단순 랜덤 정책을 넘어, 역할에 맞는 이동·공격·치유 패턴을 구현함으로써 학습 에이전트가 보다 현실적인 적응 과정을 겪게 만든다. 실험에서는 MAPPO, IPPO, QMIX, IQL 등 대표적인 MARL 알고리즘을 8가지 사전 정의 시나리오에 적용했으며, 승률 차이가 지형 복잡도와 관측 범위에 크게 의존함을 확인했다.

비교 표에서 볼 수 있듯, 기존 벤치마크는 코드 레벨 재구성이나 제한된 파라미터만 제공하는 반면, TABX는 완전한 레이아웃 기반 설정과 GUI 편집을 동시에 지원한다. 이는 연구자가 동일한 코드베이스에서 새로운 과제나 커리큘럼을 빠르게 정의하고, 동일한 실험 파이프라인으로 재현성을 확보할 수 있게 한다. 다만 현재는 2D 평면 시뮬레이션에 국한되어 있으며, 복잡한 물리 엔진이나 3D 시각화가 부족하고, 휴리스틱 정책의 자동 튜닝 메커니즘이 미비하다는 점이 향후 개선 과제로 남는다.


댓글 및 학술 토론

Loading comments...

의견 남기기