축구 선수 영입을 위한 언어모델 기반 카운터팩추얼 시뮬레이션

ScoutGPT는 축구 경기 이벤트를 토큰 시퀀스로 변환해 차세대 토큰을 예측하는 NanoGPT 기반 트랜스포머를 활용한다. VERSA 검증으로 데이터 일관성을 확보하고, 경기 상황·선수 정보를 조건으로 하여 전체 이벤트 흐름을 생성한다. 목표‑스코어링·실점 확률을 보조 헤드로 추정함으로써 전통적인 정적 지표를 넘어선 선수 가치 평가가 가능하며, 몬테카를로 샘플링을 통해 가상의 라인업 교체 시나리오를 시뮬레이션한다. K‑리그 데이터 실험에서 전…

저자: Miru Hong, Minho Lee, Geonhee Jo

축구 선수 영입을 위한 언어모델 기반 카운터팩추얼 시뮬레이션
본 논문은 축구 선수 영입 및 전술 평가에 필요한 “카운터팩추얼(가상) 시뮬레이션”을 가능하게 하는 새로운 프레임워크 ScoutGPT를 제안한다. 기존의 Expected Threat(xT), Valuing Actions by Estimating Probabilities(VAEP) 등은 관측된 이벤트에 대한 가치를 정량화하지만, 전술 교체 후 선수 행동이 어떻게 변할지에 대한 예측은 제공하지 못한다. 이러한 공백을 메우기 위해 저자들은 경기 이벤트를 언어 모델의 토큰 시퀀스로 변환하고, NanoGPT 기반의 디코더‑전용 트랜스포머를 이용해 다음 토큰을 예측하도록 학습한다. **데이터 전처리와 검증** 원시 이벤트 로그는 종종 누락·순서 오류·물리적 불가능성을 포함한다. 이를 해결하기 위해 VERSA(State‑Transition 기반 검증기)를 적용해, 누락된 Pass Received 이벤트를 삽입하고, 시간 순서를 재정렬하며, 필드 외 좌표를 교정한다. 이렇게 정제된 데이터는 논리·물리적 일관성을 보장한다. **구조적 토큰화** 각 경기 에피소드는 전역 컨텍스트 C와 이벤트 시퀀스 E로 구성된다. 컨텍스트는 라인업(11명 × 포지션·선수ID)과 경기 메타데이터를 56개의 토큰으로 고정한다. 이벤트는 10개의 원자 토큰(팀, 포지션, 행동, 시작·종료 좌표, 시간Δ, 결과 등)으로 평탄화하고, 연속 변수는 0‑105 구간으로 이산화한다. 전체 시퀀스는

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기