샷 유형 인식 구역 다층 포아송 모델을 통한 농구 샷 차트 비교
본 논문은 팀별, 구역별, 샷 유형별 필드골 시도 횟수를 포아송 GLMM으로 모델링한 STAMP 모델을 제안한다. 경기당 소유권 수를 오프셋으로 사용해 노출 차이를 보정하고, 팀·구역·팀‑구역·팀‑측면·샷 유형별 슬로프 등 다중 랜덤 효과를 계층적으로 결합한다. INLA를 이용한 근사 베이지안 추론으로 30만 건 이상의 B.LEAGUE 데이터 분석이 가능하며, 기존 베이스라인보다 예측 성능이 우수하고 해석 가능한 상대 비율 지도와 좌우 편향 지…
저자: Kazuhiro Yamada, Keisuke Fujii
본 연구는 농구 샷 차트를 “팀‑구역‑샷 유형”이라는 3차원 이산 구조로 재구성하고, 이를 포아송 일반화 선형 혼합 모델(GLMM)로 분석하는 새로운 프레임워크인 STAMP(Shot‑Type‑Aware Areal Multilevel Poisson) 모델을 제안한다. 기존 연구는 주로 샷 위치 기반 효율성(예: xG와 유사한 지표)이나 공간적 선호도를 시각화하는 데 초점을 맞추었으며, 마크(샷 유형)를 포함한 연속 공간 모델(LGCP)은 파라미터 결합과 계산 비용이 크게 증가하는 문제를 안고 있었다. STAMP는 이러한 문제를 해결하기 위해 다음과 같은 설계적 선택을 한다.
1. **이산 구역 정의와 오프셋 사용**
코트는 13개의 사전 정의된 구역으로 나누고, 좌우 대칭 구역을 합쳐 3개의 측면(Left, Center, Right)으로 요약한다. 각 팀‑시즌 별 소유권(포세션) 수를 로그 오프셋으로 포함해 노출 차이를 보정함으로써, 단순 카운트 비교가 아닌 “노출‑조정 비율”을 추정한다.
2. **계층적 랜덤 효과 구조**
- **팀 효과(uᵢ)**: 팀 간 평균 차이.
- **구역 효과(vⱼ)**: 구역별 평균 시도 빈도.
- **팀‑구역 상호작용(wᵢⱼ)**): 특정 팀이 특정 구역에서 보이는 고유한 경향.
- **팀‑측면 상호작용(xᵢc)**: 좌우 비대칭 성향을 포착.
- **샷 유형별 팀‑구역 슬로프(γₖ^{i,j})**: 점프 슛, 레이업 등 주요 6가지 샷 유형마다 팀‑구역 효과가 다르게 나타날 수 있음을 모델링.
모든 랜덤 효과는 평균 0, 합이 0이 되도록 제약을 두어 식별성을 확보한다. 이는 팀‑구역 효과가 전체 평균으로부터의 편차로 해석될 수 있게 한다.
3. **베이지안 추론 via INLA**
잠재 가우시안 필드를 갖는 포아송 GLMM은 라플라시안 근사를 이용한 INLA(Integrated Nested Laplace Approximation)로 빠르게 추정한다. PC(prior complexity) 사전분포를 적용해 과도한 분산을 억제하고, 사전 민감도 검증을 통해 결과의 견고함을 확인한다. INLA는 대규모 데이터(30만 건 이상)에서도 1분 내외의 실행 시간을 보이며, MCMC 대비 계산 효율성이 뛰어나다.
4. **데이터와 전처리**
- 대상: 일본 B.LEAGUE 2023‑24, 2024‑25 시즌, 총 2,352경기.
- 샷 유형: 원래 12가지 이상을 6가지로 통합(예: “fadeaway”와 “turnaround”를 하나로).
- 구역: 13개 구역을 정의하고, 좌우 대칭 구역을 합쳐 3측면으로 재분류.
- 변수: 팀, 시즌, 구역, 측면, 샷 유형, 포세션 수(오프셋).
5. **모델 비교와 예측 성능**
4개의 랜덤 효과 블록(팀‑구역, 팀‑측면, 점프 슛 슬로프, 스텝‑백/풀업 슬로프)을 켜고 끄는 16가지 조합을 평가했다. 성능 평가는 포스트시즌 데이터에 대한 기대 로그 예측밀도(dELPD)와 정규화된 로그 사후 예측밀도(LPML)를 사용했다. 결과는 다음과 같다.
- 모든 랜덤 효과를 포함한 완전 모델이 가장 높은 dELPD와 LPML을 기록, 베이스라인(랜덤 효과 전무) 대비 dELPD 차이가 약 3,200에 달한다.
- 팀‑구역 상호작용과 샷 유형 슬로프가 예측 성능 향상의 핵심 요인이며, 팀‑측면 효과는 예측력에는 미미하지만 좌우 편향 해석에 기여한다.
- 사전 하이퍼파라미터를 다양하게 변형해도 순위가 크게 변하지 않아 모델의 견고성을 확인했다.
6. **해석 및 시각화**
- **팀‑측면 효과**: 각 팀별 좌우 비대칭을 로그 비율(log(Right/Left))로 나타낸 캣터플 플롯을 제공. 예시로, 특정 팀은 오른쪽 구역에서 시도가 현저히 많아 양의 로그 비율을 보인다.
- **팀‑구역 상대 비율 지도**: 팀별, 구역별 상대 시도 비율을 색상으로 시각화해 전술적 특성을 직관적으로 파악할 수 있다.
- **사례 연구**: Utsunomiya Brex는 오른쪽 외곽에서 점프 슛 비중이 높고, Nagoya Diamond Dolphins는 페인트 구역에서 레이업 시도가 집중되는 등, 팀 고유의 공간적 선호도를 구체적으로 제시한다.
7. **한계와 향후 연구**
- **구역 이산화**: 연속적인 위치 정보를 구역 단위로 집계함으로써 미세한 위치 차이를 놓칠 수 있다.
- **포아송 가정**: 과산포(overdispersion) 문제가 존재할 경우 네거티브 이항 모델이나 혼합 포아송 모델이 필요할 수 있다.
- **마크드 LGCP와 비교**: 마크드 LGCP와의 직접적인 성능·해석 비교가 향후 과제로 남는다.
- **다중 시즌·다중 리그 확장**: 현재는 두 시즌의 일본 리그에 국한되었으나, 다른 국가·리그에 적용해 일반화 가능성을 검증할 여지가 있다.
결론적으로, STAMP 모델은 대규모 리그 수준에서 샷 유형을 명시적으로 고려한 공정하고 해석 가능한 비교를 가능하게 하며, 기존 연속 공간 모델이 안고 있던 계산 복잡성과 파라미터 식별 문제를 효과적으로 해결한다. 이는 코칭 스태프, 분석가, 스카우터가 팀 전술을 설계하고 상대 팀의 공간적 약점을 파악하는 데 실질적인 도구가 될 수 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기