야구 맞대결 네트워크의 상호 적대성 분석
초록
본 연구는 1954년부터 2008년까지 메이저리그 투수와 타자 간의 직접 대결을 양측면(투수‑타자) 이분 그래프로 모델링한다. 전체 기간과 연도별 네트워크의 구조 변화를 살펴보고, 규칙 변화가 네트워크 특성에 미치는 영향을 분석한다. 또한 편향된 랜덤 워크를 이용해 선수들의 상대적 성과를 평가하고, 네트워크 위치가 순위 민감도에 미치는 역할을 규명한다.
상세 분석
이 논문은 야구 경기 데이터를 ‘맞대결 네트워크’라는 새로운 형태의 이분 그래프로 변환함으로써, 기존 통계학적 접근이 놓치기 쉬운 상호작용 구조를 정량화한다. 투수와 타자를 각각 하나의 파티션에 배치하고, 한 경기에서 투수가 타자를 상대한 횟수를 가중치로 하는 엣지를 부여한다. 전체 기간 네트워크와 연도별 서브네트워크를 동시에 분석함으로써, 시간에 따른 구조적 변동을 포착한다는 점이 특히 혁신적이다.
네트워크의 기본 통계량(노드 차수 분포, 엣지 가중치 분포, 양측면 연결성 등)을 살펴보면, 차수는 대체로 멱법칙 형태를 보이며 소수의 ‘핵심’ 투수·타자가 다수의 상대와 빈번히 맞붙는 ‘스케일프리’ 특성을 띤다. 연도별 분석에서는 1973년 DH(지정 타자) 도입, 1969년 마운드 높이 조정, 1994년 파업 등 주요 규칙 변화가 네트워크의 평균 차수와 클러스터링 계수에 뚜렷한 변곡점을 만든다. 예를 들어 DH 도입 이후 타자 파티션의 평균 차수가 급증하고, 투수 파티션은 상대적으로 안정된 모습을 보인다. 이는 타자 측면에서 경기 참여 기회가 확대된 결과로 해석된다.
핵심 방법론인 ‘편향된 랜덤 워크’는 각 엣지의 가중치를 기반으로 확률 전이를 정의하고, 특정 편향 파라미터(β)를 통해 투수와 타자 간의 승패 기대값을 반영한다. 워커가 네트워크를 순회하면서 각 노드에 머무는 시간 비율을 순위 점수로 사용한다. 흥미롭게도, 노드의 전통적인 중심성(연결 중심성, 베트위니스 등)과 랜덤 워커 순위 사이에는 약한 상관관계만 존재한다. 즉, 네트워크 상에서 많이 연결된 선수일수록 순위가 높아지는 것이 아니라, 실제 경기 성과와 맞대결 상대의 질이 더 큰 영향을 미친다.
또한, 논문은 ‘민감도 분석’을 통해 개별 선수의 성적 변동이 순위에 미치는 영향을 정량화한다. 여기서 네트워크 위치가 중요한 역할을 하는데, 고도로 연결된 ‘허브’ 선수는 자신의 성적이 소폭 변해도 순위 변동이 작게 나타나는 반면, 주변부에 위치한 선수는 작은 성적 변화에도 순위가 크게 흔들린다. 이는 네트워크 구조가 선수 평가에 내재된 ‘불확실성’과 ‘안정성’의 두 축을 제공한다는 의미이다.
결론적으로, 이 연구는 야구라는 복합 시스템을 네트워크 과학의 시각에서 재해석함으로써, 전통적인 통계 지표와는 다른 차원의 선수 비교와 규칙 변화 효과 분석을 가능하게 한다. 향후에는 다중 시즌 간의 네트워크 전이 모델링이나, 다른 스포츠 종목에 대한 일반화 연구가 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기