혼합 더블 컬링 데이터셋 공개: 경기·샷 레벨 분석의 새 지평

혼합 더블 컬링 데이터셋 공개: 경기·샷 레벨 분석의 새 지평
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 2016‑2025년 사이에 열린 11개의 국제 혼합 더블 컬링 대회에서 추출한 1,112경기, 66,632샷에 대한 가장 포괄적인 공개 데이터셋을 소개한다. 텍스트 스크래핑과 이미지 처리 파이프라인을 결합해 선수·팀 정보, 해머·파워플레이 상황, 돌 좌표 및 샷 후 점수 상태 등을 표준화했으며, 이를 기반으로 샷 선택, 성공률, 득점 분포 등 초기 분석 결과를 제시한다. 데이터셋은 167개의 경기‑레벨 변수와 103개의 샷‑레벨 변수를 포함해 향후 전략 모델링 및 성과 평가 연구에 활용될 수 있다.

상세 분석

본 연구는 혼합 더블 컬링이라는 비교적 신생 종목에 대한 데이터 인프라가 부족한 현실을 극복하고자, CurlIT 결과 북릿(CurlIT Results Booklet)이라는 공개 PDF 자료를 원천으로 삼아 체계적인 데이터 파이프라인을 구축하였다. 텍스트 스크래핑 단계에서는 팀·선수 명단, 경기 일정, 라인스코어, 마지막 스톤 드로우(LSFD) 결과, 타임아웃 및 파워플레이 사용 여부 등 구조화된 메타데이터를 추출하였다. 이 과정에서 국가 코드와 선수 이름의 비표준 표기, 페이지 레이아웃 변동, 누락된 구분자 등으로 인한 파싱 오류를 최소화하기 위해 정규표현식과 규칙 기반 전처리를 다중 적용하고, 추출된 문자열을 사전 정의된 어휘와 매핑하는 후처리 과정을 거쳤다.

이미지 처리 단계에서는 각 샷마다 제공된 스냅샷을 컴퓨터 비전 기법으로 분석하였다. 색상 분할을 통해 빨강·노랑(팀 구분) 돌을 식별하고, 원형 Hough 변환을 이용해 돌의 중심 좌표를 추정했다. 이후 사전 정의된 하우스 영역(12‑ft, 8‑ft, 4‑ft 원)과 가드 존을 기준으로 각 돌을 ‘인하우스’, ‘가드’, ‘아웃오브플레이’ 등으로 라벨링하였다. 이미지에서 추출된 좌표는 실제 아이스 치수(45.72 m × 4.75 m)를 기준으로 정규화되어, 후속 통계 분석 및 머신러닝 모델에 바로 활용 가능하도록 설계되었다.

데이터 정제 과정에서는 경기‑레벨과 샷‑레벨 데이터를 각각 167개·103개의 변수로 정규화하였다. 주요 파생 변수로는 각 엔드별 해머 보유 여부, 파워플레이 사용 시점 및 남은 사용 가능 횟수, 샷 유형(드로우, 테이크아웃, 기타)별 성공률, 엔드 종료 시점 점수 차, 그리고 ‘스톤 포지션 카운트’(예: 4‑ft 안에 있는 돌 수, 가드 존에 있는 돌 수) 등이 있다. 특히, 혼합 더블 특유의 ‘프리 가드 규칙’ 위반 시 자동 리셋 로직을 데이터에 명시함으로써 전통 4인 컬링과의 전략적 차이를 정량화할 수 있게 하였다.

초기 탐색적 분석에서는 (1) 해머 보유 팀이 평균 1.42점의 득점을 기록했으며, 이는 전통 4인 컬링의 평균 1.68점보다 낮다. (2) 파워플레이를 사용한 엔드에서는 평균 득점이 2.07점으로, 파워플레이 미사용 엔드(1.31점)보다 현저히 높았다. (3) 샷 성공률은 드로우가 68 %, 테이크아웃이 74 %로, 테이크아웃이 약간 우세했으며, 이는 혼합 더블에서 초기 4샷까지는 가드 제거가 금지되는 규칙이 전략적 선택에 큰 영향을 미침을 시사한다. (4) 엔드 블랭크가 발생하면 해머가 자동으로 교체되는 구조 때문에 블랭크 전략이 거의 사용되지 않으며, 블랭크 비율은 4 %에 불과했다.

이러한 결과는 혼합 더블이 전통 4인 컬링과는 전혀 다른 전략적 패러다임을 가지고 있음을 정량적으로 입증한다. 특히 파워플레이와 해머 전환 메커니즘이 득점 효율에 미치는 영향이 크며, 초기 샷 제한 규칙이 가드 활용을 제한함으로써 ‘공격‑방어 전환’ 시점이 기존 경기보다 앞당겨진다. 데이터셋은 이러한 전략적 변수들을 시간·팀·선수 수준에서 추적할 수 있게 함으로써, 향후 강화학습 기반 전략 시뮬레이션, 승률 예측 모델, 그리고 경기 전술 최적화 연구에 핵심 자원으로 활용될 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기