머신러닝이 어떻게 축구 데이터의 르네상스를 주도하고 있는가

축구라는 아름다운 스포츠는 단순한 경기 기록을 넘어 복잡한 예측 모델링의 영역으로 나아가며 거대한 디지털 전환을 겪고 있습니다. Jesse Davis 교수를 필두로 한 선구자들에 의해, 고도화된 머신러닝은 과거 육안으로는 식별할 수 없었던 전술적 디테일을 밝혀내고 있습니다.

기초를 넘어: 트리 앙상블 모델의 힘

수십 년 동안 축구는 그 유동성 때문에 통계 모델링이 어려운 스포츠로 여겨져 왔습니다. 농구와 달리 축구의 대부분의 동작은 슛이나 골로 직접 이어지지 않기 때문입니다. 하지만 Jesse Davis와 KU Leuven의 스포츠 분석 연구소(Sports Analytics Lab)는 정교한 머신러닝 기술을 사용하여 이 장벽을 허물었습니다.

여러 개의 결정 트리(decision trees)를 강력하게 결합한 트리 앙상블 모델을 활용함으로써, Davis의 팀은 복잡한 전술적 움직임을 시뮬레이션하고 수치화할 수 있었습니다. 한 획기적인 연구에서는 2022년 월드컵 데이터를 포함하여 140만 개의 패스와 6만 개의 스로인 데이터를 포함하는 방대한 데이터셋을 사용했습니다. 이 연구는 언뜻 직관에 어긋나 보이는 움직임, 즉 상대 진영에서 의도적으로 공을 라인 밖으로 차내는 행위에 대해 수학적 근거를 제시했습니다. 모델 분석 결과, 공이 경기장 중앙 구역(middle third)에 있을 때 이러한 전술을 사용하면 팀이 골에 도달하기까지 단 10번의 동작만 남겨둘 수 있는 것으로 나타났으며, 이는 득점 차가 적은 축구 경기에서 결정적인 이점이 됩니다.

정량화할 수 없는 것을 정량화하기: 전술적 지능

이러한 데이터 기반 접근 방식의 영향은 프로 클럽의 의사 결정 모든 측면으로 확장됩니다. Royal Sporting Club Anderlecht와 같은 팀들은 이제 선수 명단을 평가하고 특정 경기 전략의 효율성을 측정하기 위해 이러한 분석 프레임워크에 의존하고 있습니다.

연구소의 연구는 현대 축구 분석의 "지적 토대"를 구축하는 데 중추적인 역할을 해왔습니다. 주요 연구 결과는 다음과 같습니다:

  • 페널티킥 최적화: 데이터에 따르면 중앙을 겨냥하는 것이 통계적으로 더 우월한 전략임을 시사합니다.
  • 슈팅 선택: 장거리 슈팅의 증가 추세를 분석하여 성공 확률을 정확히 수치화합니다.
  • 점유 가치: 단순한 볼 점유를 넘어, 특정 패스 패턴이 볼 전진에 어떻게 기여하는지 이해합니다.

표준화된 스포츠 인텔리전스의 미래

많은 프로 클럽들이 경쟁 우위를 유지하기 위해 내부 데이터 팀을 구축하고 있는 반면, KU Leuven에서 이루어지는 연구는 더 넓은 AI 생태계에 기여하고 있습니다. Davis는 오픈 소스 분석 도구를 통해 연구에 대한 접근성을 높이는 것이 중요하다고 강조합니다.

스포츠 AI의 다음 개척지는 경기 중 데이터(in-game data)의 표준화입니다. 연구자들은 가공되지 않은 경기 영상을 구조화된 데이터로 파싱하는 더 나은 방법을 개발함으로써, 축구에서의 "노이즈" 문제, 즉 즉각적인 득점으로 이어지지 않는 대다수의 동작들을 해결하고자 합니다. 이를 해결하면 스포츠의 복잡성, 유동성, 속도를 더욱 세밀하게 모델링할 수 있게 되어, 모든 경기를 방대하고 활용 가능한 데이터셋으로 전환할 수 있습니다.

핵심 요약

  • 고급 모델링: 연구자들은 의도적인 스로인과 같은 비전형적인 전술을 검증하기 위해 수백만 개의 동작이 포함된 데이터셋에 트리 앙상블(tree ensemble) 모델을 사용하고 있습니다.
  • 전략적 변화: 데이터 분석은 축구를 직관적인 코칭에서 확률적 의사결정의 영역으로 변화시키고 있으며, 페널티킥부터 중거리 슈팅에 이르기까지 모든 것에 영향을 미치고 있습니다.
  • 오픈 소스의 영향력: 프로 클럽을 넘어, 표준화된 경기 데이터와 오픈 소스 도구에 대한 추진은 차세대 스포츠 AI를 위한 토대를 마련하고 있습니다.