CWN(CHANGE WITH NEWS) - 이제는 야구도 데이터를 알아야한다

  • 흐림서울24.3℃
  • 흐림고산25.7℃
  • 흐림전주23.7℃
  • 비제주25.9℃
  • 구름많음진도군22.3℃
  • 흐림봉화17.1℃
  • 흐림울진21.3℃
  • 구름많음흑산도24.5℃
  • 흐림영월17.9℃
  • 구름많음여수24.3℃
  • 구름많음동해20.7℃
  • 구름많음속초21.2℃
  • 구름많음북창원23.8℃
  • 흐림태백15.1℃
  • 구름많음안동20.8℃
  • 흐림장수18.6℃
  • 구름많음진주21.6℃
  • 구름많음북부산24.7℃
  • 흐림원주21.4℃
  • 흐림고창23.8℃
  • 구름많음광양시24.2℃
  • 흐림영광군23.2℃
  • 구름많음영주18.2℃
  • 흐림파주20.5℃
  • 구름많음김해시24.6℃
  • 흐림보령25.5℃
  • 구름많음영덕21.3℃
  • 흐림부안25.1℃
  • 구름많음순천20.0℃
  • 구름많음대관령14.5℃
  • 흐림임실22.2℃
  • 구름많음의성18.6℃
  • 구름많음구미20.0℃
  • 구름많음북강릉21.0℃
  • 흐림합천20.8℃
  • 구름많음백령도22.9℃
  • 흐림서청주20.6℃
  • 흐림이천19.8℃
  • 구름많음대구21.9℃
  • 흐림대전23.2℃
  • 흐림청주24.9℃
  • 흐림울릉도23.2℃
  • 구름많음추풍령18.7℃
  • 구름많음철원20.0℃
  • 구름많음강진군23.1℃
  • 구름많음창원23.4℃
  • 흐림성산27.1℃
  • 흐림금산21.3℃
  • 흐림서산23.5℃
  • 구름많음강릉21.3℃
  • 흐림군산23.5℃
  • 흐림제천20.2℃
  • 구름많음상주20.8℃
  • 구름많음거제24.5℃
  • 흐림울산23.4℃
  • 흐림충주22.3℃
  • 구름많음문경18.6℃
  • 흐림광주23.6℃
  • 구름많음홍천19.1℃
  • 구름많음양산시24.7℃
  • 구름많음장흥24.7℃
  • 흐림정읍23.4℃
  • 흐림순창군21.8℃
  • 흐림춘천20.1℃
  • 흐림강화22.9℃
  • 구름많음포항23.9℃
  • 흐림의령군21.1℃
  • 구름많음영천20.5℃
  • 천둥번개서귀포26.4℃
  • 구름많음보은22.2℃
  • 구름많음청송군18.1℃
  • 구름많음부산24.4℃
  • 구름많음남해23.1℃
  • 구름많음밀양24.3℃
  • 구름많음완도23.1℃
  • 흐림부여22.8℃
  • 흐림홍성23.0℃
  • 흐림천안23.1℃
  • 구름많음목포25.0℃
  • 구름많음북춘천19.6℃
  • 구름많음보성군22.9℃
  • 구름많음세종22.9℃
  • 흐림정선군16.5℃
  • 구름많음산청20.4℃
  • 흐림양평21.1℃
  • 구름많음해남25.0℃
  • 흐림수원23.8℃
  • 구름많음인제18.0℃
  • 흐림인천25.2℃
  • 흐림고창군24.4℃
  • 흐림함양군19.7℃
  • 흐림경주시22.7℃
  • 구름많음거창18.8℃
  • 흐림동두천20.9℃
  • 흐림남원24.0℃
  • 구름조금고흥24.1℃
  • 구름많음통영23.8℃
  • 2025.09.12 (금)

이제는 야구도 데이터를 알아야한다

공민지 / 기사승인 : 2021-02-04 23:29:27
  • -
  • +
  • 인쇄

영화 ‘머니볼’로 유명해진 데이터 야구의 바람이 한국 프로야구에도 불고 있다. 확률 게임의 대표 주자인 야구의 데이터 용량이 점차 커지면서 이제는 엑셀만으로 데이터 분석을 할 수 없는 상황이 되었다.

이에, R과 파이썬(Python) 등 익숙한 프로그램을 통한 데이터 분석과 함께 ‘세이버 메트릭스’나 투구 추적 시스템(PTS·Pitch Tracking System)과 같은 추가적인 데이터 툴을 이용한 분석이 야구계에서 화제가 되고 있다.

스포츠 데이터 분석의 한 방법인 ‘세이버 메트릭스(sabermetrics)’는 야구에 사회과학의 게임 이론과 수학·통계학적 분석을 도입하여 전략을 세우는 방법론이다. 즉, 타구의 방향, 구속이나 구종과 같은 야구 데이터를 수집하여 회귀분석, 기계학습 등을 통한 빅데이터 분석 과정을 거친 후, 승리를 위한 전략을 내세운다.

우리는 타자의 가치를 판단할 때 타율, 타점이라는 지표를 가장 중요하게 여기는 경향이 있었다. 하지만 야구 데이터를 이용한 분석 결과, 우리가 평소 알고 있던 야구 상식과는 다른 통계적 수치를 얻기도 하여 객관적 데이터 분석의 중요함을 점차 과시하였다.

5년간 메이저리그 경기를 분석한 결과, 타율과 득점의 상관계수(0.672)보다 출루율과 득점의 상관계수(0.835)가 더 높게 나타났으며, 이를 통해 출루율이 타율보다 더 중요한 지표라는 사실을 발견했다. 따라서 최근에는 장타율과 출루율을 더한 수치인 OPS가 새로운 타자 평가 지표로 점차 떠오르고 있다.

또한, 무사 1루에서의 득점 기대치(0.906)가 1사 2루의 득점 기대치(0.7)보다 높다는 통계 수치를 발견했다. 즉, 아웃 카운트 하나를 희생하고 주자를 2루에 갖다 놓는 작전이 득점에 있어서 손해가 될 수도 있다는 사실이다.

이러한 세이버 메트릭스는 기존의 선수를 평가하는 지표보다 더욱 객관적인 평가를 통한 판단을 할 수 있도록 하였으며, 과소평가 되어있었던 지표에도 집중함으로써 야구에 대한 정확한 이해를 추구하며 효율적인 승리 방법을 모색할 수 있도록 도왔다.

[호크아이 이노베이션]

메이저리그는 경기에서 수집한 많은 양의 자료를 팬들에게 공개한다. 세이버 메트릭스의 2차 발전 형태라고 불리는 ‘스탯캐스트’는 ‘호크아이’와 ‘카이론헤고’ 장비를 사용하여 경기장 안의 모든 선수와 모든 공의 움직임을 모두 기록하는 시스템이다.

공의 궤적, 회전수와 같은 투구를 추적하는 시스템인 ‘호크아이’는 축구의 비디오 판독(VAR), 배구 국제경기의 VAR 시스템에도 사용되는 장비로 음파를 사용하는 레이더 시스템이다. ‘카이론헤고’는 카메라 비전 방식으로 장비와 야수의 위치와 움직임과 같은 필드 트래킹 데이터를 제공하는 시스템이다.

세이버 메트릭스는 근 20년간 리그 전체 좌타 타석의 30%를 수비 시프트로 수비하도록 만들거나, 엘리트 포수가 평범한 포수보다 100개의 포구 중 3개 이상의 스트라이크를 이끌어 내는 능력이 있다는 사실을 밝혀내는 것과 같이 수많은 정보를 야구계에 남겼다. 이에 세이버 매트리션들은 ‘스택캐스트’를 통해 ‘세이버 메트릭스’에서 얻은 정보 이상의 새로운 발견을 할 것이라고 기대하고 있다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue