CWN(CHANGE WITH NEWS) - 이제는 야구도 데이터를 알아야한다

  • 맑음북부산-4.9℃
  • 흐림제천-3.6℃
  • 맑음속초-1.9℃
  • 흐림군산-0.4℃
  • 구름많음청송군-3.0℃
  • 맑음서산-3.6℃
  • 구름많음해남-0.3℃
  • 맑음진주-5.4℃
  • 박무북춘천-5.4℃
  • 맑음광양시-0.5℃
  • 흐림보은-2.3℃
  • 맑음포항-1.2℃
  • 구름많음태백-5.8℃
  • 구름많음고창군-3.2℃
  • 흐림원주-3.8℃
  • 맑음거제1.9℃
  • 구름많음의성-8.3℃
  • 맑음영천-5.2℃
  • 맑음철원-9.8℃
  • 맑음백령도-3.1℃
  • 맑음대구-4.0℃
  • 눈안동-6.0℃
  • 흐림금산-0.3℃
  • 맑음보성군-2.0℃
  • 맑음부산0.8℃
  • 맑음인천-6.0℃
  • 맑음경주시-7.2℃
  • 맑음동두천-6.7℃
  • 구름조금강릉-1.0℃
  • 흐림부여-3.6℃
  • 구름많음성산4.0℃
  • 구름많음영광군1.6℃
  • 구름조금영덕-0.8℃
  • 구름많음거창-0.3℃
  • 흐림장수-1.6℃
  • 맑음통영1.3℃
  • 구름많음서울-5.3℃
  • 흐림충주-3.5℃
  • 맑음춘천-6.0℃
  • 구름많음완도3.2℃
  • 맑음여수1.0℃
  • 맑음고흥-0.2℃
  • 구름많음보령-0.6℃
  • 맑음구미-5.7℃
  • 맑음의령군-5.0℃
  • 눈전주-0.6℃
  • 맑음홍천-6.1℃
  • 흐림정선군-4.6℃
  • 맑음파주-7.9℃
  • 구름많음천안-2.1℃
  • 흐림영월-5.2℃
  • 맑음양산시1.3℃
  • 구름조금강진군2.1℃
  • 맑음이천-3.3℃
  • 흐림서청주-2.3℃
  • 구름많음고창-2.7℃
  • 맑음임실-3.9℃
  • 구름많음흑산도3.3℃
  • 비제주6.5℃
  • 구름많음함양군0.8℃
  • 맑음창원-0.6℃
  • 구름많음순창군-2.1℃
  • 안개광주-0.8℃
  • 흐림추풍령-1.4℃
  • 구름조금동해-1.0℃
  • 맑음울산-3.5℃
  • 맑음합천-4.2℃
  • 흐림인제-6.1℃
  • 구름많음대관령-8.2℃
  • 눈대전-1.6℃
  • 맑음김해시-0.7℃
  • 흐림부안1.4℃
  • 구름많음진도군3.7℃
  • 맑음북창원-0.5℃
  • 맑음남해1.7℃
  • 구름조금울진-2.1℃
  • 구름많음서귀포5.3℃
  • 흐림상주-2.0℃
  • 흐림문경-1.9℃
  • 맑음순천-1.2℃
  • 흐림고산6.3℃
  • 구름많음정읍-1.3℃
  • 흐림영주-2.2℃
  • 맑음밀양-6.1℃
  • 구름많음남원-3.2℃
  • 맑음북강릉-4.7℃
  • 맑음강화-6.2℃
  • 눈울릉도0.0℃
  • 맑음양평-4.9℃
  • 흐림세종-2.5℃
  • 눈청주-2.3℃
  • 구름조금홍성-2.2℃
  • 맑음장흥-3.6℃
  • 맑음산청0.5℃
  • 맑음수원-5.1℃
  • 구름많음목포2.9℃
  • 구름많음봉화-4.3℃
  • 2026.01.24 (토)

이제는 야구도 데이터를 알아야한다

공민지 / 기사승인 : 2021-02-04 23:29:27
  • -
  • +
  • 인쇄

영화 ‘머니볼’로 유명해진 데이터 야구의 바람이 한국 프로야구에도 불고 있다. 확률 게임의 대표 주자인 야구의 데이터 용량이 점차 커지면서 이제는 엑셀만으로 데이터 분석을 할 수 없는 상황이 되었다.

이에, R과 파이썬(Python) 등 익숙한 프로그램을 통한 데이터 분석과 함께 ‘세이버 메트릭스’나 투구 추적 시스템(PTS·Pitch Tracking System)과 같은 추가적인 데이터 툴을 이용한 분석이 야구계에서 화제가 되고 있다.

스포츠 데이터 분석의 한 방법인 ‘세이버 메트릭스(sabermetrics)’는 야구에 사회과학의 게임 이론과 수학·통계학적 분석을 도입하여 전략을 세우는 방법론이다. 즉, 타구의 방향, 구속이나 구종과 같은 야구 데이터를 수집하여 회귀분석, 기계학습 등을 통한 빅데이터 분석 과정을 거친 후, 승리를 위한 전략을 내세운다.

우리는 타자의 가치를 판단할 때 타율, 타점이라는 지표를 가장 중요하게 여기는 경향이 있었다. 하지만 야구 데이터를 이용한 분석 결과, 우리가 평소 알고 있던 야구 상식과는 다른 통계적 수치를 얻기도 하여 객관적 데이터 분석의 중요함을 점차 과시하였다.

5년간 메이저리그 경기를 분석한 결과, 타율과 득점의 상관계수(0.672)보다 출루율과 득점의 상관계수(0.835)가 더 높게 나타났으며, 이를 통해 출루율이 타율보다 더 중요한 지표라는 사실을 발견했다. 따라서 최근에는 장타율과 출루율을 더한 수치인 OPS가 새로운 타자 평가 지표로 점차 떠오르고 있다.

또한, 무사 1루에서의 득점 기대치(0.906)가 1사 2루의 득점 기대치(0.7)보다 높다는 통계 수치를 발견했다. 즉, 아웃 카운트 하나를 희생하고 주자를 2루에 갖다 놓는 작전이 득점에 있어서 손해가 될 수도 있다는 사실이다.

이러한 세이버 메트릭스는 기존의 선수를 평가하는 지표보다 더욱 객관적인 평가를 통한 판단을 할 수 있도록 하였으며, 과소평가 되어있었던 지표에도 집중함으로써 야구에 대한 정확한 이해를 추구하며 효율적인 승리 방법을 모색할 수 있도록 도왔다.

[호크아이 이노베이션]

메이저리그는 경기에서 수집한 많은 양의 자료를 팬들에게 공개한다. 세이버 메트릭스의 2차 발전 형태라고 불리는 ‘스탯캐스트’는 ‘호크아이’와 ‘카이론헤고’ 장비를 사용하여 경기장 안의 모든 선수와 모든 공의 움직임을 모두 기록하는 시스템이다.

공의 궤적, 회전수와 같은 투구를 추적하는 시스템인 ‘호크아이’는 축구의 비디오 판독(VAR), 배구 국제경기의 VAR 시스템에도 사용되는 장비로 음파를 사용하는 레이더 시스템이다. ‘카이론헤고’는 카메라 비전 방식으로 장비와 야수의 위치와 움직임과 같은 필드 트래킹 데이터를 제공하는 시스템이다.

세이버 메트릭스는 근 20년간 리그 전체 좌타 타석의 30%를 수비 시프트로 수비하도록 만들거나, 엘리트 포수가 평범한 포수보다 100개의 포구 중 3개 이상의 스트라이크를 이끌어 내는 능력이 있다는 사실을 밝혀내는 것과 같이 수많은 정보를 야구계에 남겼다. 이에 세이버 매트리션들은 ‘스택캐스트’를 통해 ‘세이버 메트릭스’에서 얻은 정보 이상의 새로운 발견을 할 것이라고 기대하고 있다.

[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]

최신기사

뉴스댓글 >

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

댓글 0

Today

Hot Issue