※ NC 다이노스 데이터 팀의 송민구 님의 도움을 받아 초판에서 일부 잘못된 내용을 수정했습니다.
※들어가기에 앞서 – PITCH f/x와 스탯캐스트 데이터에 대해 알지 못한다면 이 글에서 다루는 내용은 매우 난해하게 다가올 수 있다. PITCH f/x 데이터에 대한 설명은 관련 자료를 찾아보길 권한다.
[야구공작소 박기태] 올해 메이저리그 중계에는 눈에 잘 띄지 않는 작은 변경점이 있다. 투수가 던진 공의 속도를 측정하는 시스템이 기존의 PITCH f/x에서 스탯캐스트(Statcast)로 완전히 바뀐 것이다. 지난해까지는 스탯캐스트 시스템을 통해 데이터가 측정되고 있었지만, TV 중계와 문자 중계에는 여전히 PITCH f/x 데이터가 쓰이고 있었다. 이것이 올해부터는 스탯캐스트 시스템에서 측정한 수치만 제공하는 것으로 바뀌었다. 단순히 카메라가 바뀐 정도로 볼 수 있지만, 공 하나하나의 데이터를 기록하는 데 있어서 기술적으로 중요한 변화가 있었다.
스탯캐스트와 PITCH f/x의 기본적인 차이
PITCH f/x를 대체하는 스탯캐스트 시스템은 두 회사의 측정 기술이 더해진 것으로, 트랙맨(Trackman) 사의 군사용 레이더와 카이런히고(Chyronhego) 사의 광학 카메라가 그것이다. 트랙맨 레이더는 경기장 안에서 움직이는 모든 공의 움직임을 추적하고, 카이런히고의 카메라는 야수와 주자의 움직임을 포착한다.
투구 추적 시스템에 한정하더라도 스탯캐스트는 PITCH f/x보다 더 정밀하게 공을 추적한다. PITCH f/x 카메라는 투수가 던진 공만 추적했지만, 트랙맨 레이더는 타자가 친 ‘타구’의 정보도 포착한다. 또한 예전에는 알 수 없던 투구의 ‘분당 회전수’도 측정하고 있다. 이러한 정보는 스탯캐스트가 도입된 2015년부터 대중에 공개되고 있다.
가장 큰 차이는 ‘새로운 데이터가 추가됐다’는 점이겠지만, 기존에 제공되던 데이터에도 중요한 차이가 있다. 투수가 던진 공을 ‘어느 지점에서 처음 측정하느냐’에 대한 것이다. 이 점에서도 스탯캐스트는 PITCH f/x보다 좀더 앞서있다.
그리고 이 점 때문에 2017시즌 들어서 투수의 구속, 무브먼트와 구종 분류와 관련하여 잘 알려지지 않은 변경점이 생겨났다.
Q) 갑자기 구속이 늘어났다? – A) 그렇지 않을 가능성이 높다
그동안 사용된 PITCH f/x 시스템은 홈플레이트에서 50피트 떨어진 곳에서 공의 빠르기를 처음 측정했다. 우리가 흔히 사용하는 ‘구속’ 또는 ‘초속’은 이 지점에서 측정된 공의 빠르기를 말한다. 또한 이보다 조금 앞, 42피트 지점에서 측정된 공의 궤적 및 이를 토대로 계산된 종착지와 실제 종착지의 차이가 공의 ‘무브먼트’ 값으로 계산된다. 변화구는 진행 도중 공기의 저항을 받아 더 크게 휘기 때문에 가상의 궤적과 실제 궤적의 차이가 더 크다.
PITCH f/x 시스템 모식도
그런데 스탯캐스트 시스템에 포함된 트랙맨 사의 레이더는 공이 ‘투수의 손을 떠나자마자(out of hand)’ 빠르기와 경로를 포착한다. 메이저리그에서 스탯캐스트 데이터를 가공하는 자회사, MLB 어드밴스드 미디어(MLBAM)의 분석가 톰 탱고는 본인의 블로그에서 ‘메이저리그 투수들이 공을 놓는 지점은 평균적으로 홈플레이트에서 54.5 피트 떨어진 지점’이라고 밝혔다. 그렇다면 PITCH f/x 시스템과는 5에서 10피트 정도 측정 위치의 차이가 있는 것이다.
이 5피트 정도의 차이는 투수의 구속 데이터에 상당한 차이를 불러온다. 5피트, 1.5미터 정도의 거리를 지나는 동안에도 투수가 던진 공은 시속 1마일 가까이 줄어든다. 달리 말해 PITCH f/x 시스템에 의해 50피트 지점에서 시속 92마일로 잡히던 공이 스탯캐스트 시스템에서는 55피트 지점에서 시속 93마일로 잡히는 것이다.
스탯캐스트는 PITCH f/x보다 투수 손에 가까운 지점에서 구속을 측정한다.
이 차이 때문에 올 시즌 초 몇몇 투수들의 구속이 갑자기 늘어났다는 제보들이 쏟아지기도 했다. 팬그래프(Fangraphs) 같은 MLB 통계 사이트는 시스템 교체로 인한 데이터 변화를 파악하지 못한 채 MLBAM이 제공하는 투구 추적 데이터를 그대로 제공했다. 이 때문에 매디슨 범가너와 마크 멜란슨은 지난해보다 시속 2마일이나 구속이 늘어난 것으로 측정됐다.
전후 사정을 몰랐던 많은 이들은 이를 투수의 실력이 좋아진 것으로 보기도 했다. 그러나 얼마 가지 않아 ‘구속이 늘어난 투수들이 한 두 명이 아니’라는 사실이 알려졌다. 현지 중계진 등을 통해 구속 변화에 대한 배경이 알려지면서 논란은 금방 사그라들었다.
Q) 새로운 구종이 추가됐다? – A) 그럴 수도 있고, 아닐 수도 있다
스탯캐스트로 시스템이 바뀌면서 구종을 분류하는 알고리즘에도 변경이 있던 것으로 보인다. 메이저리그 한 경기에서는 200개가 넘는 투구가 나온다. 하루에 15경기를 진행한다면 레이더가 포착하는 공의 개수만 3천 개가 넘으니, 1년 162경기를 모두 진행한다면 한 시즌에만 50만 개가 넘는 데이터가 거뜬히 모인다.
50만 개가 넘는 공의 구종을 일일이 사람의 손으로 분류할 수는 없는 법이다(불가능하지는 않지만 매우 비효율적이다). 때문에, 구종 분류는 구속과 무브먼트 수치에 따라 컴퓨터 프로그램이 자동으로 하도록 되어 있다. 물론 이러한 분류 기준은 사람이 작성한다.
프로그램에 오류가 있거나 변경 사항이 있는 경우 개정이 이뤄진다. 이 과정에서 과거 투수가 던지지 않던 구종이 데이터에 추가되는 경우도 있다. 구속과 무브먼트는 거의 같은데 분류 기준이 바뀌면서 다른 이름이 붙는 것이다. 커브가 슬라이더로 바뀌거나 투심 패스트볼이 포심 패스트볼로 바뀌는 경우인데, 올해 보스턴 레드삭스로 이적한 선발 투수 크리스 세일이 대표적인 사례다.
세일은 사이드암에 가까운 스리쿼터 동작으로 공을 던진다. 낮은 팔 각도 탓에 그가 던지는 패스트볼은 모두 오버핸드 투수의 투심 패스트볼처럼 움직인다. 이 때문에 지난해까지는 대부분의 패스트볼이 투심으로 분류됐다. 그러나 올해부터는 패스트볼 중 70% 정도가 포심으로 분류되기 시작했다.
겉으로는 세일이 새롭게 포심 패스트볼을 장착한 것처럼 보인다. 올해 세일이 던지는 포심과 투심은 구속, 무브먼트 면에서 차이가 확실하다. 평균 구속은 시속 2마일 가까이 차이가 나고, 수직 무브먼트는 0.57피트(약 17cm) 정도 차이를 보인다. 지난해 던진 투심 패스트볼과의 차이도 확실하다.
크리스 세일의 2016년 & 2017년 패스트볼 데이터.
그러나 포심과 투심을 모두 합해 ‘패스트볼’로 묶으면 지난해 데이터와 차이가 줄어든다. 구속과 수직 무브먼트에 약간의 차이가 있지만 포심-투심으로 명확히 가르기는 어려워 보인다. 지난해와 올해 던진 패스트볼의 수직 무브먼트 산포도를 보면 이런 의심이 더 커진다. 포심-투심을 가를 뚜렷한 경계가 보이지 않기 때문이다.
세일의 패스트볼을 시각화한 자료.
위 그림에서 왼쪽은 세일의 2016년 패스트볼을, 오른쪽은 2017년 패스트볼을 나타낸 차트다. 차트에서 붉은 색은 투심, 푸른 색은 포심이며 구속이 높을수록 점이 굵다. 2017년의 데이터를 보면 대체로 구속이 빠르고 수직 무브먼트가 1피트(12인치)를 넘기는 공들이 포심으로 분류되는 것을 알 수 있다. 여기까지만 보면 스탯캐스트의 분류 기준에 문제가 없어 보이며, 세일이 새로 포심 패스트볼을 던진다고 생각하게 된다.
그러나 왼쪽의 2016년 자료를 보면 이야기가 달라진다. 2016년에도 세일은 수직 무브먼트가 1피트를 넘고, 구속이 시속 95마일에 가까운 패스트볼을 많이 던졌다. 그럼에도 이 공들은 지난해에는 포심 패스트볼로 분류되지 않았다. 결국 2017년부터 새로운 구종 분류 기준이 적용됐을 뿐, 세일은 예전과 같은 공을 던지고 있다고 봐야 한다.
인치(inch)에서 피트(feet)로, 바뀌고 늘어난 무브먼트 값
세일의 패스트볼 차트를 유심히 봤다면 한가지 의문이 들 것이다. 차트 앞에 나온 표에서는 무브먼트의 단위로 인치를 썼는데, 왜 차트에서는 피트를 썼을까?
2017년부터 스탯캐스트에서는 피트 단위로 무브먼트 수치를 제공하고 있다. 그런데 과거 PITCH f/x에서는 피트가 아닌 인치 단위를 썼다. 1피트는 정확하게 12인치이기 때문에, 여기까지는 단순히 12분의 1로 값의 스케일(scale)을 바꾼 사소한 변화로 볼 수 있다. 그런데 데이터와 관련해 더 중요한 변화가 있다. 구속 측정 시점의 변화로 인해 무브먼트 값도 PITCH f/x 시절과 크기가 미묘하게 달라진 것이다.
앞서 설명한대로 올해부터는 PITCH f/x 시스템을 쓸 때보다 더 투수 손에 가까운 지점에서 구속을 측정하고 있다. 그런데 트랙맨 레이더는 이 지점에서 구속뿐 아니라 투구의 최초 궤적도 측정한다. 조금 일찍 공의 방향을 측정하게 되면서, 초기에 예상한 공의 도착 지점과 실제 도착 지점 사이에 더 많은 차이가 생기게 된다.
42피트 지점에서 측정한 예상 궤적(초록색), 55피트 지점에서 측정한 예상 궤적(붉은색), 실제 투구 궤적(파란색). (이미지=tangotier.com)
PITCH f/x 시스템은 공의 궤적을 홈플레이트에서 42피트 떨어진 지점에서 처음 측정한다. 스탯캐스트 시스템과는 대략 13피트 정도 차이가 있다. 톰 탱고에 따르면 이 차이 때문에 PITCH f/x 시스템에서 측정한 것보다 무브먼트 값이 1.6~1.7배 정도 더 커지게 된다고 한다. 스트라이드를 더 길게 하는 투수일수록 스탯캐스트 레이더의 측정지점과 예전 PITCH f/x의 측정지점이 가까워지기 때문에 이 차이는 더 줄어들게 된다.
현재 스탯캐스트 데이터를 대중에 제공하고 있는 베이스볼 서번트(Baseball Savant) 사이트에는 이미 이러한 변화가 적용되어 있다. 예를 들어 클레이튼 커쇼의 포심 패스트볼 수직 무브먼트는 현재 스탯캐스트 데이터에서 평균 약 61cm로 표시되고 있다. 하지만 과거 PITCH f/x 시절에는 약 36cm 정도로 표시됐다. 스탯캐스트로 전환되면서 어떤 변화가 있었는지 알려지지 않았다면, 커쇼가 1년 사이에 직구를 20cm나 솟구치게 했다는 말도 안되는 루머가 떠돌았을 것이다.
◎ 참조
- Fangraphs
- Baseball Savant
- “All about these velocity spikes“, Dave Cameron, Fangraphs, 2017.04.04
- “Pitch velocity: new measurement process, new data points“, Tom Tango, Tangotiger blog, 2017.04.05
- “Statcast Break on pitches“, Tom Tango, Tangotiger blog, 2017.04.24
댓글 남기기