[야구공작소 홍기훈] 1949년, 커브가 눈속임이 아니라 실제로 공이 휜다는 것이 밝혀진[1] 이후 긴 시간이 흘렀다. 투수들은 더 효과적인 투구를 위해 여러 구종을 연마한다. 선발 투수로 성공하기 위해선 최소 세 가지의 구종을 던질 줄 알아야 한다는 얘기도 있다. 지피지기면 백전백승이라. 이를 상대하는 타자들은 어떤 공이 올지 대비하기 위해 구종을 분류, 분석한다. 하지만 구종분류라는 것은 생각처럼 만만하지 않다. 과학science이라기보단 예술art의 영역에 가깝다. 주관적인 요소를 배제하기 어렵고, 버튼을 누르는 대로 공이 나가는 게임처럼 딱 떨어지는 것도 아니다.
수십 년이 넘는 기간 동안 구종분류는 대개 수작업으로 이뤄져 왔다. 머신러닝(Machine Learning, 기계 학습)과 여러 빅데이터 처리 기술이 발전된 현재에도 이는 크게 달라지지 않았다. 야구와 관련된 전문 지식이 없는 머신러닝 전문가는 수십만 개의 공을 클러스터링[2]하면 구종 분류가 가능하다고 믿을 수도 있다. 하지만 이는 현실과 거리가 있다. 그 공을 누가 던졌는지가 중요하기 때문이다. 투수를 고려하지 않은 클러스터링은 의미가 없다. 노아 신더가드와 카일 헨드릭스의 체인지업은 던지는 투수의 이름을 지우고 보면 전혀 닮지 않았다. 평균 구속이 145km/h에 달하는 신더가드의 체인지업은 헨드릭스가 던지는 패스트볼보다도 빠르다. 하지만 두 투수의 체인지업은 각자의 패스트볼보다 13km/h 정도 느리고, 그러기에 의미가 있다. 그렇다고 투수별로 구종분류를 하게 되면 표본 크기가 크게 줄어들게 되고, 머신러닝이 굳이 필요하지 않다.
과일을 색으로만 분류한다고 가정해보자. 딸기와 사과가 포함되는 빨간색 과일이 있고, 바나나와 참외가 속한 노란색 과일이 있다. 귤은 그 중간인 주황색 과일로 부를 수 있을 것이다. 그렇다면 빨간색도 주황색도 아닌 자두는 어느 쪽에 넣어야 할까? 망고는? 구종분류도 비슷하다. 사람들은 슬라이더와 커브의 중간인 슬러브라는 표현을 만들어냈다. 하지만 슬러브 중에서도 커브에 가깝거나, 슬라이더에 가까운 공이 있을 것이다. 커터는 무브먼트를 보면 슬라이더와 포심 패스트볼 사이에 존재하는데, 어디서부터 커터고 어디서부터 슬라이더라고 불러야 할까?
구종분류를 더욱 어렵게 하는 것은 그 기준이 무브먼트뿐이 아니라는 점이다. 패스트볼(fastball)은 그 이름에서 알 수 있듯 구속을 기준으로 붙은 이름이다. 포심(4-seam) 패스트볼과 투심(2-seam) 패스트볼은 그립에 따라 구분된다. 그에 반해 우투수 기준 좌타자 몸쪽으로 파고드는 커터나 바깥쪽으로 떨어지는 싱커는 각각 cut, sink에서 따온 이름이다. 둘 다 무브먼트에서 착안했다. 그렇다면 공을 포심 패스트볼처럼 잡고 던졌는데 좌타자 몸쪽으로 휜다면 그 공은 뭐로 불러야 할까? 투심 패스트볼처럼 잡고 던졌는데 떨어지는 공은 투심인가 싱커인가? 변화구도 마찬가지다. ‘벌렸죠? 스플리터에요’라는 유행어에 나오는 스플리터는 공을 어떻게 잡고 던지는지를 뜻하는 그립에서 따온 이름이다. 반면 공이 미끄러지듯 꺾여 나가는 slide에서 착안한 슬라이더나 큰 각을 이루며 휘는 curve에서 따온 커브는 공의 무브먼트가 기준이다.
같은 구종을 던지려는 의도가 있더라도 결과물이 다르다면 어떨까? 아무리 그립을 일정하게 가져간다고 해도 구속이나 무브먼트는 다른 경우가 있다. 예를 들어 어떤 투수들은 스트라이크를 꼭 잡아야 하는 3볼 0스트라이크 상황이나 경기 초반에 체력 안배가 필요한 상황에 약간 느린 포심 패스트볼을 던지기도 한다. 이런 공을 모두 패스트볼로 분류한다면 그 선수의 패스트볼 평균 구속은 실제 그 선수의 능력치보다 약간 낮아질 것이다. 그렇다고 임의로 ‘140km/h 이상은 패스트볼, 그 이하는 체인지업’이라고 분류할 수도 없다. 투수별로 그 분류선을 따로 정해야 하는 것은 차치하고라도, 더 큰 본질적인 문제가 있다. 이 방법으로는 어떤 투수가 구속이 떨어지는 것을 알기가 어렵다. 실제로 클레이튼 커쇼의 패스트볼 구속이 예년에 비해 큰 폭으로 떨어졌을 때 패스트볼이 다른 구종으로 찍히는 경우가 있었다.
마지막으로 한 가지 더. 어떤 투수가 슬라이더를 던질 때 열에 일곱은 기가 막히게 휘어 들어가는데 나머지 셋은 밋밋한 공이 들어간다고 가정해보자. 공의 무브먼트로 값을 구종을 분류하면 일곱 개는 슬라이더로 분류가 되겠지만 나머지 셋은 기껏해야 체인지업이나 패스트볼로 구분될 것이다. 그렇다면 ‘슬라이더 피안타율’ 나 ‘슬라이더 헛스윙률’에 큰 의미가 있을까? 절체절명의 위기에서 이 투수의 슬라이더 헛스윙률이 좋기 때문에 슬라이더를 던지라고 주문할 수 있을까? 최소한 구단 내부에서는 배터리가 요구한 의도를 갖고 구종분류를 할 필요성이 있다. 이는 다른 구단이 가질 수 없는 소중한 데이터 자산이 된다.
5월 4일 사직에서 열린 SK와 롯데의 경기 8회말. SK 김태훈이 던진 공이 롯데 강로한의 머리를 향했다. 아찔한 순간이었다. 문자중계엔 143km/h 투심 패스트볼이라고 찍혔다. KBO규정에 따르면 직구가 타자의 머리 쪽으로 날아와 맞거나 스쳤을 때는 고의 여부와 상관없이 투수를 퇴장 조치한다. 하지만 김태훈은 퇴장당하지 않았다. 심판진이 ‘체인지업성 변화구’라고 판단했기 때문이다. 반면 5월 11일 수원에서 열린 키움과 kt의 경기에서는 키움의 요키시가 던진 139km/h의 투심이 kt 강백호의 헬멧을 맞혔고, 요키시는 퇴장당했다.
반문하고 싶다. 대체 무슨 기준으로 김태훈의 공은 체인지업으로 판단했고 요키시의 공은 패스트볼이라고 판단했는지, 그 규정에 구종분류가 대체 얼마나 중요하길래 그런 결론을 내렸는지. 구종분류의 어려움으로 인해 이랬다가 저랬다가 할 수는 없는 노릇 아닌가. 핵심은 투심 패스트볼이 직구인지 변화구인지가 아니다. 타자의 안전을 위해 만든 규정이다. 변화구라고 해도 빠른 공이 머리를 향하는 것은 위험하다. 규정의 개선이 시급하다.
에디터 = 조예은
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
[1] http://www.phschool.com/science/science_news/articles/pitching_science.html
[2] 주어진 데이터들의 특성을 고려해 데이터 집단을 정의하고 데이터 집단의 대표할 수 있는 대표점을 찾는 것으로 데이터 마이닝의 한 방법이다. https://ko.wikipedia.org/wiki/클러스터_분석
댓글 남기기