4대 2로 앞선 5회말. 1사 1,2루의 위기에서 양키스 감독 애런 분은 또 한 번 투수 교체를 결심한다. 우완 투수 알버트 어브레이유의 뒤를 이어 마운드에 오른 건 좌완 조엘리 로드리게스. 얼마 전 트레이드로 양키스 옷을 입은, 특출나지 않은 불펜 투수다. 타석에는 작년 MVP를 수상한 프레디 프리먼.
해설을 맡은 폴 오닐은, 좌타자 프리먼이 그의 커리어에서 우투수를 상대했을 때는 .308의 타율을 기록한 반면 좌투수를 상대로는 .268인 부분을 언급한다. 장타율은 거의 1할의 차이가 난다는 점도 덧붙인다. 오닐은 이렇게 표현한다. “애런 분이 여기서 주사위를 굴립니다.” 좌투수가 좌타자를 잘 잡는 건 비밀은 아니다. 리그를 대표하는 강타자 프리먼에 비하면 부족한 커리어를 보내고 있는 로드리게스지만, 좌투수답게 좌타자를 잘 잡는 편이다. 커리어 내내 그랬다. 특히 올해 좌타자 상대 전적은 더 눈에 띈다. 애런 분의 선택이 합리적으로 보인다.
초구는 96마일의 빠른 공. 원바운드로 낮게 들어오고 만다. 2구는 바깥쪽 빠른 공. 헛스윙. 3구 역시 빠른 공. 가운데로 몰렸지만 파울이다. 4구도 빠른 공이다. 다시 한번 파울. 포수가 잠시 마운드를 방문한다. 뒤이은 5구. 역시 빠른 공이 들어온다. 프리먼을 상대로 빠른 공뿐이라니!
다음 타자는 우타자 오스틴 라일리. 올 시즌 성적으로만 본다면 프리먼보다 더 무서운 타자다. 2020년에 새로 도입된 최소 3타자 상대 규정에 따라 로드리게스를 바꿀 수는 없다. 바꿔 말하면 분은 라일리를 상대해야 함을 알면서도 로드리게스를 올린 것이다. 로드리게스의 우타자 상대 성적이 신통치 않음에도 불구하고 말이다. 맷 블레이크 투수코치가 올라와서 긴 시간 얘기를 나눈다.
방송국 자막에 올시즌 라일리의 스플릿 성적이 나온다. 우타자인데도 좌투수 상대 성적이 안 좋다. 메이저리그에서 17년간 활약하기도 했던 오닐은 이런 경우 대개 체인지업에 약한 거라고 얘기한다. 실제로 라일리는 올해뿐 아니라 커리어 내내 좌투수를 상대로 고전했다.
초구에 체인지업이 들어온다. 헛스윙. 양키스 배터리는 2구도 체인지업을 선택하지만, 스트라이크 존을 살짝 벗어난다. 1스트라이크 1볼에서 들어온 3구도 체인지업. 헛스윙. 캐스터가 “뷰티풀 체인지업”이라고 칭찬한다. 오닐이 얘기한다. “여기서 몸쪽 빠른 공을 하나 보여줄지, 잘 들어가고 있는 체인지업을 고수할지 관건이네요.” 4구가 들어온다. 다시 체인지업이다.
야구를 더욱더 재밌게 만드는 건 이처럼 끝없는 가위바위보 싸움이다. 투수 교체를 언제 어떻게 가져갈지, 대타를 언제 낼지는 물론이고 타석 내에서도 어떤 공을 어디에 던질지 끊임없는 머리싸움이 벌어진다. 이 중에서도 볼배합의 가치를 정량화하려는 연구는 상대적으로 부족하다고 생각한다. 그나마 요즘 피치 터널링이 다시 주목을 받으면서 하이 패스트볼을 던진 바로 다음에 커브를 던졌을 때의 성적을 본다든가 하는 이런 유형의 연구도 다시 조명을 받는 것 같다. 하지만 볼배합을 연구하는 것은 굉장히 어렵다.
데이터의 홍수 시대 속에서 우리는 이제 영화를 본다거나 저녁식사 메뉴를 고를 때 다른 사람들이 준 평점을 이용하는 게 너무나도 자연스럽다. 이는 그 평점을 준 사람들이 나와 아예 똑같은 취향을 가졌기 때문은 아니다. 그 데이터가 가치가 있는 것은, 충분히 많은 데이터가 쌓일수록 재밌는 영화와 맛있는 음식은 일반적으로 좋은 점수를 받기 때문이다. 충분히 많은 데이터가 쌓일수록 잘 치는 타자와 잘 던지는 투수의 성적이 좋게 나오는 것처럼. 30대 이상 남자들이 선호하는 – 이런 식으로 조금 더 자세히 들어가면 좀 더 나와 어울리는 취향의 선택을 할 수 있다. 다만 데이터를 너무 쪼개고 쪼개는 것은 경계해야 한다. 나와 같은 프로필을 가졌다는 이유만으로 “서울시 금천구에 사는 30대 남자 홍 씨”가 준 평점 단 하나에 오늘 저녁 메뉴를 고르겠는가?
요즘에는 기계학습과 빅데이터 처리 기술의 비약적인 발전으로 “이런 영화들을 좋아하는 사람은 이런 영화를 좋아하더라“라는 정보도 이용할 수 있다. 그 기술의 핵심은 관련 있는 것과 없는 것의 구별에 있다고 본다. 타자가 어느 쪽 타석에 들어서는 것과 투수가 공을 던지는 손은 딱 봐도 관련이 있어 보인다. 100년이 넘게 진행된 야구를 통해 경험적으로 체감된 부분도 있다. 타자와 투수의 성이 무슨 글자로 시작하는지는 아마도 상관이 없을 것이다. 대부분의 데이터 분석은 이렇게 명확히 상관있는 것과 명확히 없는 것보다는 그 중간의 어딘가에서, 상관이 있을지 없을지를 따져보는 데에 시간을 할애한다.
가끔은 두 가지 정보가 상충하기도 한다. 로드리게스가 프리먼을 상대하는 경우에는 타자 입장에서 본 데이터와 투수 입장에서 본 데이터 모두 좌완 로드리게스에게 웃어주지만, 라일리를 상대하는 경우에 있어 로드리게스가 우타자에 더 약했음에도, 라일리가 좌투수를 제대로 공략하지 못해왔음에 더 주목했다. 서로 다른 얘기를 하는 데이터 중 어느 것이 더 믿을만한지 따져보고 어느 것을 취할지 선택하는 것 역시 데이터 분석의 영역이다.
빠른 공이 좋다고 다섯 개, 체인지업이 좋다고 네 개 연속 던지는 건 어떨까. 점심으로 짜장면을 먹은 사람이 저녁 메뉴를 고를 때 중식당의 평점은 조금 감안해서 봐야 하는 것은 아닐까? 하지만 “빠른 공을 다섯 개 던졌을 때의 성적”을 보기에는 샘플 사이즈가 충분하지 않다면? 바로 전에 던졌던 공은 아마 어느 정도 상관이 있겠지만, 5구의 타격 성적을 예측할 때 초구에 무슨 공을 던졌는지는 어떤 의미가 있을까? 위에서 언급했듯이 이래서 볼배합 연구가 어렵다. 그리고 그래서 재밌다.
결과는 중요하지 않다. 이 글에서도 일부러 두 타석의 결과를 쓰지 않았다. 미래를 예측하는 것은 미리 정해진 정답을 기준으로 시험지를 “채점”하는 것과는 다르다. 대신 확률에 기반한 프로세스는 52%의 동전을 던지는 걸 목표로 한다. 다들 50%가 앞이 나오는 동전을 던질 때 내 동전은 52%의 경우에 앞이 나온다면, 결국 앞이 많이 나오는 건 나일거라는 믿음. 물론 설정한 확률이 맞는지에 대한 끊임없는 확인은 필수다. 52%인 줄 알고 던졌던 동전이 48%면 안 되니까. 대신 한두 타석의 결과로는 그 과정을 확인할 수 없다. 동전을 한 번 던지고서는 “52%라면서 왜 뒤가 나와?”라고 하는 것은 어리석은 일이 아닌가.
야구공작소 홍기훈 칼럼니스트
에디터 = 야구공작소 전언수
기록 출처 = YES network 중계 방송
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
댓글 남기기