최근 10타수 6안타를 기록한 타자가 있다고 가정하자. 이 선수가 다음 타수에서 안타를 만들어낼 확률이 얼마나 될까? 60%? 하지만 그 타자가 시즌 내내 2할의 타율을 기록했던 선수라면?
우리는 방송에 나오는 자막으로 선수의 최근 경기 성적을 쉽게 확인할 수 있다. 그리고 보통 최근 경기 성적이 평소보다 낫다면 ‘컨디션이 좋다’고 해석하기 마련이다. 선수도 마찬가지다. 최근 타격 성적이 좋은 선수는 ‘공이 수박만 해 보인다.’, ‘공이 오다가 앞에서 멈춘다.’ 등 본인의 컨디션에 대해 스스럼없이 표현한다.
그러나 컨디션과는 별개로, 특정 선수에게는 성적 기대치가 존재한다. 기대치는 주로 그가 지금까지 보여줬던 성적에서 비롯된다. 컨디션과 기대치는 적절히 결합해 선수 기용에 큰 영향을 준다. 그런데 이런 중요한 부분을 단순히 최근 10타수 6안타, 시즌 타율 0.300 등으로 판가름하고 있지는 않은가?
최근 컨디션의 기준은 무엇일까. 시즌 성적을 근거로 한 기대치는 믿을 만할까? A 선수가 다음 타수에서 안타를 만들어낼지 알고 싶다면, 그 선수의 최근 어느 정도 기간에 초점을 두는 것이 좋을까?
안타를 칠 수 있을까
어떤 선수의 최근 5타수를 보는 것과 500타수를 보는 것은 직관적으로 여러 차이가 있다. 적은 타수만 놓고 보면 운 적인 요소에 따라 타율이 크게 요동친다. 최대한 많은 타수를 보고자 하면 컨디션이라는 개념 자체가 평균에 희석된다.
선수의 최근 몇 타수를 봐야 그의 다음 타수를 정확히 가늠할 수 있을까? 가장 이상적인 중간 점을 확인하기 위해 다음과 같은 방법을 제안한다.
1) 특정 선수의 연속된 n타수 타율을 계산한다.
2) 계산된 타율을 실제 타격 시 안타로 이어질 확률이라고 가정한다.
3) 확률에 맞게 그다음 타수의 안타 여부를 시뮬레이션하고, 실제 안타 여부와 동일한지 비교한다.
4) 리그 전체 선수의 모든 타수를 같은 방법으로 비교한 뒤 예측에 성공한 비율을 구한다.
데이터는 2019년 메이저리그에서 100타수 이상을 소화한 타자들을 대상으로 구성했고 타수를 각각 최근 1타수부터 전체 타수까지 7개 항목으로 나눠 계산했다.
앞서 제안한 방법으로 타수별 안타 예측 정확도를 나타낸 그래프다. 전체적으로 예측에 필요한 타수를 많이 확보하면 확보할수록 정확도가 높아지는 경향을 보였다. 따라서 전체 타수를 사용했을 경우 가장 높은 정확도를 확인할 수 있었다(73.6%).
바로 직전 타수만으로 예측한 경우 정확도가 61.5%로 가장 낮았다. 이후 30타수까지 예측 정확도가 가파르게 상승하는 모습이 눈에 띄었다. 다만 50타수 이상 넘어갈 경우, 전체 타수로 예측했을 때와 그리 큰 차이를 보이지는 않았다. 이와 같은 결과가 뜻하는 바는 무엇일까. 야구에서도 많은 정보량이 누적될수록 더 정확한 예측이 가능하다는 것이다.
물론 야구는 사람이 하고 공은 둥글다. 당일 컨디션에 따라 더 잘할 수도 있고, 못할 수도 있다. 하지만 풀타임 출장하는 선수로 가정해도, 어느 정도 예측력이 높아지는 선은 30타수다. 10경기에 가까운 출장 데이터가 필요하다. 최근과는 거리가 있다.
사실 컨디션이라는 요소를 무시할 만한 결과는 아니다. 그러나 정보가 한정돼 있을 때 누적된 자료를 이용한다면, 컨디션의 효과를 상쇄할 만큼 높은 효율이 발생한다고 판단할 수 있다.
다른 상황이라면
그런데 시즌 중에 발생하는 여러 이유로 잘 공략하던 코스나 구종이 바뀌는 선수가 더러 있다. 그렇다면 로케이션이나 구종에 따라 나누어 본다면 조금 다른 결과가 나오지 않을까?
위 표는 안타 예측 정확도를 상하좌우의 로케이션과 직구, 변화구의 구종으로 분리해 나타낸 결과다. 6개 항목 모두 <그래프1>의 결과와 크게 다르지 않다.
다만 구종에 따른 결과치에 약간의 차이가 보였다. 직구는 다른 항목에 비해 예측력이 다소 떨어졌고, 변화구는 일반적인 때보다 예측력이 뛰어났다. 이는 타자들이 직구보다는 변화구를 상대할 때 좀 더 낮은 타율을 기록하기 때문으로 보인다. 간단한 확률 계산으로도 증명이 되는 부분이다.
아직 모른다
안타를 치고 못 치고는 개인의 상황에 따라 얼마든지 바뀔 수 있다. 하지만 우리는 그 모든 것을 정확히 예상하고 추정할 수 있을 만큼 전지전능하지 못하다. 주어진 조건 안에서 차선책을 찾아가는 게 분석의 묘미가 아닐까 싶다.
다시 처음으로 돌아가 보자. 최근 10타수 6안타인 타자가 있고 그의 시즌 타율은 2할이다. 이 선수는 이번에 안타를 칠 수 있을까, 여러분의 선택은?
기록 출처: Baseball Savant
야구공작소 홍길동 칼럼니스트
에디터 = 야구공작소 조예은
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
고2수행평가하는데 참고해도될까요?