(사진=두런두런(두산베어스), 크리에이티브 커먼즈 저작자표시-변경금지 4.0 국제 라이선스에 따름)
[야구공작소 박기태] 근 1년간 KBO리그의 프레이밍 득점을 계산하면서 추후 해결 과제 1순위를 다퉜던 질문은 이것이었다.
‘과연 유희관이 프레이밍 점수를 얼마나 높여놓았을까?’
유희관이 스트라이크 판정에 무슨 영향을 어떤 식으로 주고 있는가? 이 질문을 논하려는 것은 아니다. 하지만 유희관이 ‘스트라이크 판정에 대한 논란을 야기하는 투수’, 그 대명사가 된 것만은 자명하다는 게 필자의 생각이다. 그래서 유희관의 이름을 빌려 하고 싶은 질문은 이것이다.
‘포수의 프레이밍 득점에 투수가 미치는 영향은 어느 정도일까?’
OOO가(이) 있는 날과 없는 날의 차이를 느껴보세요
<더 북>으로 21세기 세이버메트리션의 대부가 된 톰 탱고는 야구 통계에 대한 수많은 질문을 파고들었다. 그는 특정 포수의 수비력을 평가하기 위해 한 방법을 고안해냈다. 팀의 폭투와 포일 개수를 그 포수가 출장했을 때와 그렇지 않을 때, 2가지 경우로 나눠서 집계해 그 선수의 영향력을 계산한 것이다.
탱고는 이렇게 한 가지 변수(혹은 조건)에 해당할 때와 그렇지 않을 때의 2가지 기록을 비교해 그 변수의 영향력을 계산하는 방법론을 ‘With Or Without You(약칭 WOWY)’라고 불렀다. WOWY 방식을 통해 그는 명예의 전당에 들어간 유격수 데릭 지터의 수비 실력을 비롯해 다양한 변수와 조건의 영향력을 비교했다.
탱고는 최근 포수의 프레이밍 득점을 WOWY 방식으로 계산해 그 과정을 본인의 블로그에 상세히 기술하기도 했다. 그는 WOWY 방식으로 투수의 영향력, 구장에 따른 차이를 ‘보정’했고 그 결과 팬그래프, 베이스볼 프로스펙터스 등 메이저리그에서 가장 보편적으로 사용되는 프레이밍 득점 값과 근사한 값을 계산해낼 수 있었다.
그래서 중요한 점은, 필자가 그 과정을 본떠 ‘유희관 질문’의 답을 찾아갈 수 있었다는 사실이다.
재미있는 사실은 KBO리그에서도 구장에 따라 스트라이크 판정 확률이 달라지는 경우가 있다는 것이다. 구장이 바뀌면 홈팀에만 영향을 미치는 게 아니라 원정팀의 프레이밍 득점에도 변화가 있었다. 구장별로 트래킹 시스템이 기록한 로케이션이 미묘하게 다르다거나 여러 원인을 떠올릴 수 있겠지만 어느 것도 명확하지는 않다. 어찌 됐든 이런 ‘편차’도 보정 대상으로 보고 계산 과정에 포함했다.
자잘한 계산 하나 더 – 볼카운트
투수와 구장에 따른 영향을 보정(혹은 중립화)하기에 앞서, 추가로 한 가지 변경을 고려했다. 볼카운트에 따라 프레이밍 성공/실패시 점수를 차등 배점하는 대신 동일한 점수를 매기는 것이다.
볼카운트에 따라서 볼을 스트라이크로 바꿨을 때 얻는 득점 가치는 0.09점(0볼 0스트라이크)부터 0.7점(3볼 2스트라이크)까지 거의 8배 정도의 차이가 있다(한편 전체 평균값을 구해보면 볼을 스트라이크로 바꿀 때 얻는 득점 가치는 대략 0.11점 정도로 계산된다). 그런데 이러한 상황은 포수가 원하는 대로 조절할 수 없어서, 상황에 따른 점수 배분은 포수의 실력과 무관한 계산 결과를 낳을 수 있다.
물론 반대로 생각해볼 여지도 있다. 스트라이크 존의 넓이, 코스에 따른 스트라이크 판정 확률은 볼카운트에 따라 달라진다. 메이저리그에서 0볼 2스트라이크일 때 존이 좁아지고 3볼 0스트라이크일 때 존이 넓어진다는 사실은 익히 알려져 있다. KBO리그 역시 같은 경향을 보인다. 따라서 달라진 존 넓이에 맞춰 프레이밍 해내는 것도 포수의 능력이라고 주장하는 것도 가능하다.
어느 쪽 방식이 포수의 실력을 정확하게 정량화할 수 있는지 명확한 답은 없다. 팬그래프와 베이스볼 프로스펙터스의 경우, 볼카운트를 스트라이크 판정 확률 모델의 변수로 삼는다. 대신 볼카운트에 무관하게 모든 공에 대해 같은 득점 가치를 매긴다(앞선 설명을 따르면 프레이밍 성공/실패시 일정하게 ±0.11점을 매긴다). 적절한 타협안이라고 볼 수 있기에 이번 모델부터 이 방식을 차용하기로 했다.
이렇게 매 공에 같은 점수를 매기고, 스트라이크 판정 확률 가중치를 곱한 뒤(스트라이크 확률이 낮을 수록 프레이밍 성공시 높은 점수가 매겨진다), 계산한 결과에 투수/구장 영향을 보정하면 최종 결과가 나온다.
그래서 결론은…
그렇게 다듬은 모델의 계산 결과는 이러했다.
● fRun1과 fRun2는 작년 12월, 2018년 프레이밍 득점을 구했을 때와 거의 같은 방식을 사용한 것이다. 지난해와의 차이점은 볼카운트에 무관하게 성공/실패에 같은 점수(대략 0.11점)를 매겼다는 것이다.
● 맨 위에 노란색 바탕으로 강조한 fRun3은 fRun1에 투수와 구장에 따른 영향을 보정한 것이다. 즉, 도입부에 언급한 ‘유희관 효과’를 일차적으로 중립화한 결과물이다.
● 그 옆의 fRun4는 fRun2에 투수/구장 영향을 보정한 것이다. fRun3에서 스트라이크 판정 확률에 따른 가중치만 추가한 것과 같다.
‘최종 버전’은 fRun4지만, 어떤 변수를 고려하느냐에 따라서 선수별로 점수가 바뀌는 과정을 살펴보기 위해 중간 결과에 해당하는 점수도 표에 넣었다.
결론부터 말해 투수와 구장 영향을 보정했을 때 가장 점수가 낮아진 선수는 한승택이었다. 점수가 낮아졌다는 말인즉슨 투수, 구장 환경 덕에 프레이밍에서 이득을 본 경향이 있다는 뜻이다. 선수 본인에겐 억울할지 모르지만 어찌 됐든 결과가 그렇게 나왔다. 이 밖에도 안중열, 이해창, 나종덕 등이 보정했을 때 미세하게 점수가 낮아졌다.
반대로 점수가 높아진 선수는 최재훈, 박동원, 박세혁 등이 있었다. 이들은 종합적으로 투수, 구장 환경 때문에 점수를 잃은 경우로 볼 수 있다. 이 중 최재훈과 박세혁은 모든 계산 방식에서 상위권에 이름을 올려놓았다. 과거 계산 결과도 이들에게 호의적이었으니 검증된 프레이밍 고수라 할 수 있다.
특히 박세혁의 기록을 주목해볼 만하다. 필자는 프레이밍 득점 계산 결과를 본 세간의 반응에서 ‘유희관 덕분에 두산 포수들이 이득을 봤을 것이다’라는 내용을 심심치 않게 찾을 수 있었다. 그래서 이번 보정 작업을 거치면서 박세혁의 점수가 어떻게 바뀔지 궁금했던 것이 사실이다.
보정치를 계산해본 결과, 실제로 유희관과 합을 맞췄을 때 포수들이 꽤 호의적인 판정을 받았던 것으로 드러났다. 유희관을 비롯해 상위권 중에는 넉넉한 판정을 받기로 유명한 베테랑 투수의 이름도 있었다. 그런데 이런 점을 반영했음에도 박세혁의 득점 값이 상승했다는 사실에서 그만큼 박세혁의 프레이밍 기술이 매우 뛰어나다는 걸 알 수 있다.
결론. 박세혁의 프레이밍은 ‘유희관 빨’이 아니다.
추신 – 새롭게 계산한 2017 & 2018 프레이밍 득점 결과
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
댓글 남기기