[야구공작소 박광영]사이영상(Cy Young Award)이란 MLB에서 한 시즌 동안 최고의 활약을 펼친 투수에게 주는 상을 일컫는다. 전설적인 투수 ‘사이 영’의 이름을 딴 이 상은 투수에게 있어, 곧 최고의 명예라 할 수 있다.
각 리그 최고의 투수 오직 한 명만을 뽑기 때문에 선수는 물론, 일반 팬들도 이에 큰 관심을 두는 것이 당연하다. 이는 세이버메트릭스계에서도 마찬가지다. 그에 따라 빌 제임스는 사이영상 수상자를 예측하는 모델, 이른바 ‘사이 영 포인트(Cy Young Point)’를 고안했다. 투수의 이닝, 자책점, 탈삼진, 승, 패, 세이브, 완봉 횟수, 소속팀의 성적 등을 바탕으로 한 이 식은 사이영상 경쟁에 관심이 많은 팬에게 하나의 흥미로운 볼거리를 제공해준다.
<사이 영 포인트(빌 제임스)>
((5/9*이닝)-자책점) + 탈삼진/12 + 2.5*세이브 + 완봉 횟수 + 6*승 -2*패
*소속팀이 지구 우승할 경우 +12점 추가
한국에도 종합적으로 최고인 투수에게 주어지는 상이 있다. 바로 골든글러브다. 수비력만을 기리기 위해 만들어진 MLB의 골드 글러브와 달리 KBO리그는 모든 면을 종합했을 때 최고의 선수를 포지션별로 선정한다. 따라서 골든글러브 투수 부문 수상자는 해당 시즌 종합적으로 가장 뛰어났던 투수임을 뜻한다.
MLB의 사이영상과 KBO리그의 투수 골든글러브. 명칭은 다르지만, 투표를 통해 리그 최고의 투수를 선정한다는 면에서 둘은 같다. 그렇다면 MLB에 사이영상을 예측하는 모델이 있듯, KBO리그에서도 투수 골든글러브를 예측하는 모델을 만들 수 있지 않을까? 이 글은 모델을 수립하고 실제 결과와 비교해 검증해보며, 마지막에는 모델의 미래까지 사유해보고자 한다.
모델을 수립하다
투수 골든글러브 투표에는 여러 가지 요소가 개입된다. 대표적인 요소들로는 시즌 성적과 평균자책점, 이닝, 탈삼진, 승, 홀드, 세이브 등이 있다. 이들은 모두 숫자로 표현되기에 ‘객관적’이라고 일컬어지지만, 각각의 요소를 개인별로 중요시하는 정도가 달라 논란이 벌어지곤 한다. 예를 들어 투수의 평균자책점을 중요시하는 사람이 있는 한편, 승 수에 더 많은 가중치를 두는 사람도 있다. 특정 부문에서의 1위 여부, 즉 ‘타이틀’ 또한 특별함을 인정받아 많은 기사에서 일컬어진다.
이에 더해 우리는 시즌 성적 외에 고려되는 요소들도 존재함을 알고 있다. 공개적으로 혹은 암묵적으로 투표에 영향을 미친다고 알려진 것에는 우선 소속팀의 성적이 있다. 투수 개인의 성과를 넘어 그 투수가 팀의 우승이나 최소한 가을야구 행을 이끌었다면, 그 공로를 인정해주자는 논리다. 선수의 국적 또한 표심을 좌우한다고 의심받는 요소다. ‘팔은 안으로 굽는다’라는 속담처럼 비슷한 성적이라도 한국인 선수에 비해 외국인 선수에게는 엄격한 잣대가 적용된다는 주장이다.
우리가 찾는 모델은 다음과 같은 과정을 통해 완성된다. 우선 앞서 언급된 요소를 모두 넣은 모델을 세운다. 이 초기 모델에는 평균자책점/이닝/승/세이브/탈삼진부터 시작해 각종 타이틀(평균자책점 1위, 탈삼진 1위, 그리고 다승 1위), 소속팀의 시즌 및 포스트시즌 성적, 그리고 골든글러브 수상에 영향을 미친다고 의심되는 국적까지 총 11개의 변수가 어우러져 있다. 이후 굳이 없어도 상관없는 값들을 모델에서 차례차례 제거한다. 일련의 과정을 반복하면 유의미한 값들만 남아있는 간단한 모델이 아래와 같이 탄생한다. 최근 경향을 반영하기 위해 데이터는 전체 대신 2001년부터 2017년까지, 5% 이상 득표한 후보들을 대상으로 활용하였다.
<투수 골글 포인트(가제)>
5*승 + 0.5*세이브 – 13.5*평균자책점
모델을 검증하다
처음에 유의미할 것으로 생각했던 11개의 변수에서 무려 8개 변수가 제거된 만큼, 위 모델을 선뜻 믿기는 힘들 것이다. 그러나 제거된 변수들을 살펴보면 변수들이 항상 일관적이지는 않았음을 알 수 있다. 탈삼진은 미국과 비교했을 때 한국에서는 주목도가 떨어진다. 소위 ‘우승 프리미엄’이 항상 존재했다면 2010년 우승팀 SK 소속이었던 김광현(2.37, 17승)은 9.1%보단 높은 득표율을 기록했을 것이다. 이닝이 결정적이었다면 2016년 206.2이닝을 던진 헥터(3.40, 15승)가 단 4.3%에 불과하진 않았을 것이다.
국적의 경우 애매한 면이 있다. 2001년부터 국내 선수들은 비슷한 수준의 외국인 선수들보다 평균 득표율이 약 8% 높았다. 그러나 2007년 리오스가 외국인으로 첫 골든글러브를 수상한 이후만 따지면 국내 선수들의 득표율 우위는 2%로 줄어든다. 또한 타고투저를 맞아 몇몇 특출난 선수들을 제외한 국내 투수들이 고전하는 반면, 외국인 투수들의 활약이 두드러지면서 영향은 더욱 미미해진다. 따라서 미래를 예측하는데 궁극적인 목적이 있는 위 모델에서 제외한다.
물론 위 모델의 예측값이 역대 결과와 정확하게 일치하지는 않는다. 2002년 송진우는 81%의 압도적인 득표율을 기록하며 골든글러브를 수상했지만, 모델은 고작 49.6 포인트만을 예측하며 임창용과 키퍼와 비슷한 수준으로 둔다. 이 차이는 2002시즌에 아시안게임 출전과 KBO리그 통산 최다승 경신이라는 금자탑을 모델이 고려하지 않기 때문이다. 꾸준했지만 화려함은 덜했던 탓에 그동안 골든글러브와 인연이 없었던 그의 경력을 보상하는 측면 또한 실제 투표에는 반영되었을 것이다.
2012년과 2013년 또한 실제 결과와는 어긋난다. 2012년에는 36.5%를 득표한 장원삼이 2%p 차이로 나이트를 앞질렀다. 그러나 모델은 나이트의 우위를 점쳤다. 2013년도 실제 투표에서는 손승락은 30%를 득표하며 배영수와 세든을 각각 5%p 차이로 앞질렀지만, 모델은 세든의 우위를 예측했다. 두 해는 모델에서 배제한 ‘국적’ 관련 변수가 크게 작용한 경우라 할 수 있다.
모델은 변화한다
모델이 실제 결과와 얼마큼 맞는지는 물론 중요하다. 그러나 이 글에서 강조하고 싶은 것은 따로 있다. 바로 모델이란 것은 결코 불변의 진리가 아니라는 점이다.
글 앞부분에서 언급했던 빌 제임스의 모델로 돌아가 보자. 오랜 기간 꽤 정확한 예측을 해온 그의 모델은 2000년대를 넘어서면서 정확도가 점차 떨어진다. ‘사이 영 포인트’ 모델은 2017년 내셔널 리그에서 켄리 젠슨과 클레이튼 커쇼를 우위에 두었지만, 실제로는 맥스 슈어져가 수상한다. 또한 2018년 내셔널 리그의 강력한 사이영상 후보인 제이콥 디그롬을 고작 5위로 평가하고 있다(10월 3일 현재).
이는 미국에서 세이버메트릭스의 보급으로 인해 선수 평가의 측도가 바뀌었기 때문이다. 팬과 기자단은 물론 선수까지도 투수의 승리와 패배, 그리고 세이브에 이전만큼 큰 의미를 두지 않는다. 완봉의 경우 올 시즌 MLB에서 2회를 한 선수가 없을 정도로 드물다. 그에 따라 다른 세이버메트리션 톰 탱고는 2013년에 새로운 모델을 제안한다. 그는 이 모델에서 승리의 중요도를 기존 모델에 비해 83% 축소한다. 세이브, 패배, 그리고 완봉의 경우 아예 계산에서 제외한다. 대신 현대 야구에서 중요하게 생각하는 탈삼진을 20% 더 중요하게 고려한다.
<사이 영 포인트(톰 탱고)>
(이닝/2 – 자책점) + 탈삼진/10 + 승
올해 KBO리그 골든글러브 경쟁에 특히 주목할 만한 이유가 바로 여기 있다. 앞서 살펴본 모델은 후랭코프를 린드블럼보다 근소한 우위에 두고 있다. 후랭코프는 10월 3일 현재 18승으로 다승왕이 유력하다. 린드블럼은 승수 면에서는 15승으로 후랭코프보다 뒤처져있지만, 평균자책점을 비롯해 많은 면에서 후랭코프를 앞서고 있다. 즉 올해 투수 골든글러브는 기자단이 여전히 승리를 중요시할지, 아니면 세이버메트릭스의 영향으로 투구 내용을 보다 중요하게 여길지 알 수 있는 분기점이 될 가능성이 크다. 예측을 목적으로 하는 모델 또한 마찬가지로 변화의 갈림길에 서있다.
(10월 3일 현재)
참조
STATIZ.com
사이 영 포인트(빌 제임스)
사이 영 포인트(톰 탱고)
The death of the shutout – For the first time, no pitcher has more than one
에디터=야구공작소 김혜원
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
댓글 남기기