톰 탱고 사이영 상 예측 점수
[야구공작소 홍기훈] 후반기에도 연신 호투를 거듭하고 있는 류현진. 1점대의 평균자책점을 기록하고 있는 그가 사이영 상을 탈 수 있을지에 대한 갑론을박이 뜨겁다. 경쟁자는 전반기에만 181개의 삼진을 잡아낸 맥스 슈어저. 훈련 중 부상으로 코가 부러졌을 때도 투혼의 경기를 펼쳤던 슈어저는 현재 등 부상으로 부상자 명단에 올라 있다.
사이영 상 수상자는 미국 야구 기자 협회의 투표로 결정되는데, 대표적인 세이버메트리션 톰 탱고는 이들의 투표 성향을 분석해 사이영 상 예측 점수를 만들었다. 여기서도 류현진과 슈어저는 엎치락뒤치락을 반복하며 이번 시즌 또다른 화제 거리를 선사해 주고 있다. 하지만 누가 사이영 상을 타게 될지 예측하는 것은 이 글에서 다루고자 하는 소재가 아니다. 아직 시즌은 많이 남았고, 변수도 많다. 두 선수 모두 건강히 멋진 레이스를 보여주길 바란다. 류현진이 2등을 하게 되면 뭐 어떤가. 2등이 부끄러운가?
사이영 상 예측 대신 이 글에서는 FIP (Fielding Independent Pitching, 수비 무관 평균자책점)에 관한 얘기를 하려고 한다. 슈어저와 류현진 중 누가 사이영 상을 탈 것인가에 대한 논쟁은 세이버와 클래식의 전쟁으로까지 번졌다. 특히 류현진보다 평균자책점(ERA, Earned Run Average)이 나쁜 슈어저가 더 높은 WAR을 기록하면서 대체 FIP이 무엇이고, 왜 세이버메트리션들은 ERA보다 FIP를 선호하는가에 대한 궁금증도 늘고 있다. 하지만 세이버메트릭스에 관심이 많은 사람들도 FIP에 대해 오해하고 있는 부분이 분명히 있다. 이 글의 목적은 이러한 오해를 없애는 데에 있다.
FIP는 무엇인가?
보로스 맥크라켄을 비롯한 여러 세이버메트리션들은 팀 플레이인 야구에서 투수를 독립된 하나의 개체로 평가하길 원했다. 그동안 사람들은 각 투수별로 피안타율을 통제하는 능력이 있을 거라고 믿어왔는데, 맥크라켄은 그렇다면 인플레이 타구의 타율(BABIP, Batting Average on Balls In Play)도 투수별로 고유의 값이 있어야하지 않을까 의문을 가졌다.
하지만 의외의 결과가 나왔다. 삼진을 잡는 능력이나 홈런을 억제하는 능력은 각 투수 별로 해마다 일정했던 반면, 인플레이 타구의 타율은 그렇지 못했다. 이 흥미로운 아이디어에 착안한 톰 탱고는 FIP를 만들게 된다. 1990년대말 ~ 2000년대 초의 일이다.
FIP = (13 * 피홈런 + 3 * 허용한 볼넷 수 – 2* 탈삼진) / (이닝) + 상수
위의 식에 언급된 상수는 FIP를 ERA와 비슷한 스케일로 맞춰주기 위한 상수이다. 따라서 두 지표는 각 투수별로 대개 비슷한 수치를 가진다. FIP는 수비 무관 평균자책점으로 주로 번역되는데, 단어에도 있듯이 FIP와 ERA 모두 투수가 평균적으로 얼마나 실점을 허용하는지를 보여주기 위한 지표다. 다만 FIP는 그 실점 중에 투수의 책임이 큰 세 가지 경우만 이용할 뿐이다.
ERA는 이미 일어난 일에 대한 지표, FIP는 가상의 상황에 대한 지표?|
사실이 아니다. 위에서 보듯이 FIP도 실제로 일어난 일에 관한 지표다. ERA가 ‘이닝 대비 자책점 허용률’에 대한 답이라면, FIP는 ‘실제 자책점에 투수의 책임이 가장 큰 홈런과 볼넷을 몇 개나 허용했으며, 삼진은 몇 개나 잡았는가’에 대한 답이라고 할 수 있다. ERA가 실점 중에 야수 실책으로 인한 비자책점을 제외하듯이, FIP도 홈런을 제외한 인플레이 상황을 제외하는 것이다. 박찬호도 어느 인터뷰에서 “땅볼 타구를 유도했는데 안타가 되는 것은 나로서는 어쩔 수 없는 일이다.”라고 이야기하지 않았는가.
FIP와 비슷한 이름의 지표로 xFIP라는 지표가 있는데, x가 들어가는 지표들은 대부분 eXpected, 즉 기대값을 이용해 계산한 지표다. xFIP는 투수의 실제 피홈런 대신 리그 평균 플라이볼당 홈런 개수를 이용한다. 둘을 헷갈려서는 안 되겠다.
FIP와 ERA의 괴리, 어떻게 해석해야 하는가?
가끔 우리는 어떤 투수의 FIP보다 ERA가 낮은 경우 ‘운이 좋다’라거나 혹은 그 차이가 마치 투수의 실력인 것처럼 ‘아이큐 피쳐’라고 부르는 걸 볼 수 있다. ‘언젠가는 FIP로 ERA가 수렴할 것’이라고 얘기하는 사람들도 있다. 어느 정도는 사실이고 어느 정도는 아니기도 하다.
우선 그 ‘괴리’라는 것은 사람들의 인식보다 작다. 8월 8일 현재 내셔널리그에서 FIP 1위를 달리고 있는 셔저의 ERA는 2위며, ERA 1위 류현진의 FIP는 2위다. 현재 류현진의 ERA는 1.53, FIP는 2.85인데 이 격차는 시간이 흐를수록 줄어들 확률이 높다(다만 올 시즌 내에 격차가 다 줄어들긴 현실적으로 어려울 것 같다). ERA가 올라갈 수도 있지만 FIP가 내려갈 수도 있다.
톰 탱고는 FIP와 ERA 중 어느 것을 선호하냐는 질문에, 우선 자책점을 보는 ERA 대신 총 실점을 보는 RA/9를 선호하며, 그 이유로는 뜬공 투수에 비해 땅볼 투수들이 ERA에서 손해를 보기 때문이라고 밝혔다. 나아가서 탱고는 어느 시점까지는 FIP를 선호하지만 충분한 데이터가 쌓이면 RA/9를 선호하며, 그 경계선은 대략 2천 타석에서 5천 타석 사이일 것이라고 추론했다. 상대 타자의 수가 1년에 최대 900이 조금 안 되는 것을 감안하면 한 시즌 내의 성적을 보기에는 ERA보다는 FIP를 선호한다는 뜻으로 해석할 수 있겠다.
FIP가 미래 예측력이 높기 때문에 우월한 지표이다?
FIP가 인기를 얻게 된 것은 ERA보다 연간 상관관계가 높기 때문이다. 바꿔 말하면 올해 FIP와 내년 FIP가 비슷할 확률이, 올해 ERA와 내년 ERA가 비슷할 확률보다 높다는 뜻이다. 그러면서도 계산식까지 간단하다. 탱고는 FIP를 좋아하는 이유로 ‘결과의 30%만 이용해서 90%를 이해할 수 있기 때문’이라고 했다.
하지만 높은 미래 예측력은 부차적인 이득에 불과하다. FIP는 ‘미래 예측력이 높은 지표를 만들어보자’에서가 아니라, ‘이 투수의 현재 시점을 정확하게 평가해보자’에서 출발했다. 각 투수의 고유 능력에 가까운 지표기 때문에 연간 상관관계가 높을 수 밖에 없다. 고유 능력의 대표격인 구속을 예로 들어보자. 아롤디스 채프먼의 빠른공 구속은 올해와 내년이 거의 비슷하지 않겠는가?
세이버 vs 클래식?
세이버메트릭스가 발달하고 새로운 (복잡한)지표들이 자꾸 나올수록 사람들이 착각하는 게 있다. 세이버 지표들은 클래식 지표를 부정하기 위해 나온 것이 아니라 클래식 지표가 놓치고 있는 부분을 보완하기 위해 나온 것이라는 점이다. 세이버메트릭스는 클래식에 반하는 개념이 아니고, 클래식을 도와 기존의 “스카우팅” 혹은 “감”에서 간과하는 부분을 살피는 데에 그 목적이 있다.
물론 다양한 지표를 골고루 보는 것은 좋은 자세지만, 클래식 지표와 세이버 지표를 반반씩 봐야한다는 말은 조금 어폐가 있다. 이는 마치 밭을 갈 때 반은 소가 갈고 반은 트랙터를 써야하는 것처럼 들린다. 수학 계산에 있어 탁상용 계산기와 복잡한 계산을 위해 만들어진 컴퓨터를 반반씩 써야한다는 것과도 비슷하다. 물론 바쁠 때는 손에 잡히는 계산기를 쓸 수 있다. 갖고 있는 컴퓨터가 없을 수도 있다. 하지만 지금 책상에 컴퓨터와 계산기 둘다 있으면서, 컴퓨터에 타이핑하는 시간과 계산기를 누르는 시간에 차이가 없다면? OPS가 자리를 잡은 것, FIP가 인기를 끈 것은 그 간편성에 있다. 간편한데 왜 쓰지 않는가?
물론 세이버 스탯이 완벽한 것은 아니다. 스탯캐스트 같은 새로운 기술이 나오면서 BABIP 이론조차도 완벽하지 않다는 얘기가 나오고 있다. 류현진이 FIP나 다른 세이버 지표들이 나타내는 기록보다 더 뛰어난 투수라고 표현하기 위해서는, 피치 터널 이론이나 노련한 볼배합, 제구력 같은 세이버 지표가 미처 챙기지 못한 부분을 얘기해야지 그 해답이 클래식 지표가 되어서는 곤란하다.
잘한 사람을 줘야 하는가, 잘했어야 하는 사람을 줘야 하는가
이 부분은 각자가 가진 개인적인 생각의 영역에 가깝다. 축구를 예로 들어보자. 메시가 모든 선수를 다 제치고 골이나 다름 없는 패스를 해 줘도 동료가 그 기회를 골로 연결시키지 못하면 의미없다고 생각할 수 있다. 반대로 90분 내내 별다른 움직임을 보이지 못해도 적절한 타이밍에 적절한 위치에서 골을 넣은 선수도 이런 경우가 몇 번 반복된다면 인정해 줘야 한다.
선수 분석이나 평가는 – 구단에서 전문적으로 일하는 사람이든 가볍게 즐기는 팬이든 – 운의 요소를 최대한 배제하고 그 선수 고유의 능력에 집중해야 한다고 믿는다. 다승이 점점 그 의미를 잃어가는 것도 마찬가지다.
끝으로, 좋은 성적을 기록하고 있는 사람이 야구를 잘하는 게 아니라, 야구를 잘하는 사람이 좋은 성적을 찍는 거라는 점을 말하고 싶다. 드래곤볼에서나 나오는 스카우터가(전투력을 측정해준다) 현실에는 존재하지 않기 때문에 우리는 선수의 기록을 토대로 능력을 역으로 추산해야 한다. 물론 표본이 충분하다면 그게 그거긴 하다. 하지만 선후 관계의 문제다.
이 미묘한 선후 관계는 두 선수의 성적이 비슷할 때 중요성이 더 대두된다. 동전으로 예를 들어보자. 앞면이 50% 나오는 동전 A와 49% 나오는 동전 B가 있다고 치자. 한 번씩 던졌을 때 A가 B보다 앞면이 많이 나올 확률은 얼마나 될까? 동률인 경우를 배제하고 계산하면 겨우 51%다. 바꿔 말하면, 어느 동전이 A인지 모르고 앞면이 많이 나온 동전이 어련히 A겠거니라고 추측한다면, 49%의 확률로 틀린다는 얘기다. 물론 동전을 여러 번 던질수록 A가 앞면이 많이 나올 확률이 높아지긴 한다. 천 번쯤 돌린다면 어떨까? 68% 정도가 된다. A와 B의 실제 능력이 거의 대등하다면, ‘앞면이 많이 나오는 게 A’라고 판단하는 것은 여전히 1/3의 경우엔 틀린다는 뜻이다. 그래서 비슷한 성적을 기록한 두 선수를 비교하는 것은 어려우면서도 재밌는 일이다.
이 글이 여러분의 FIP에 대한 오해를 풀 수 있는 기회가 되었기를 바란다. 그리고 류현진과 슈어저의 박진감 넘치는 사이영 상 레이스를 더욱 재밌게 즐길 수 있게 되기를 바란다.
에디터 = 야구공작소 송민구
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
지금보니 정말 류현진 방어율이 fip와 가깝게 맞아 떨어 졌네요