[야구공작소 김남우] 야구에는 다양한 스탯(stat)*들이 존재한다. 기본적으로 활용되는 스탯들만 보아도, 타율과 평균자책점 같은 비율 스탯부터 홈런이나 삼진 같은 누적 스탯까지 그 종류와 범위가 만만치 않다. 야구에서 전통적으로 많이 활용되어 온 이러한 스탯들을 우리는 흔히 ‘클래식 스탯’이라고 부른다. 하지만 이러한 클래식 스탯들은 선수의 가치를 평가하는 데 분명한 한계를 내포하고 있다. 대표적인 것만 꼽아도 두 가지다. 여러 환경적 요인들의 작용으로부터 자유롭지 않다는 점이 첫째이며, 복수의 지표들이 나타내는 기여를 합산해서 보여주지 못한다는 점이 둘째이다. 이러한 한계점들을 극복하고 선수를 최대한 객관적으로 평가할 수 있는 새로운 스탯을 개발하는 연구, 우리는 이를 세이버메트릭스(sabermetrics)라 부른다.
* stat: statistics를 줄인 말로, 한국어의 통계나 지표에 대응하는 단어.
세이버메트릭스 계열의 스탯 가운데 가장 보편적으로 활용되고 있는 스탯은 단연 WAR(Wins Above Replacement Player)이다. 근래 들어서는 TV 중계화면에까지 종종 모습을 비추면서, WAR은 일반적인 팬들 사이에서도 점차 익숙한 얼굴로 자리매김하고 있다. 이처럼 WAR이 널리 보급되고 있는 이유는 분명하다. 그 직관적인 성격 덕분에 이해하기가 아주 용이하기 때문이다. 그러나 복잡한 산출 방식 탓일까. WAR의 구체적인 원리를 파악하고 있는 사람은 아직도 그리 많지 않다.
WAR이란 무엇인가
WAR은 ‘Wins Above Replacement Player’의 약어로, 임의의 선수가 대체선수에 비해서 얼마나 많은 승리에 기여했는지를 보여주는 스탯이다. 그렇다면 대체선수란 정확히 어떤 개념일까. 먼저 간단히 짚어보도록 하겠다.
대체선수의 특성
- 평균 이하의 성적을 기록하는 선수
- 트레이드 시장에서 쉽게 구할 수 있는 선수
- 많이 뛰면 뛸수록 팀 성적에 악영향을 끼치는 선수
대체선수는 일반적으로 위의 특성을 만족시키는 선수들을 지칭한다. 즉, 메이저리그와 마이너리그를 들락날락하는 수준의 선수들이 이에 해당된다. 로스터 전체가 대체선수로 이루어진 팀은 162경기를 치른다고 가정했을 때 약 48승을 거두는 것으로 알려져 있다.
WAR을 산출하는 기본적인 원리는 그리 복잡하지 않다. 야수의 WAR 산출은 아래의 과정을 따라 이루어진다. 일단 타격과 수비, 주루에서의 기여도를 구하고, 포지션 및 대체선수와의 보정을 거쳐 선수가 벌어들인 점수를 합산한 뒤, 이를 1승 단위로 나누어 그 값을 구한다. 투수 역시 비슷하다. 우선 선수가 9이닝마다 몇 점의 실점을 허용할 것인지를 구하고, 그것이 다른 선수들에 비하여 얼만큼의 실점을 더 막아내는 수준인지를 확인한 다음, 보직 및 홈 구장 등에 대한 보정을 거쳐 대체선수와의 승리 기여도 차이를 산출해낸다. 즉, 야수와 투수 모두 대체선수에 비해 얼만큼의 점수를 벌어들였는지를 측정하여 1승을 단위로 표시한다고 생각하면 적절할 것이다.
bWAR? fWAR?
WAR의 구체적인 계산법은 제공하는 플랫폼에 따라 조금씩 차이가 있다. 예컨대 메이저리그의 경우, 가장 보편적으로 활용되는 베이스볼 레퍼런스(baseball-reference.com)의 bWAR*과 팬그래프(fangraphs.com)의 fWAR은 동일한 선수의 기록을 대상으로도 전혀 다른 수치를 나타내는 경우가 대부분이다.
* rWAR이라고도 표기한다.
이는 두 사이트가 WAR을 산출하는 과정에서 활용하는 수비 스탯과 투수 스탯의 종류가 다르기 때문이다. 수비의 경우 bWAR은 DRS(Defensive Runs Saved)를, fWAR은 UZR(Ultimate Zone Rating)을 기준으로 삼는다. DRS와 UZR은 야구장을 수십개의 구역으로 나눠 수비의 다양한 요소와 난이도를 고려해 평가하는 지표지만, 모두 적은 표본 수에 따른 불확실성을 갖고 있다. 한편, 투수의 경우 bWAR은 RA(Runs Allowed: 실점)를, fWAR은 FIP(Fielding Independent Pitching: 수비 무관 평균자책점)를 기반으로 하여 산출된다. 수비의 영향을 받을 수밖에 없는 RA를 활용하는 전자와, 수비를 사실상 배제한 채로 계산하는 후자의 값 사이에는 자연히 차이가 발생할 수밖에 없다.
계산의 구체적인 방식에는 차이가 있지만, bWAR이나 fWAR이나 그 수치가 나타내는 의미는 동일하다. 앞에서 언급했던 것처럼, 대체선수로만 구성된 팀의 예상 승수는 48승이다. 이때, 예를 들어 이 팀의 선수 중 하나가 대체선수가 아닌 마이크 트라웃이었다고 가정해보자. 트라웃이 2016 시즌 기록한 WAR은 bWAR를 기준으로 10.6, fWAR을 기준으로 9.4에 이른다. WAR에서의 1은 1승을 의미하고, 따라서 WAR의 합산이 0이었던 이 ‘대체선수 팀’에 트라웃이 합류하면 팀의 예상 승수는 58승 안팎으로 상승하게 된다. WAR이 지닌 최대의 강점은 승수와 같은 스케일로 제공되기 때문에, 복잡한 계산식을 들여다보지 않고도 직관적으로 이해할 수 있다는 점이다. 타율, 도루, 보살 등의 각각의 스탯을 종합하여 알아보기 쉽게 제시해주는 일종의 ‘종합 성적표’인 셈이다.
WAR로 보는 기대 승수, 그리고 실제 승수
우리는 방금처럼 팀내 전 구성원들의 WAR을 합한 값에 ‘대체선수 팀’의 승수인 48승을 더함으로써 그 팀의 기대 승수를 산출해낼 수 있다. 그리고 이는 실제로 팀이 거둔 승수와 상당히 강한 상관관계를 형성한다.
bWAR을 바탕으로 계산한 2016 시즌의 기대 승수
상단의 표는 올 시즌 메이저리그의 팀들이 기록한 bWAR의 총합과 이에 근거한 기대 승수, 그리고 실제 승수를 나타내고 있다. 예컨대 57.4의 bWAR을 합작한 시카고 컵스의 기대승수는 약 105.4승이었으며, 이는 이들이 실제로 기록한 103승과 별 차이가 없다. 그 다음으로 높은 100.6승의 기대 승수를 기록한 보스턴 레드삭스는 그보다 7.6승이 모자란 93승으로 시즌을 마무리했다.
기대 승수와 실제로 거둔 승수가 가장 큰 차이를 보인 팀은 텍사스 레인저스와 템파베이 레이스였다. 텍사스는 기대보다 11.2승이나 많은 95승을 거두었고, 템파베이는 11.4승이나 적은 68승을 올리는 데 그쳤다. 미네소타 트윈스와 필라델피아 필리스 역시 10승에 육박하는 상당한 차이를 보였다.
fWAR을 바탕으로 계산한 2016 시즌의 기대 승수
위의 표는 fWAR을 통해 계산한 2016 시즌의 기대 승수와 실제 승수를 나열하고 있다. 물론, fWAR 기반의 기대 승수 역시 실제 승수와 상당히 뚜렷한 상관관계를 형성하는 편이다. 그리고 텍사스는 여기서도 독보적인 위치에 있다. 텍사스가 올 시즌 거둔 95승은 fWAR 기반의 기대 승수보다 무려 18.4승이나 많은 기록이다.
앞서 기대 승수와 실제 승수 사이에 큰 격차를 보였던 템파베이와 미네소타 또한 비슷한 추세를 이어갔다. 텍사스를 위시한 이 팀들이 보여주는 기대와 실제의 괴리에는 사실 분명한 이유가 있다. 이들은 1점 차 승부에서 아주 극단적인 성적을 올렸던 팀들이다.
WAR이란 기본적으로 대체선수에 비해 얼마만큼의 득실점을 기록하는지에 근거하고 있는 스탯이다. 때문에 기대 승수가 팀의 전반적인 득실점을 유사하게 예측하더라도, 실제 1점 차 승부에서의 승률이 비상식적인 양상을 띌 경우에는 결과가 사뭇 다른 모습으로 나타나기 마련이다. 올 시즌 기대 승수를 가장 큰 폭으로 뛰어넘은 팀이었던 텍사스는 총 득실에서 고작 +8점을 기록하는 데 그쳤지만, 5할보다 무려 14승이나 많은 95승을 거두는 데 성공했다. 그 원동력은 36승 11패의 경이로운 1점 차 승부 성적에 있었다.
WAR 기대승수와 실제승수의 상관관계(좌측 bWAR, 우측 fWAR)
WAR 기대승수와 피타고리안 기대승수의 상관관계(좌측 bWAR, 우측 fWAR)
같은 맥락에서, WAR에 기반한 기대 승수는 실제 승수보다는 피타고리안 기대 승수와 더 강력한 상관관계를 형성한다. 사실, WAR의 계산식에도 피타고리안 기대 승수의 원리인 피타고리안 공식이 들어간다는 사실을 생각하면 이는 지극히 당연한 귀결이다. 피타고리안 승률 역시, 1점차로 이긴 경기와 큰 점수차로 패한 경기가 많아질수록 실제 승률과의 괴리가 커지게 된다. 텍사스는 피타고리안 승률 기반의 기대 승수마저 WAR 기반과 크게 다르지 않은 13승 차이로 추월하는, 지극히 기묘한 2016년을 보냈다. 이 역시 36승 11패의 1점 차 승부가 불러온 기현상이었다.
한편 WAR 기반의 기대 승수와 실제 승수, 그리고 피타고리안 기대 승수의 상관관계를 구해본 결과, fWAR보다는 bWAR의 상관계수가 더 높은 것으로 나타났다. 이는 fWAR이 투수의 WAR 계산에서 운이라는 요소를 배제했기 때문인 것으로 추측된다.
야수의 WAR은 왜 투수보다 높은가?
WAR에 관한 흥미로운 사실 중 하나는, 야수들이 투수들보다 전반적으로 높은 WAR을 기록한다는 점이다. bWAR을 기준으로 했을 때, 올 시즌 각 구단 야수들의 WAR 총합은 평균 19.8이었고, 투수들의 WAR 총합은 평균 13.7이었다. 평균적으로 야수들이 투수보다 6승 정도를 더 벌어주었다고 볼 수 있다. fWAR로 보아도 비슷하다. 야수들의 평균은 19.0, 투수들의 평균은 14.4로 4승 이상의 차이가 관측되었다. 사실 야수의 WAR이 공격과 수비 모두를 포함한다는 것을 떠올려보면, 어느 정도 당연한 분포인지도 모른다.
허나 투수들의 시즌 이닝은 보직에 따라 다양하게 형성되고, 때문에 가장 많은 이닝을 소화하는 선발투수들의 경우에는 야수들과 비교해도 그 격차가 아주 미미한 편이다. 또한, 적은 이닝을 효과적으로 막아내야 하는 불펜 투수의 경우에는 WAR보다 WPA(Win Probability Added: 승리 확률 합산)라는 스탯이 선수평가의 핵심이 되는 편이다. 이처럼, 기본적으로 다른 역할을 담당하고 있는 야수와 투수를 WAR로 단순하게 비교하기에는 무리가 있다.
종합 성적표, WAR
WAR은 클래식 스탯이 주는 인상과 상당히 다른 결과를 내놓을 때가 있다. 예컨대 평균자책점이 낮은 투수라도 피홈런이 많거나 K/BB가 낮을 경우에는 좋지 않은 WAR을 받아 들기가 십상이다. 타자 또한 BABIP가 높게 형성되었을 경우에는 예상보다 나쁜 WAR을 받아 들 수가 있으며, 같은 공격력에도 수비에서의 공헌에 따라 올스타급 선수와 평범한 주전급 선수로 평이 엇갈리기도 한다.
WAR에 대한 비판은 보통 그 한 축을 이루는 수비 스탯을 향한 비판과 궤를 함께 하는 경우가 많다. 수비 스탯들은 해마다 큰 폭으로 변동하는 모습을 보이고, 그만큼 신뢰도가 떨어진다는 것이다. 이는 어느 정도 타당한 지적이다. 오늘날의 수비 스탯은 여전히 타격 스탯에 비해 불안정하고 불완전하며, 신뢰도를 얻기까지 더 많은 샘플을 필요로 하는 단계에 놓여 있다.
지나친 줄 세우기를 조장한다는 비판도 적지 않다. 경기를 실제로 지켜보는 게 아니라, 단순히 통계나 숫자에만 집착하는 관람 태도를 불러온다는 비판도 존재한다. 허나, WAR을 비롯한 세이버메트릭스의 핵심은 클래식 스탯으로는 발견할 수 없는 선수의 실질적인 가치를 밝혀낸다는 데 있다. 보다 구체적이고 객관적으로 야구를 분석하기 위한 하나의 수단인 것이다. 맹목적인 줄 세우기 대신 본래의 목적에 맞게 활용한다면, WAR만큼 그 목적과 활용도가 뚜렷한 스탯도 드물다.
WAR에는 타격, 주루, 투구, 수비를 아우르는 다양한 요소들이 계산에 포함되어 있다. 때문에 계산식 자체는 상당히 난해한 것이 사실이다. 하지만 그 기본적인 원리만 파악하더라도 WAR을 활용하는 데에는 별다른 지장이 없다. 그러니, 이처럼 직관적으로 선수의 가치를 표현해주는 ‘종합 성적표’가 존재한다는 사실을 즐겁게 받아들여도 좋지 않을까.
기록출처: baseball-reference.com, fangraphs.com
KBO리그의 대체선수들로 팀을 구성했을 때 예상 승수를 어떻게 정할 수 있을까요??
스탯티즈에서 제공하는 WAR을 기준으로 계산해봤습니다.
스탯티즈 기준으로는 대체선수로 구성된 팀의 기대승수는 약 32승이 나왔습니다.
WAR을 기반으로 한 두산의 기대승수는 93.11승으로 실제로 기록한 93승과 근사한 값이 나왔고, 최하위를 기록한 kt의 경우에는 기대승수가 52.73승으로 역시 실제 승수인 53승의 근사값이 나왔습니다.
답변 감사합니다. 🙂
war를 기반으로 한 기대승수는 어떻게 구하나요?