< 일러스트 = 야구공작소 신민경 >
베이스볼 서번트는 타구 속도와 발사 각도를 이용해 타구가 안타 또는 장타가 될 가능성을 측정한다. 이를 이용해 만든 것이 expected(기대되는)의 x를 딴 xStats이며, 그 안에는 xBA(기대 타율), xSLG(기대 장타율), xwOBA(기대가중출루율) 등이 있다. 이러한 xStat들은 수비나 구장 환경 등의 영향을 배제하고 타구가 일반적으로 어떤 결과를 낼지 보여주기 때문에 타자의 가치를 더욱 객관적으로 평가할 수 있다.
xStat과 분사 각도
xStat은 타구의 분사 각도(spray angle)를 고려하지 않는다는 특징이 있다. 분사 각도(Spray angle)는 타구가 어떤 각도로 퍼져나갔는지 나타내는 수치다. 범위는 -45°에서 45°로 총 90°도 다. 홈플레이트에서 정확하게 2루 베이스 방향으로 뻗어나간 타구는 분사 각도 0°에 해당한다. -45°에 가까울수록 좌측 파울 라인, 45°에 가까울수록 우측 파울 라인으로 향한 타구다. -45°, 45°는 정확하게 좌우 파울라인에 해당한다.
< 분사 각도 >
xStat이 분사 각도를 고려하지 않는다는 것은 두 타구의 분사 각도가 다르더라도 타구 속도와 발사 각도만 같으면 같은 xStat을 갖는다는 뜻이다. 예시로 타구 두 개가 있는데 하나는 분사 각도 0도, 하나는 45도라고 하자. 실제로는 완전히 다른 형태의 타구지만, 만약 타구 속도와 발사 각도가 각각 165km/h, 25도로 같다면 이 두 타구는 동일한 xBA와 xSLG을 갖는다.
< 타구 속도 165km/h, 발사 각도 25도 타구 결과 (2021~2023) >
최근 3년간 타구 속도 165km/h, 발사각도 25도인 타구의 타율은 0.796이었다. 그중에서 중앙으로 향한 타구의 타율은 0.716이었고 좌·우측으로 향한 타구의 타율은 0.949였다. 그러나 현재 xBA는 타구가 중앙으로 향했든 좌·우측으로 향했든 똑같은 수치를 배정한다. 가령 실제로 165km/h, 25도인 타구에 0.796이라는 xBA가 매겨진다고 하면, 이는 중앙 타구는 약 0.08 정도 과대평가, 좌·우측 타구는 약 0.153 정도 과소평가한 것이 된다.
xStat이 분사 각도를 포함하지 않은 이유
Tom Tango는 타자의 xwOBA를 구하는 과정에서 분사 각도를 포함하지 않는 이유를 아래와 같이 말했다.
- ‘당겨친 뜬공’에 대해서만 xwOBA를 계산하면 타자의 타격 성향(당겨치느냐, 고르게 치느냐)에 따라 편향이 나타나지만, 모든 타구를 고려하면 편향(wOBA와의 차이)은 0.002~0.003에 불과하다(링크).
- 분사 각도는 개개의 타구를 묘사하기 위해서는 필요할지 몰라도 노이즈가 많은 데이터이므로 선수에 대한 묘사에서는 별로 의미가 없다. FIP에 인플레이 타구 정보를 추가하면 좋지 않은 이유와 같다(링크 2).
- wOBA나 xwOBA는 결국 선수에 대해서 이야기하기 위해 존재한다. 분사 각도를 포함한 xwOBA는 과적합으로 인해 선수에 대한 설명력이 낮아지고 예측력도 떨어졌다(링크 3).
- 당겨치거나 밀어 치는 성향은 수비 시프트로 어느 정도 상쇄된다.
요약하면 현재 xwOBA는 분사 각도 없이도 wOBA를 매우 잘 따라가고, 분사 각도를 포함하면 공연히 불필요한 노이즈가 들어갈 우려가 있으며, 그 결과 오히려 선수에 대한 설명력이 떨어진다는 것이다. 또 개별 타자의 분사 각도에 맞게 수비가 조정되기 때문에 분사 각도를 추가로 고려하지 않아도 된다는 주장이었다.
그럼에도 불구하고 분사 각도를 포함해 보고 싶은 이유
그럼에도 불구하고 필자는 xStat에 분사 각도를 포함해야 한다고 주장하고 싶다.
우선 xwOBA가 wOBA를 잘 묘사하는지의 문제를 보자. 앞에서 말한 대로 전체 타구에 대해서는 밀어 치는 타자든 당겨치는 타자든 둘의 차이는 0.002~0.003 정도에 불과하다. 하지만 뜬공만 놓고 본다면 이야기가 달라진다. 2023년 50개 이상의 뜬공을 기록한 타자는 총 258명이다. 이들의 뜬공 당겨치기 비율로 구분해 실제 장타율과 xSLG의 차이를 알아보자.
< 뜬공 당겨치기 비율별 장타율, xSLG 차이 >
당겨치는 뜬공의 비율이 높아질수록 xStat이 실제 기록보다 낮다. 뜬공의 당겨치기 비율이 30% 이상이면 실제 장타율과 기대 장타율의 차이는 0.026이 된다.
시프트 문제는 잘 맞은 뜬공 타구(Solid, Barrel)만을 고려하면 해결이 가능하다. 이런 타구는 비거리가 매우 기므로 분사 각도에 따라 좌우로 수비 위치를 조절해도 타구 결과에는 큰 차이가 없기 때문이다.
노이즈를 비롯한 다른 문제들은 앞서 톰 탱고의 주장에 동의하며 완벽히 해결할 수는 없다. 그럼에도 분석을 진행하고자 하는 것은 분석의 목적이 잘 맞은 뜬공 타구에 분사 각도를 추가하는 경우 어떤 타자가 재평가되는지 알아보기 위함이기 때문이다.
새로운 xStat
기존의 xStat을 계산할 때 사용된 지표는 다음과 같다.
- Weak, Topped 타구 : 타구 속도, 발사 각도, 타자의 주루 속도
- 그 외의 타구 : 타구 속도, 발사 각도
새로 고안한 xStat은 sxStat이라는 이름을 사용하며 Solid, Barrel 타구에 분사 각도를 추가했다.
- Weak, Topped 타구 : 타구 속도, 발사 각도, 타자의 주루 속도
- Solid, Barrel 타구 : 타구 속도, 발사 각도, 분사 각도
- Flare/Burner, Under 타구 : 타구 속도, 발사 각도
구간화를 진행하여 타구 속도는 10km/h 간격으로 분류했으며, 60km/h 이하의 데이터와 180km/h 이상의 데이터는 각각 한 개의 변수로 통합했다. 발사 각도는 10° 간격으로 분리됐고, -50° 이하와 50° 이상의 발사 각도는 각각 한 개의 변수로 통합했다. 타자의 주루 속도는 1ft/s 단위로 구분했으며 25ft/s 이하, 30ft/s 이상은 한 개의 변수로 통합했다. 분사 각도는 인플레이 타구 범위인 -45°부터 45°까지 18°씩 나누어 좌측, 좌중간, 중앙, 우중간, 우측의 구역으로 구분했다. 타구 종류에 따른 산출 지표와 생성된 조합 개수, 1개 조합당 평균 타구 개수는 아래와 같다.
< sxStat의 측정에 사용되는 지표, 타구 개수 >
이제 위 데이터를 이용해 각 타구가 아웃, 단타, 2루타, 3루타, 홈런이 될 확률을 구한다. 예를 들어 타자 A가 타구 속도 165km/h, 발사 각도 25도, 분사 각도 -40도인 배럴 타구를 쳤다고 하자. 그러면 우선 [타구 속도 160km/h 이상 170km/h 미만, 발사 각도 20° 이상 30° 미만, 분사 각도 -45° 이상 -27° 미만]인 조합을 찾는다. 최근 3년간 이런 타구는 596개 있었고, 이 중 106개는 아웃, 37개는 1루타, 328개는 2루타, 1개는 3루타, 124개는 홈런이었다. 따라서 타자는 이론적으로 0.06개의 1루타, 0.55개의 2루타, 0.001개의 3루타, 0.21개의 홈런을 친 것으로 이해할 수 있고, 이 타구의 sxSLG은 2.0031이다.
만약 타자 A가 시즌 동안 총 100개의 타구를 쳤다고 하자. 이때 100개 타구는 각각 어느 하나의 타구 조합에 속하고, 조합마다 아웃, 1·2·3루타, 홈런 확률을 구할 수 있다. 그 수치들을 모두 더하면 타자가 100개 타구에서 기록할 것으로 기대되는 1·2·3루타, 홈런 개수를 얻는다. 이를 이용해 타자의 시즌 sxSLG을 구한다.
sxStat
Solid, Barrel 타구에 대해 분사 각도를 고려해 xStat을 구했다. 아래 표는 2023년 50개 이상의 뜬공을 기록한 타자 중 sxSLG가 xSLG보다 높은 타자다.
< sxSLG가 xSLG보다 높은 타자들 >
당겨친 뜬공 비율이 40% 이상인 선수들이 3명이나 포함되어 있다. 차이가 가장 컸던 대니 잰슨의 경우 xSLG이 실제 장타율보다 0.050이나 낮아 xStat에서 크게 저평가된 선수였다. 하지만 분사 각도를 포함한 sxSLG와 실제 장타율의 차이는 0.003으로 거의 유사했다.
이외에도 마이크 야스트렘스키, 이삭 파레데스와 같이 당겨친 뜬공 비율이 40% 이상인 선수들은 xSLG에서 저평가된 것이 sxSLG에서는 대폭 만회되어 실제 장타율에 훨씬 가까워진 것을 관찰할 수 있다. 반면 당겨친 뜬공 비율이 낮았던 매니 마차도, 미겔 로하스는 오히려 sxSLG에서 오차가 더 커졌다.
sxSLG가 xSLG보다 낮은 타자들은 다음과 같다. 당겨친 뜬공 비율이 20% 이하인 존 버티, 요르단 알바레스는 xSLG에서는 높은 평가를 받았다. 하지만 분사 각도를 포함한 sxSLG에서는 실제 장타율보다 낮은 성적을 보여 평가가 뒤바뀌었다. 당겨친 뜬공의 비율이 높은 카일 슈와버, 마르셀 오수나는 sxSLG가 실제 장타율보다 낮았다.
< sxSLG가 xSLG보다 낮은 타자들 >
결론
아래 그래프에서 Solid, Barrel 타구는 분사 각도에 대해 sxwOBAcon이 wOBAcon을 잘 묘사하고 있다.
< 컨택트된 타구 유형과 분사 각도에 따른 wOBAcon, sxwOBAcon >
sxStat은 Solid, Barrel 타구를 극단적으로 당기거나 밀어 쳤을 때 기존의 xStat보다 높은 평가를 받는다. 타구를 중앙으로 보내는 타자의 경우는 sxStat보다 xStat에서의 평가가 높다.
마지막으로 sxStat은 2023년의 기록을 잘 설명할 수 있는지 알아보겠다. 2022년~2023년 2시즌 연속 인플레이 타구를 200개 이상 기록한 타자들의 2022년 xStat, sxStat과 2023년 타율·장타율·wOBA의 상관계수는 다음과 같다.
< 2022년 xStat, sxStat과 2023년 타율, 장타율, wOBA 간 상관계수>
타율, 장타율, wOBA 모두 xStat과 sxStat의 상관계수가 거의 같다. sxStat을 사용함으로써 설명력이 좋아지진 않았지만 감소하지도 않았음을 알 수 있다. 이렇게 전반적인 설명력은 유지하면서, sxStat을 사용함으로써 뜬공 당겨치기 비율에 따른 편향을 줄여냈다는 것이 개선점이다. 특히 극단적인 타구 분사 각을 가진 선수들을 재평가해 볼 수 있다는 데에 의미가 있다.
< 뜬공 당겨치기 비율별 분사 각도 포함 장타율, xSLG, 장타율, 차이 >
참고 = Baseball Savant
야구공작소 김승곤 칼럼니스트
에디터 = 야구공작소 이희원, 오연우
일러스트 = 야구공작소 신민경
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
글에서 하고자 하는 말이 뭔지 모르겠어요. 타구방향 각도 데이터가 있으니까 막 넣어서 구간 쪼개가지고 계산한건데, 아무 함의도 없이 쓴 글이라는 생각이 드니 꼼꼼하게 읽고 나서 기분이 나빠집니다. 애쓴 글이지만 이런건 재미, 의미 아무것도 없는 유희에 불과한것 아닌가 싶습니다.
필자도 스스로 인정했네요
“sxStat을 사용함으로써 설명력이 좋아지진 않았지만 감소하지도 않았음을 알 수 있다. “