고우석의 짧은 익스텐션, MLB서 정말 불리하게 작용할까?

< 일러스트 = 야구공작소 최영건 >

고우석은 지난 1월 샌디에이고 파드리스와 계약을 맺었다. 계약만으로도 야구팬들 사이에서 큰 화제였지만, 그의 메이저리그(MLB) 도전에 대해서는 긍정보단 부정적인 의견이 많았다. 한국에서도 불안정한 경기력을 보이는 그가 MLB에서 어떻게 좋은 활약을 보여주겠는지가 주요 논점이었다.

특히 고우석의 짧은 익스텐션1이 최대 약점으로 지적받았다. SPOTVnews에 따르면 2019년 그의 익스텐션은 171cm였다. 이는 KBO리그 투수들의 평균 익스텐션인 180cm~185cm에 미치지 못한다. 평균 익스텐션이 190cm인 MLB에서도 당연히 그의 익스텐션은 매우 짧은 편에 속한다.

익스텐션이 짧은 투수는 같은 150km를 던져도 상대적으로 타자가 체감하는 구속이 낮아진다. 고우석의 MLB 도전이 실패로 끝날 것이라는 의견이 주를 이룬 이유 중 하나다. 이에 통계 분석으로 실제 MLB 불펜 투수들의 익스텐션별로 성적 차이가 존재하는지 검증해 보려 한다.

 

분석 전 사전 작업

MLB서 익스텐션별로 성적의 차이가 있는지를 파악하기 위해, 각 그룹간 차이를 검증할 수 있는 분산분석2을 사용했다.

먼저, 성적을 나타낼 수 있는 지표를 정의했다. 필자는 투수의 객관적인 능력을 파악할 수 있는 *xwOBA(기대가중출루율)3을 성적지표로 선정했다. 다른 요소의 개입 없이 투수가 얼마나 위력적인 공을 던지고 있는지 파악할 수 있기 때문이다.

두 번째로 분석에 활용할 데이터를 수집했다. 최근 10년간(2014년~2023년) 150타석 이상을 상대한 MLB 불펜투수 중, 고우석과 패스트볼 평균 구속(152km, 스탯티즈 참조)이 유사한 선수4들을 대상으로 선별했다. 그 결과 총 320명의 통산 성적 데이터를 수집했다.

마지막으로 익스텐션을 상, 중, 하 세 그룹으로 분류했다. 익스텐션 각 그룹에 따른 성적 차이를 파악하기 위해서다. 익스텐션 상위 25%는 상, 하위 25% 하, 나머지는 중 그룹으로 설정했다.

< 그림 1 = 분산분석에 활용하기 위해 선별한 데이터 >

최종적으로 분석에 활용할 익스텐션 상, 중, 하 각 그룹의 데이터는 아래 표와 같은 특징을 나타냈다.

< 익스텐션 상, 중, 하 각 그룹의 기술통계 >

 

통계분석

  1. 가설은 ’익스텐션 상, 중, 하 그룹 중 적어도 한 개의 그룹은 성적(xwOBA)에 차이가 있을 것이다‘로 정했다.
  2. 분석에 활용할 그림1의 데이터는 *정규성 등분산 검정 결과5를 모두 만족했다. 이에 일원배치 분산분석6으로 가설 검정을 진행했다.
  3. 일원배치 분산분석 결과, P-value 값이 0.03으로 유의확률 0.05보다 작기 때문에 익스텐션의 상, 중, 하 그룹 중 적어도 한 그룹은 성적의 차이가 존재했다.

< 일원배치 분산분석 >

이후 *사후검정7을 통해 익스텐션 상, 중, 하 중 어떤 그룹 간에 성적 차이가 존재하는지 알아봤다.

  1. 사후검정 결과, 상–하 그룹만이 P-value 값 0.0266으로 유의확률 0.05보다 작아 집단 간 차이가 유의미했다.

< 사후검정 >

따라서 최종적인 분석 결과, 익스텐션 상 그룹과 하 그룹 간의 성적 차이는 통계적으로 유의미하다는 결론이 나왔다.

 

짧은 익스텐션은 정말 불리할까?

지금까지만 보면 고우석의 익스텐션(171cm)은 MLB 불펜 투수 중 ‘하’ 그룹에 속하기 때문에 상 그룹에 비해 성적을 내기 불리하다는 결론 도출이 가능하다.

다만 두 그룹 간 실제 성적의 차이가 정확히 얼마나 나는지에 주목할 필요가 있다. 통계적으로 성적 차이가 유의미했던 익스텐션 상(0.340)–하(0.355) 집단 간 평균 성적(xwOBA) 차이는 0.015 즉, 1푼 5리 정도에 불과했다.

통계적으론 유의미한 차이를 보였지만, 1푼 5리의 차이로 선수의 클래스를 단정 짓긴 어렵다. 각각 출루율 0.355와 0.3408을 기록한 두 타자가 다른 수준의 선수라고 말할 수 없는 것과 같다.

결국 익스텐션별로 성적의 차이가 어느 정도 존재하지만, 그에 따라 MLB에서 성공과 실패를 논할 정도로 큰 차이는 아니라는 것이다.

 

익스텐션보다 중요한 건?

고우석이 짧은 익스텐션으로 좌절할 이유는 없다. 보다 나은 강점이 있다면 이를 극복할 수 있기 때문이다. 텍사스의 불펜 투수 호세 르클럭의 예시를 살펴보자.

르클럭은 고우석과 비슷한 익스텐션(170.7cm)과 패스트볼 평균 구속(150.8km)을 지녔다. 그러나 지난해 그의 xwOBA는 0.276로 150타석 이상을 상대한 MLB 불펜 투수 중 상위 20%에 해당하는 좋은 기록이었다.

그의 비법은 장점을 극대화하는 투구 전략이었다. 르클럭은 체감 구속에서 손해를 보는 패스트볼의 구사율이 매우 낮다. 지난해 150타석 이상을 상대한 MLB 불펜투수들의 패스트볼 평균 구사율은 66.3%였다. 르클럭의 패스트볼 구사율은 평균 대비 15%가량 떨어지는 50.9%에 그쳤다.

반면 슬라이더(31.5%)와 체인지업(13.2%) 두 구종의 구사율은 44.7%로 전체 구사율의 절반에 가까운 비율을 차지했다. 이처럼 르클럭은 패스트볼 계열의 구종 대신, 공의 움직임이 많은 변화구를 구사하는 전략을 선택했다.

실제로 포심 패스트볼의 xwOBA는 0.358로 자신의 xwOBA(0.276)에 비해 한참 떨어졌지만, 제 2구종 슬라이더의 xwOBA는 0.151으로 특급 성적을 기록했다. 강력한 변화구가 뒷받침되기 때문에 과감하게 패스트볼의 구사율을 줄일 수 있었던 것이다.

고우석도 이 같은 사례를 참고할 필요가 있다. 이전 글에서 분석했듯, 그의 각 구종은 MLB에서도 충분히 경쟁력이 있다. 특히 커브는 현지에서도 좋은 평가를 받고 있다. 팀 동료 다르빗슈 유가 고우석에게 직접 커브 그립을 물어봤으며, 포수 카일 히가시오카는 “손의 위쪽으로 떠오르지 않고, 직선으로 쭉 날아오는 느낌이라 좋았다”고 그의 커브를 평가했다.

고우석이 르클럭처럼 자신의 장점을 극대화할 수 있는 투구 전략을 가져간다면 짧은 익스텐션은 큰 걸림돌이 되지 않을 것이다.

 

결론

필자는 ‘고우석은 짧은 익스텐션으로 인해 MLB서 실패할 것이다’는 속설을 검증하고자 본 분석을 진행했다. 실제로 통계적 분석에서도 짧은 익스텐션은 상대적으로 성적을 내는 데 불리하다는 결과가 나왔다.

다만 수치로 드러난 성적의 차이가 MLB에서의 성공과 실패를 가를 만큼 큰 것은 아니었다. 또한 고우석과 스팩이 매우 유사한 르클럭의 사례를 통해, 짧은 익스텐션은 충분히 극복 가능하다는 것 역시 살펴봤다.

현재 고우석은 MLB 개막 로스터 합류가 불발된 상황이다. 따라서 지금부터가 정말 중요한 시기다. 자신이 보여줄 수 있는 무기를 갈고 닦아 언제 올지 모를 기회를 붙잡아야 한다. 한국 야구의 한 팬으로서 고우석이 고통의 시간을 견디고 날아오르는 나비가 되길 바란다.

 

참고 = Baseball Savant, SPOTVnews, STATIZ

야구공작소 김건우 칼럼니스트

에디터 = 야구공작소 오연우, 전언수

일러스트 = 야구공작소 최영건

ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.

  1. 투수판에서부터 공을 놓는 지점까지의 거리. 즉, 투수가 투수판에서 얼마나 뻗어 나와 던지는지를 측정한 값, 익스텐션이 길수록 타자가 느끼는 체감 구속이 올라간다.
  2. 두 개 이상 집단들의 평균을 비교해, 집단 간 평균의 차이에 대한 통계적 유의성을 검증하는 방법
  3. xwOBA: 타구 속도와 발사각도를 통해 특정 타구의 안타가 될 기대치를 나타낸다. 투수가 타자의 좋은 타구를 얼마나 억제했는지 알 수 있다. 투수에게 낮을수록 좋은 지표.
  4. 고우석과 패스트볼 평균 구속이 +,-2km/h 안에 해당하는 선수. 익스텐션은 체감 구속에 영향을 미치기 때문에, 평균 구속이 유사한 군 안에서 익스텐션에 따른 성적 차이를 보기 위함
  5. 분석의 신뢰도를 높이기 위해 데이터를 검정하는 과정. 자세한 검정 결과는 링크를 클릭하여 확인.
  6. 정규성 및 등분산 검정을 모두 만족할 때 사용하는 분석 기법. P-value 값이 0.05보다 작으면 가설 유효.
  7. 분산분석 결과가 유효했을 때, 정확히 어떤 그룹 간에 차이가 존재하는 지 알 수 있는 검정. P-value값이 0.05보다 작으면 그룹 간 서로 차이 존재.
  8. xwOBA가 출루율 스케일을 따르기 때문에 출루율로 예시 제공

2 Comments

  1. 익스텐션이 짧은게 문제라는 말이 하이릴리스포인트나 평균보다 많이 높은 구속같이 짧은 익스텐션을 극복할 수 있는 무언가가 없다는 것이라는듯요

댓글 남기기