야구 선수 분석에 관해

[야구공작소 오연우] 프로야구가 명실공히 한국 최고의 인기 스포츠로 자리 잡으면서 야구와 관련된 글들이 하루에도 수없이 많이 쏟아져 나온다. 기자가 쓴 기사도 있고 팬들이 쓴 글도 있으며, 단순히 경기 정보를 전하는 기사부터 더욱 깊은 분석을 한 글까지 종류도 다양하다.

이 중 많은 부분을 차지하는 글이 특정한 선수를 분석한 글이다. 시기를 막론하고 수백 명의 선수 중 누군가는 사람들의 관심을 끌기 마련이고, 관심을 가진 누군가는 그 선수를 분석한다.

분석 방법에 정해진 규칙이 있는 것은 아니므로 글마다 구성에 차이가 크다. 특히 최근에는 pitch f/x나 스탯캐스트 등의 도입으로 사용할 수 있는 정보들이 많아져 분석 양상이 더욱 다양해졌다.

하지만 겉으로 드러나는 다양성의 아래에서는 형식의 유사성도 관찰할 수 있다. 서로 다른 방식으로 서로 다른 선수를 분석하지만, 논리가 전개되는 구조에는 글 사이에 분명한 유사성이 있다.

 

묘사와 설명

선수에 대한 일대기나 스카우팅 리포트 같은 글을 제외하면 선수에 대한 분석은 대개 선수에게 어떤 변화가 있을 때 이뤄진다. 평소 수준의 성적을 평범하게 기록하고 있는 선수는 관심을 끌기 어렵다. 그러므로 많은 경우 선수를 분석한다는 것은 선수의 변화를 분석하는 것이라고 말할 수 있다.

변화에 대한 분석은 크게 두 가지로 나뉜다.

1. 변화 상황에 대한 묘사
2. 변화가 발생한 이유에 대한 설명

변화 상황을 묘사하는 것은 선수가 어떤 모습에서 어떤 모습으로 바뀌었는지를 보이는 과정이다. 좋아졌으면 무엇이 얼마나 좋아졌고 나빠졌으면 무엇이 얼마나 나빠졌는지를 묘사한다. 흔히 타자는 타율, 출루율, 장타율의 슬래시라인, 투수는 평균자책점, 탈삼진, 볼넷 등이 사용되며 그밖에도 선수에 맞게 다양한 수치를 이용할 수 있다.

묘사는 많이 필요하지 않다. 대개 잘 될 때는 어느 수치이고 다 좋고 슬럼프일 때는 어느 수치이고 다 나쁘기 마련이다. 타율도 좋고 출루율도 좋고 장타율도 좋고 wRC+도 좋고 WAR도 좋다고 하는 대신 OPS만 좋아졌다고 해도 타격이 상승세임을 전달하기에는 큰 무리가 없다.

비슷하게 ‘타구 속도가 빨라져서 안타가 많아졌다’ 같은 서술도 많은 경우 불필요하다. 몇몇 특수한 경우를 제외하면 타구 속도의 상승은 대부분 안타 확률의 상승으로 이어지기 때문이다. 특수한 경우가 아닌 이상 동어 반복이 되며 글 길이만 늘리게 된다.

마찬가지로 현상을 근거로 착각하고 되풀이해 서술해서는 안 된다. “A 타자가 상승세인 이유는 타율이 높기 때문이다”는 문장은 ‘타율이 높다=상승세’라는 기본적인 인식조차 실패한 결과물이다. 타율이 높아진 이유를 찾는 것이 상승세에 대한 이유를 찾는 것이다.

 

어떤 분석은 묘사에서 끝나기도 한다. 그러나 대개는 변화를 묘사한 뒤 그렇게 된 이유를 설명한다. 투타를 막론하고 변화가 발생한 이유는 크게 두 가지로 볼 수 있다.

1. 단순한 확률적 변동
2. 물리적 변화

1번은 흔히 운이라고 부르는 것이다. 어떤 타자든지 1년 600타석을 들어서면 선수에게 아무 변화가 없었음에도 순전히 운이 나빠서 얼마든지 10타수 무안타 정도는 기록할 수 있다.
2번은 1번과 달리 실제로 선수에게 어떤 변화가 있었던 경우다. 투구 자세가 달라졌을 수도 있고 타격 시 접근법이 달라졌을 수도 있다. 구종 선택이 달라졌을 수도 있고 스윙 궤적이 바뀌었을 수도 있다. 확률적 변동을 제외한 모든 변화라고 생각해도 무방하다.

변화의 이유를 설명할 때 일차적으로 해야 할 것은 그 원인이 1번이냐 2번이냐를 파악하는 것이다. 1번에 가깝다면 현재의 호조, 혹은 슬럼프는 일시적일 가능성이 높다고 추측할 수 있고, 반대로 2번에 의한 것일 가능성이 높아 보인다면 추가로 그 변화의 내용을 찾아 보아야 한다.

이 과정에서는 먼저 확률에 따라 오르내림이 큰 숫자와 그렇지 않은 숫자를 살펴본다. 일반적으로 확률 또는 운의 영향을 많이 받는 것으로 알려진 스탯에는 BABIP, 잔루율 등이 있고, 그렇지 않은 스탯에는 삼진 비율, 볼넷 허용률, 홈런 허용률 등이 있다. 호조나 슬럼프의 많은 부분이 전자로 설명된다면 그 성적은 일시적일 가능성이 높다.

주의할 점은 물리적 변화가 있는 경우에도 당연히 운과 관련된 스탯도 변한다는 것이다. 안타가 늘어나면 BABIP도 늘어나는 것이 대표적인 예다. 정도의 문제라고 할 수 있다.

 

물리적 변화

이렇게 운의 영향을 확인한 뒤에는 물리적 변화를 찾는다. 물리적 변화에는 구장, 팀 수비력처럼 외부 환경의 변화도 있고 선수 개인의 변화도 있지만, 대개는 선수 개인의 변화에 집중하게 된다.

물리적 변화의 예로는 투구 자세나 타격 자세의 변화와 같은 것부터 구속, 구종 구사 비율 변화, 무브먼트 변화, 타석 접근 방식 변화(plate discipline) 등을 생각할 수 있다. 이 중 자세 및 메카니즘을 제외한 많은 부분은 수치로 나타나고, 메카니즘의 경우도 릴리즈 포인트와 같은 요소는 수치로 볼 수 있기에 비전문가도 어느 정도 분석할 수 있다.

다만 단편적인 정보를 확대하여 해석하거나 이현령비현령으로 해석하지 않도록 조심해야 한다. 똑같이 스트라이크 존 구석으로 공을 더 많이 던졌더라도 결과가 좋았다면 핀포인트 제구를 한 게 되고 나빴다면 예민했던 탓에 볼넷이 늘어난 게 된다. 이현령비현령식 해석은 글의 신뢰도를 떨어뜨린다. 주장이 이론에 근거한 것인지 추측에 근거한 것인지를 명확히 인지해야 한다.

메카니즘에 대한 분석은 변화의 근본적인 이유를 설명해 줄 수 있다는 점에서 아주 중요하지만 분석에 활용하기에는 두 가지 난점이 있다.

1. 메카니즘에 대해 무언가를 주장하기에는 대부분 기자나 팬들은 메카니즘에 대한 지식이 많지 않다.

2. 메카니즘에 대한 경험과 지식이 많은 경우에도 메카니즘의 변화와 성적 변화의 연관성을 보이기가 어렵다. 애당초 일반적으로 적용할 수 있는 이론을 만드는 것 자체가 쉽지 않다. 이론을 만들기 위해서는 유사한 메카니즘 변화가 있는 집단에서 유사한 결과의 변화가 있는지, 혹은 유사한 결과의 변화가 있는 집단에서 유사한 메카니즘 변화가 있었는지를 관찰해야 하지만 현실적으로 불가능하다. 자연히 신뢰도는 낮아지고 결과론으로 치우치기 쉽다. 선수를 보고 한눈에 이건 이렇고 저건 저래서 부진하다는 주장은 신뢰하기 어렵다.

다시 말해 메카니즘에 대한 분석이 대단히 중요한 것은 분명하나 메카니즘으로 모든 것을 설명하려는 시도는 위험하다. 모든 선수에게 통하는 처방은 없기 때문에 그 선수의 전반적인 상황을 고려한 조심스러운 접근이 중요하다.

 

정리

지금까지의 분석 과정을 정리해 보면,

1. 변화를 찾고 이를 적절히 묘사한다.
2. 적절한 배경이론과 스탯을 활용해 변화의 이유를 파악한다.
3. 변화의 이유가 주로 물리적 변화에 의한 것이라면 어떤 물리적 변화가 있었는지를 확인한다.

정도로 요약할 수 있다.

분석에서 더 복잡하고 정교한 숫자를 얼마나 많이 사용하느냐는 전혀 중요하지 않다. 성적이 좋아지는 경우에는 대부분의 스탯이 개선되고, 반대의 경우에는 하락하기 마련이다. 굳이 복잡한 숫자를 들지 않더라도 선수의 변화는 쉽게 묘사할 수 있다.

그보다는 선수의 변화를 어떤 숫자로 어떻게 설명할지가 훨씬 더 중요하다. 결국 변화의 근거가 되는 가설을 어떻게 세우느냐에 달린 문제다. 이미 알려진 연구 결과와 일반론을 들어 설명할 수도 있고, 새로운 가설을 내세울 수도 있다. 다만 새로운 방식으로 설명할 때는 설득력 있는 근거를 제시해야 한다.

모든 분석이 이런 과정을 거치는 것은 아니고 거칠 필요도 없다. 전혀 다른 과정으로 나온 좋은 분석도 많다. 다만 이 글이 선수를 분석하는 하나의 방법론을 제시할 수 있었기를 바란다.

 

에디터=야구공작소 박기태

ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.

1 Trackback / Pingback

  1. The Best of Yagongso, August, 2018 [8월의 칼럼] - 야구공작소

댓글 남기기