< 일러스트 = 야구공작소 이재성 >
# 서론 : 수비 지표는 왜 어려운가
야구에서 수비는 오랫동안 객관적 평가가 어려운 영역이었다. 수비율은 가장 오래된 수비 지표다. 자살과 보살의 합을 전체 수비 기회로 나눈 단순한 계산식. 하지만 한계는 명확했다. 느린 선수가 공을 못 잡아도 실책이 아니니, 수비 범위가 좁아도 높은 수비율을 기록할 수 있었다.
레인지 팩터(RF)는 이 한계를 보완하려 했다. 9이닝당 몇 개의 아웃을 만들었는가. 수비 범위를 정량화하려는 첫 시도였다. 그러나 삼진이 많은 투수 뒤에서 뛰면 레인지 팩터가 낮아지고, 플라이볼 투수 뒤에서 뛰면 RF가 높아졌다. 투수 성향을 분리하지 못한 것이다.
2000년대 초, 새로운 접근이 등장했다. 그라운드를 가상의 구역으로 나누고, 같은 구역으로 향한 타구를 평균 대비 얼마나 더 잡아냈는지 측정하는 UZR(Ultimate Zone Rating)과 DRS(Defensive Runs Saved)는 수비 평가에 객관적인 기준을 세우려 한 시도였다. 하지만 여기에도 한계가 있었다. 같은 구역으로 향한 타구라도 시속 100마일 라인드라이브와 시속 70마일 땅볼의 난이도는 다르다. 두 지표는 타구의 물리적 특성을 반영하지 못했다.
2015년, MLB에 스탯캐스트가 도입됐다. 타구의 속도와 발사각, 수비수의 움직임을 추적하는 이 시스템은 OAA(Outs Above Average)라는 새로운 지표를 만들어냈다. OAA는 더 이상 가상의 구역에만 의존하지 않는다. ‘평균적인 선수가 이 타구를 잡을 확률‘이라는 개념을 도입해 타구의 물리적 난이도를 반영한다.

< 수비지표에서 사용되는 필드 구역. 포수는 별개의 지표를 활용하여 측정한다. >
외야에서 OAA는 성공적이었다. 시즌별 편차가 적고 팬들이 ‘명수비수‘로 꼽는 선수들과 지표가 대체로 일치했다. UZR과 DRS는 외야 평가에서 거의 역할을 잃었다.
# 내야에서의 한계 : 0.9초의 전쟁
하지만 내야는 달랐다. 내야수의 OAA는 종종 납득하기 어려운 결과를 보여준다. 가령 브라이스 투랑의 25시즌 OAA와 DRS를 확인해보면 OAA는 -3으로 리그 199위인데 반해 DRS는 +7로 리그 33위를 기록했다. 한 쪽에서는 명 수비수로 평가받는 선수가 다른 쪽에서는 리그 평균 이하의 수비수로 평가받는 것이다. 골드 글러브를 받은 24시즌을 확인해보면 OAA는 +6인데 반해 DRS에서는 무려 +22가 기록되었다.
이 사례에서 알 수 있듯, OAA는 시즌별로 크게 흔들리고, 팬들이 ‘명수비수‘로 꼽는 선수가 낮은 점수를 받기도 한다. 앞서 투랑의 사례에서 알 수 있듯 오히려 구식 지표인 UZR이나 DRS가 더 안정적이라는 평가가 나오기도 한다. 최첨단 추적 기술이 왜 특정 영역에서는 이전 방법론보다 불안정한 걸까?
문제는 속도다. 100마일짜리 땅볼이 내야를 빠져나가는 데는 약 0.9초밖에 걸리지 않는다. 이 짧은 시간 안에 수비수는 타구를 인지하고, 반응하고, 움직이고, 글러브를 뻗어야 한다. 외야 플라이볼이 3~4초 동안 천천히 떨어지는 것과는 다르다.

< 방송사 카메라로 찍은 지안카를로 스탠튼의 116.4마일 타구. 화면 우중단 흔들림처럼 보이는 흰색 부분(빨간 네모)이 공의 잔상이다. 이 공은 유격수 옆으로 벗어나 안타를 기록하였다. >
현재의 추적 시스템도 빠른 타구를 측정하긴 한다. 하지만 기술적 한계로 인해 내야 땅볼에서는 정밀도가 떨어진다. 공의 궤적이 조금만 어긋나도 ‘이 타구를 잡을 확률‘ 계산이 달라지고, 그게 OAA에 누적된다. 방향별 OAA, 위치별 OAA 같은 보완 지표들이 나왔지만 근본적인 한계는 남아 있다.
# OAA가 보지 못하는 것들
기술적 정밀도 문제를 해결한다 해도 OAA가 놓치는 것들이 있다. 성공적인 수비에 영향을 주는 다양한 요소들이 현재의 OAA에는 반영되지 않는다는 것이다.
스탯캐스트는 야수들의 송구도 추적한다. 하지만 투구만큼 정밀하지는 않다. 송구 속도 정도는 알 수 있지만 자세에 관한 정보는 정확도 문제로 측정이 어렵다. 경험적으로 사이드스로는 오버핸드보다 송구 정확도가 떨어진다고 알려져 있다. 그러나 정확히 얼마나 떨어질까? 현재의 OAA는 이를 알려주지 못한다.
또한 OAA는 수비수의 위치를 기준으로 ‘이 타구를 잡을 확률‘을 계산한다. 역설적으로 포지셔닝이 나쁠수록 같은 타구를 잡았을 때 OAA 증가량이 크다. 더 멀리서 달려와 잡았으니 더 어려운 수비라는 논리다. 하지만 애초에 좋은 위치에 서 있었다면? 그 판단의 가치는 반영되지 않는다. 타자의 성향, 경기 상황을 고려했을 때 수비 위치가 적절했는지. 현재의 OAA는 이를 평가하지 않는다.
자세 역시 문제가 된다. 첫 스텝을 어느 발로 내디뎠는지, 몸의 중심이 어디에 있었는지, 글러브를 언제 뻗었는지. 같은 위치에 있어도 자세에 따라 공을 잡을 수 있는지가 달라진다. 스탯캐스트가 선수의 자세를 어느 정도 추적할 수는 있지만 앞서 말했듯 해당 추적의 정확성에는 문제가 있다. 따라서 현재 OAA 계산에는 활용되지 않는다.
# 공식의 한계
그렇다면 이런 요소들을 공식에 추가하면 되지 않을까?
쉽지 않다. 송구 동작이 정확도에 미치는 영향, 포지셔닝이 수비 성공률에 주는 효과, 첫 스텝 방향과 타이밍의 관계. 이것들은 서로 얽혀 있고 관계가 단순하지 않다. 가령 사이드스로가 정확도를 얼마나 떨어뜨리는지는 송구 거리, 주자 속도, 타구 강도에 따라 달라질 것이다. 이 모든 조합을 공식으로 만드는 건 사실상 불가능에 가깝다.
수비 지표의 역사가 이를 보여준다. 수비율에서 RF로, RF에서 UZR/DRS로, UZR/DRS에서 OAA로. 20년이 넘는 시간 동안 더 많은 변수를 더 정교한 공식에 넣으려 했지만,내야 수비 평가는 여전히 완전하지 않다. 공식을 개선하는 방식으로는 한계가 있다는 뜻일 수 있다. 다른 접근이 필요하다.
# 다른 접근 : 학습 기반 지표들
타격과 투구에서는 다른 접근이 성과를 내고 있다.
xwOBA는 타구의 속도와 발사각을 기준으로 ‘이 타구가 평균적으로 어떤 결과를 낳는가‘를 예측한다. 과거 수백만 개의 타구 데이터를 k-NN(k-최근접 이웃) 알고리즘으로 분석해 유사한 타구들의 평균 결과를 계산한다. 이를 통해 xwOBA는 다음 시즌 성적 예측에서 기존 지표들보다 높은 정확도를 보여준다.
Stuff+는 투구의 질을 평가한다. 구속, 회전수, 무브먼트, 릴리스 포인트, 같은 투수의 다른 구종과의 구속 차이. 이 데이터들을 XGBoost라는 학습 모델에 입력해 해당 투구가 리그 평균 대비 얼마나 효과적인지 수치화한다. 구종마다 ‘좋은 공‘의 기준이 다르고 같은 구종 안에서도 상황에 따라 효과가 달라지는 복잡한 관계를 포착한다.
공통점이 있다. 둘 다 사람이 직접 공식을 설계하지 않았다. 대신 대량의 데이터를 학습 모델에 넣고 모델이 변수들 사이의 복잡한 관계를 스스로 찾아내도록 했다. 이 접근이 타격과 투구에서 성공했다면, 수비에서도 가능하지 않을까?
# 데이터의 문제
학습 기반 접근을 수비에 적용하려면, 먼저 데이터가 필요하다.
xwOBA는 타구 속도와 발사각, 그리고 그 결과(안타, 아웃 등)를 학습했다. Stuff+는 투구의 물리적 특성과 그 결과(헛스윙, 피안타 등)를 학습했다. 수비에서는 무엇을 학습해야 할까?
앞서 이야기한 것들이다. 송구 동작, 포지셔닝 판단, 첫 스텝의 타이밍. 이런 ‘동작 데이터‘가 필요하다. 그리고 각 동작에 대한 평가가 필요하다. “이 첫 스텝은 적절했는가?” “이 송구 자세는 효율적이었는가?”
타격에서는 타구 결과가 자동으로 라벨이 된다. 안타인지 아웃인지는 명확하다. 투구에서도 스트라이크인지 볼인지, 헛스윙인지 컨택인지가 자동으로 기록된다. 하지만 수비 동작의 질은 그렇지 않다. 같은 아웃이라도 어떤 아웃은 아슬아슬했고, 어떤 아웃은 여유로웠다. 이 차이는 누군가 판단해서 기록해야 한다. 다시 말해, 수천, 수만 개의 수비 플레이에 동작 데이터와 평가를 붙여야 한다. 이 데이터가 없으면 학습 기반 접근은 시작조차 할 수 없다. 다음 편에서는 이 데이터를 어떻게 만들 수 있을지 이야기해보려 한다.
야구공작소 표상훈 칼럼니스트
에디터 = 야구공작소 박두산, 장호재
일러스트 = 야구공작소 이재성
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
댓글 남기기