< 일러스트 = 야구공작소 박경진 >
# <풀하우스>가 우리에게 남긴 것
1996년, 하버드 대학의 고생물학자 스티븐 제이 굴드(Stephen Jay Gould)는 저서인 <풀하우스>에서 통념에 도전했다. 당시 4할 타자의 소멸에 대한 일반적인 분석은 ‘더 무능력해진 타자들과 열악해진 외부 조건, 그리고 타자들의 더딘 성장’이었다. 굴드의 결론은 이와 정반대였다. 4할 타자의 소멸은 타자의 쇠퇴가 아니라, 오히려 발전의 증거라는 것이었다.
굴드는 저서에서 타율의 분석을 통해 강력한 이론을 제시했다. 1900년 이후 메이저리그 규정타석 충족 선수들의 타율을 분석한 결과, 리그 평균 타율은 약 2할 6푼대에서 거의 변하지 않았지만, 타율의 표준편차는 지속적으로 감소하고 있다는 것이었다.
선수들의 훈련 방법, 영양 상태, 장비가 발전하면서 전체 선수들의 실력이 향상되었다. 하지만 타격이라는 행위 자체는 인간 신체의 한계에 가까워지고 있으며, 이로 인해 최고 선수와 평균 선수의 격차가 줄어들게 되었다는 것이 굴드의 주장이었다.

< 1900~2024년 MLB 연도별 타율 평균(위)과 표준편차(아래). 규정타석 이상의 선수만 분석에 포함하였다. >
굴드는 이를 “벽으로 향하는 수렴”이라 불렀다. 시스템이 최적화될수록, 변이는 줄어든다. 그리하여 결국 4할 타자와 같은 극단적인 케이스가 발생할 확률은 0에 수렴한다는 것이다.
이 이론은 야구계에 상당한 반향을 일으켰다. SABR(Society for American Baseball Research)의 저널에서는 굴드의 가설을 트리플 크라운 소멸에 적용하는 연구가 발표되었으며, “다른 야구 분석가들이 굴드의 연구를 검토한 결과 대체로 그의 결론을 지지했다”고 보고했다. 2004년 SABR의 학생 논문상을 받은 연구에서는 확률론적 접근을 통해 1941년 테드 윌리엄스의 4할 1푼 6리가 통계적으로 거의 불가능한 사건이었음을 입증하기도 했다.
이러한 여러 연구로부터 20여 년이 지난 오늘날, 지표에 대한 접근성은 더 좋아졌고, 우리는 다양한 지표들에 대해 굴드의 주장이 맞았는지 확인해 볼 수 있을 것이다. 과연 “벽으로 향하는 수렴”은 오늘날에도 타격의 발전을 잘 설명할 수 있을까? 타율 외의 다른 지표들도 같은 패턴을 보일까?
# “벽으로 향하는 수렴”은 오늘날에도 데이터를 잘 설명할 수 있는가?
Lahman을 활용하여 125년의 데이터(1900-2024)를 분석했다.
먼저, 타율에 대한 굴드의 분석은 오늘날에도 정확했다. 1900년부터 2024년까지 규정타석을 충족한 9,436명의 타자 시즌을 분석한 결과, 타율의 표준편차, 다시 말해 선수들 간의 실력 차이가 지속적으로 줄어들고 있었다.
구체적으로 살펴보자. 1900년대 초반에는 타율 3할을 치는 선수와 2할을 치는 선수 사이의 격차가 컸다. 하지만 2020년대에 들어서는 그 격차가 훨씬 좁아졌다. 최고 선수와 평균 선수의 간격이 좁아진 것이다. 이것이 바로 표준편차의 감소가 의미하는 바다.
4할 타자의 소멸은 이러한 변화를 극명하게 보여준다. 1900년 이후 4할 이상을 기록한 시즌은 단 12회에 불과했으며, 마지막은 1941년 테드 윌리엄스였다. 그로부터 84년이 흘렀다. 2025년에도 4할 타자는 나오지 않았다.
그렇다면 과거의 4할 타자들은 얼마나 특별했을까? 이를 측정하는 방법이 z-score다. z-score는 한 선수가 리그 평균에서 얼마나 멀리 떨어져 있는지를 보여주는 수치다. 쉽게 말하면 “그 시대에서 얼마나 압도적이었는가”를 나타낸다.
타이 콥이 1911년 4할 1푼 9리를 기록했을 때 그의 z-score는 3.20이었다. 이는 리그 평균보다 표준편차의 3.2배 위에 있다는 뜻이다. 정규분포에서 이 정도면 상위 0.07% – 천 명 중 한 명도 안 되는 수준이다. 로저스 혼스비가 1924년 4할 2푼 4리를 쳤을 때는 z-score가 3.30으로, 더욱 극단적이었다.
현대 야구에서 이런 수준의 극단값이 나타날 확률은 사실상 0에 가깝다. 2020년대에 z-score 3.0 이상을 기록한 타자는 한 명도 없다. 타율 측면에서 선수들 간의 실력 차이가 그만큼 좁아졌기 때문이다.
그런데 다른 지표들을 보면 전혀 다른 패턴이 나타났다. 타율과 함께 타석당 홈런(HR/PA), 타석당 삼진(SO/PA)을 분석했다. 모든 비율 지표는 시즌 경기 수 변화의 효과를 제거하기 위해 타석 대비 비율로 계산했다.

< MLB 연도별 타율(좌), 타석당 홈런(중), 타석당 삼진(우) 표준편차. 1900~2024년. >
타율과 달리 타석당 삼진의 표준편차는 급격하게 증가하고 있었다. 이는 타율 변화 속도의 약 3.6배에 달하는 수치다. 1900년대 초반에는 삼진을 많이 당하는 타자와 적게 당하는 타자 사이의 차이가 크지 않았다. 하지만 현대로 올수록 그 격차가 급격히 벌어지고 있다.
타석당 홈런의 표준편차도 증가하고 있었다. 타석당 삼진보다는 완만하지만, 통계적으로 유의미한 증가세다. 과거에는 ‘홈런을 좀 치는 선수’와 ‘홈런왕’ 사이의 차이가 그리 크지 않았다. 하지만 현대로 올수록 홈런왕과 일반 선수 사이의 격차가 더 커지고 있다.
정리하자면, 타율에서는 굴드의 말처럼 다양성 증가에 따른 수렴이 일어나고 있지만, 삼진과 홈런에서는 발산이 일어나고 있다. 한편 볼넷은 변하지 않았다. 같은 타격이라는 행위 안에서도, 지표마다 완전히 다른 방향으로 진화하고 있었던 것이다.
# 왜 타자들은 분화하였는가?
왜 타율에서는 수렴이, 홈런과 삼진에서는 발산이 일어나는가? 타율은 ‘공을 맞추는 능력’을 측정한다. 이는 인간의 시각 반응속도, 손목 스냅, 배트 컨트롤 같은 기본적인 신체 능력에 크게 의존한다. 굴드가 말했듯이, 이러한 능력들은 생물학적 한계에 가까워지고 있다. 90마일 이상의 공을 0.4초 안에 판단하고 정확히 맞춘다는 것은, 이미 인간 신경계의 처리 속도 한계에 근접해 있다는 뜻이다.
그러나 이것만으로는 다른 두 지표를 설명할 수 없다. 오로지 타율만이 한계에 수렴하고, 나머지 둘은 한계에 수렴하지 않는다는 것은 말이 되지 않는다. 여기에는 한 가지 중요한 논리가 더 필요하다. 바로 시장의 논리이다.
2002년, 오클랜드 어슬레틱스의 단장 빌리 빈은 한 가지 사실을 발견했다. 출루율이 높은 선수들이 시장에서 저평가되어 있다는 것이다. 당시 구단들은 타율과 홈런에 집중했고, 볼넷을 잘 골라내는 선수들의 몸값은 상대적으로 저렴했다. 빈은 같은 득점 생산성을 더 낮은 비용으로 확보할 수 있었다.
오클랜드의 성공 이후, 다른 팀들도 출루율 높은 선수들을 찾아 나섰다. 수요가 늘자 이들의 몸값이 상승했다. 시장의 “저평가 영역”이 사라진 것이다.
아울러 데이터 분석이 정교해지면서 수비 시프트가 확산됐다. 결과는 명확했다. 인플레이 타구의 기대 가치가 하락했다. 잘 맞춰봤자 시프트에 걸렸다. 인플레이 영향 없이 득점할 방법. 바로 홈런이었다. 발사각을 높이고 배럴 타구 비율을 증가시킬 타격 방법이 대세가 되었다.
타자들이 홈런 스윙으로 진화하자, 투수들도 컨택 자체를 억제하는 방향으로 대응했다. 강속구와 무브먼트가 큰 변화구로 헛스윙을 유도하고, 삼진을 잡아내는 전략이 주류가 되었다. 삼진을 잘 잡는 투수들의 몸값이 상승했다.
이것이 바로 공진화(co-evolution)다. 공격과 수비가 서로를 압박하고, 시장이 그 결과에 가격을 매기며, 선수들은 생존을 위해 적응한다. 굴드가 말한 “벽으로의 수렴”은 이 복잡한 상호작용의 한 단면일 뿐이었다.
# 현대 야구의 두 가지
생물학에 ‘적응적 방산’이라는 개념이 있다. 한 집단이 새로운 환경에 진입하면, 다양한 생태적 지위로 분화하며 여러 형태로 진화하는 현상이다. 갈라파고스 핀치새가 씨앗을 먹는 종, 곤충을 먹는 종, 꿀을 먹는 종으로 나뉜 것처럼.
야구에서도 비슷한 일이 일어났다. 타율이 생물학적 한계에 도달하면서 선수들과 팀들은 새로운 방식으로 생산성을 극대화해야 하는 상황에 직면하게 되었다.
그 결과는 전문화였다. 타율(BA)과 홈런(HR)의 관계를 시대별로 분석하면, 1900-1945년 데드볼 시대에는 두 지표의 상관계수가 +0.399였다. 이는 타율이 높은 타자가 홈런도 많이 쳤다는 의미이며, 당시에는 “좋은 타자”가 곧 “올라운더”를 의미했음을 시사한다.
그러나 2001-2024년 머니볼/플라이볼 시대에 이르면 상관계수는 +0.108로 급격히 감소한다. 이는 타율과 홈런이 거의 독립적인 지표가 되었음을 의미한다. 현대 야구에서 “좋은 타자”는 더 이상 단일한 유형으로 정의되지 않으며, 다양한 형태로 존재할 수 있게 되었다는 것이다.

< 타율 vs 타석당 홈런 산점도. 색상은 연도를 나타낸다. (보라색 = 1900년대, 노란색 = 2020년대) >
그리하여 현대 야구에는 일종의 “두 가지 종”이 존재한다고 볼 수 있다. 첫째는 컨택형 타자로, 높은 타율과 적은 삼진을 기록하지만 홈런은 상대적으로 적다.
둘째는 파워형 타자로, 타율은 낮고 삼진은 많지만 홈런을 많이 치는 유형이다. 모두가 같은 것을 잘하려고 하면 출장 기회와 연봉을 두고 치열하게 경쟁해야 한다. 하지만 서로 다른 역할로 전문화하면, 각자의 니치에서 살아남을 가능성이 높아진다.
한 가지 더 주목할 만한 변화가 있다. 홈런, 볼넷, 삼진을 합쳐 “three true outcome(TTO)”이라고도 부르는데, 전체 타석에서 이들이 차지하는 비율이 점진적이지만 지속적으로 증가하고 있다는 점이다. 1900년대에는 15.4%에 불과했던 것이 2020년대에는 33.9%로 증가했다. 120년간 2배 이상 증가한 것이다.

< Three True Outcomes의 점진적 증가 추이 >
타율이라는 한 차원에서 벽에 부딪히자, 선택압은 ‘극단적 결과 생산하기’로 이동했다. 진화생물학 용어로는 ‘방향성 선택(directional selection)’에 가깝다. 시스템이 평형에 도달한 것이 아니라, 새로운 방향으로 계속 진화하고 있는 것이다.
# 앞으로는 어떻게 발전하게 될까?
굴드는 ‘다양성의 증가에 따른 변이의 축소’를 예측했다. 하지만 우리가 실제로 발견한 것은 ‘변이의 재배치’였다. 타율에서 줄어든 변이가 홈런과 삼진에서 다시 나타났다. 그렇다면 이 추세는 이후로도 계속될까?
흥미로운 변화가 진행 중이다. MLB는 2023년부터 수비 시프트를 제한하는 규칙을 도입했다. 내야수 4명이 모두 내야 흙 위에 있어야 하고, 2루를 기준으로 양쪽에 2명씩 배치해야 한다. 결과는 즉각적이었다. 리그 전체 BABIP(인플레이 타구 타율)는 2022년 .290에서 2023년 .297으로 상승했다. 인플레이 타구의 가치가 다시 상승한 것이다.
생물학적 비유를 들자면, 환경이 바뀌면 진화의 방향도 바뀔 수 있다. 극단적 전문화는 환경이 안정적일 때 유리하지만, 환경이 급변하면 범용형(generalist)이 다시 유리해질 수 있다.
시프트 제한이 정착되면, 홈런에 올인하던 타자들의 전략이 재고될 수 있다. 컨택의 가치가 다시 올라가면, 시장은 또다시 새로운 균형점을 찾아갈 것이다. 어쩌면 삼진을 줄이고 인플레이 타구를 늘리는, 지금은 ‘저평가된’ 스타일의 타자들이 다시 주목받을지도 모른다. 오클랜드나 탬파베이와 같이, ‘저평가된 스탯’을 찾아다니는 이들이 가장 먼저 반응할 가능성도 주목할 만하다.
# 결론: 우리는 답을 찾을 것이다. 늘 그랬듯이.
굴드의 <풀하우스>는 우리에게 중요한 통찰을 남겼다. 극단값의 소멸이 반드시 퇴보를 의미하지는 않는다는 것. 때로는 시스템이 성숙해지면서 나타나는 자연스러운 현상일 수 있다는 것이다. 하지만 우리는 그보다 한 걸음 더 나아갈 수 있다. 타율은 벽에 도달했다. 하지만 야구는 멈추지 않았다. 대신 홈런, 삼진, 볼넷이라는 새로운 차원으로 진화했다. 컨택형과 파워형으로 니치가 분화되었다. 굴드의 분석에 더해 타자는 상향평준화 될 뿐만 아니라 생산성 극대화를 위해 다양한 방향으로 분화했다는 것이다.
영화 <인터스텔라>의 명대사를 빌리자면, “우리는 답을 찾을 것이다. 늘 그랬듯이(We will find a way. We always have).” 야구도 그렇다. 그리고 앞으로도 그럴 것이다.
야구공작소 표상훈 칼럼니스트
에디터 = 야구공작소 박두산, 도상현
일러스트 = 야구공작소 박경진
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
댓글 남기기