
< 일러스트 = 야구공작소 김성윤 >
# 드라이브라인의 오픈소스들
앞서 필자는 올해 초 작성한 칼럼에서 야구 컴퓨터 비전 연구에서 주로 사용되는 다양한 데이터셋을 소개하고 활용법을 설명한 바 있다. 최근 드라이브라인(Driveline Baseball)이 공개한 여러 오픈소스들은 독립적인 스포츠 과학 연구에 유용한 자산이 되고 있다. 이 칼럼에서는 드라이브라인이 공개한 대표적인 오픈소스들에 대해 살펴보고 그 시사점에 대해 이야기한다.
기존 야구 관련 데이터셋들은 대부분 비디오 기반 자세 추정(pose estimation) 등 카메라로 수집 가능한 정보에 집중되어 있었다. 활용도 높은 정보지만, 연구자 입장에선 아쉽게 느껴지는 문제점도 있었다. 선수 퍼포먼스 향상과 부상 방지에 중요한 센서 측정 데이터의 부재다.
센서 기반의 정량적 데이터는 선수의 생체역학적 상태나 컨디션, 예컨대 지면 반력 활용도 같은 정보를 나타낸다. 이러한 데이터는 서술한 대로 공개된 양이 많지 않고, 다루기 위해 알아야 할 사전 지식의 양이 많아 진입 장벽이 높다. 최근 한국의 여러 야구 아카데미 들에서도 이러한 센서 데이터가 활발하게 활용되고 있지만 활용도를 높이기 위해선 앞서 해결해야 할 문제들이 있었다.
< 기계인식과 관련된 진입장벽들 >
OpenBiomechanics는 이 문제를 해결하기 위해 센서 기반 데이터셋을 포함하여 구성된 야구 특화 오픈소스다. 이 프로젝트는 단순히 데이터를 공개하는 수준을 넘어 데이터 수집부터 처리, 분석에 이르기까지 데이터를 활용하기 위한 전 과정에 걸친 지원 도구들을 함께 제공한다. 연구자들은 이제 각종 캘리브레이션 도구1를 따로 찾아다닐 필요 없이 OpenBiomechanics의 구조 내에서 통합적으로 실험을 설계하고 진행할 수 있다. 이는 데이터를 다루기 위해 알아야 할 지식적 장벽을 낮추고 야구 그 자체에만 집중한 연구가 가능하게 한다.
특히 OpenBiomechanics는 기존 자세 추정보다 더 정교한 총 36개의 관절점(joints)을 포함하고 있어 실제 야구 동작의 세밀한 분석이 가능하다. 이 데이터는 투구 메커니즘 분석, 재활 프로그램 설계, 선수 맞춤형 트레이닝 등 다양한 응용 분야에 활용될 수 있다.
< 36개의 관절점으로 이루어진 OpenBiomechanics의 관절점 구조(좌)와 시각화된 관절 각도 데이터(우) >
배트 추적 모션 캡처(Bat Tracking Motion Capture) 오픈소스는 말 그대로 배트의 움직임을 수치화해 분석하기 위한 도구다. 이 오픈소스는 지난 칼럼에 소개한 딜런 드러미(Dylan Drummy)의 초기 연구를 기반으로 하고 있다.
기존의 데이터셋은 대부분 선수의 자세에 초점을 맞췄다. 하지만 배트나 글러브 같은 외부 객체와 선수의 상호작용에 대해서는 충분한 정보를 제공하지 못했다. 그러나 이 새로운 오픈소스는 처음으로 배트 궤적, 회전, 임팩트 타이밍 등을 정밀하게 측정할 수 있도록 설계됐다. 이는 타자의 스윙을 단순히 ‘빠른지’ 여부가 아니라 어디서 어떻게 가속이 시작되고 끝나는지, 이상적인 임팩트 구간은 어디인지를 과학적으로 분석할 수 있게 한다.
특히 이 오픈소스의 진가는 드라이브라인 홈페이지에 올라온 설명글에서 드러난다. 설명글에서는 오픈소스의 제작자들이 어떠한 과정을 거쳐 데이터를 수집하고 어떤 발상으로 정보를 구체화하였는지 상세히 적혀있다.
연구자들은 고성능 RGB 카메라를 활용해 빠르게 돌아가는 배트의 잔상을 최소화한다. 이어 배트 길이나 두께 등을 미리 저장해놓고 사용해 카메라의 내외부 매개 변수들을 추론하는 방식으로 데이터를 활용했다. 드라이브라인은 이를 통해 무거운 인공지능 모델의 개입을 최소화해 한 영상당 10초 정도의 빠른 시간 내에 배트 위치를 추정하고 속도를 측정하는 파이프라인을 개발했다.
<드라이브라인 측에서 공개한 데이터셋(좌)와 필자가 직접 라벨링한 사회인야구 선수의 데이터셋. 좌측 사진의 선수가 더 빠른 속도로 배트를 휘두르고 있음에도 오른쪽 사진보다 배트의 잔상이 더 적다.>
# 마치며 : 오픈 소스의 시대, 우리 야구 현장에 필요한 것은 무엇인가?
드라이브라인의 오픈소스들은 단순히 ‘기술적 진보’를 넘어 야구라는 스포츠를 정량적이고 과학적으로 이해하고 해석할 수 있는 길을 열어주고 있다. 가장 중요한 것은 이러한 도구들이 누구에게나 열려 있다는 점이다. 과거에는 고가의 장비와 전문가 네트워크 없이는 접근할 수 없었던 연구 환경이 이제는 노트북과 카메라, 오픈소스 도구만으로도 가능해진 시대가 된 것이다.
하지만 여기에는 한 가지 중요한 현실이 있다. 바로 데이터의 절대적인 부족이다. 드라이브라인이 공개한 OpenBiomechanics나 배트 추적 데이터셋은 그 기술력과 구조 면에서는 인상적이다. 하지만 실제 데이터의 수량은 약 200개 안팎에 불과하다. 연구자들에게는 데이터의 정밀도만큼이나 표본의 다양성이 중요하다. 선수의 나이, 체형, 레벨, 손잡이, 부상 이력 등 수많은 요인이 영향을 미치기 때문이다.
결국 현장과 연구자들은 이 적은 데이터를 어떻게 해석하고 확장할지에 대한 고민을 함께 안고 가야 한다. 그리고 이는 어쩌면 오픈소스 도입 그 자체보다 더 어려운 숙제일 수 있다. 국내에는 이미 상당히 많은 야구 아카데미나 스포츠 연구자들이 존재하며 이들의 교류의 장 역시 존재한다. 이제 우리 프로야구 현장에 필요한 것은 이러한 기반을 바탕으로 현장에서 자체적인 데이터 수집 문화를 만들고 데이터를 공유하며 확장해 나가는 역량일 것이다.
참고 = Drivelineresearch github, https://www.drivelinebaseball.com/2025/02/bat-tracking-computer-vision-and-the-next-frontier/
야구공작소 표상훈 칼럼니스트
에디터 = 야구공작소 익명, 전언수
일러스트 = 야구공작소 김성윤
ⓒ야구공작소. 출처 표기 없는 무단 전재 및 재배포를 금합니다. 상업적 사용은 별도 문의 바랍니다.
댓글 남기기