KBO 야구이야기

세이버메트릭스(Sabermetrics), 야구와 통계, 야구 용어 이해하기 1

알콩달콩부부 2023. 7. 3.
반응형

빌 제임스의 Historical Baseball Abstract(출처 : 네이버 지식백과)

세이버메트릭스란?(Sabermetrics)

빌 제임스의 정의를 따르자면, 세이버메트릭스는 ‘야구에 대한 객관적 지식을 찾고자 하는 연구’이다. 

이대호 선수를 예로 들어 보자.

이대호 선수가 최고인 이유는 내가 그 선수를 좋아하기 때문이다.

과연 다른 이들에게 설득력이 있을까? 좋아한다는 감정은 주관적이기 때문에, 결국 이대호를 싫어하는 사람에게는 아무런 설득력을 가지지 못한다. 이런 상황에서 세이버메트릭스가 설득력을 얻는 과정은 다음과 같다.

- 이대호 선수의 시즌 기록은 어떠했는가?
- 리그의 평균적인 수준에 비해 이대호 선수는 어느 정도 우수했는가?
- 리그 최정상급 타자들과 비교했을 때 어느정도의 우위를 가질 수 있는가?

위의 항목과 비슷한 주제의 연구를 수행하여, 최종적 결과를 얻는 것이다.

실제로, 2010년 이대호 선수는 타격 7관왕에 오름으로써 다른 모든 타자들에 비해 기록적으로 우수함을 증명했고, 이대호 선수는 2010년 최고의 타자라 할 수 있을 정도의 객관적 증거를 얻을 수 있게 된 것이다. 이것을 부정할 사람은 그리 많지 않다. 세이버메트릭스는 이렇게 기록을 통해 최대한 객관적 접근 방식으로 설득력을 얻으려 하며, 또 많은 논쟁을 통해 선수를 더욱 잘 설명할 수 있는 지표를 찾아 나가고자 한다.

출처 : [네이버 지식백과] 세이버메트릭스 - 야구 기록 (야구 대백과, 송민구)

 

그렇다면 현대야구에서 가장 많이 등장하는 야구 기록 관련한 용어에 대해서 알아보자 

먼저 투수와 타자가 공통적으로 사용하는 기록, 투수, 타자 순으로 정리하였다.

 

1. 공통

WAR

세이버메트릭스 기록의 하나로, Wins Above Replacement(대체 수준 대비 승리 기여)의 약어.

야구의 세이버메트릭스 기록의 하나로, 선수가 팀 승리에 얼마나 기여했는가를 표현하는 종합적인 성격의 스탯이다.

오늘날 야구에서 가장 각광받는 스탯이라 해도 과언이 아니다.

이 지표의 값은 곧 팀의 승수를 의미하며, 이에 따라 한국어로 읽을 때는 nWAR을 'n승'이라고 읽어도 무방하다. 다만 중요한 것은 (0에서 출발이 아니라) 대체 선수에 비해 몇 승을 더 기여했는지를 나타낸다는 것이다.

출처 : 나무위키

쉽게 말하면 WAR이 높을수록 가치가 높고, 실제로 높은 선수 대다수가 연봉이 높은 경우가 많다. 

BABIP

야구의 스탯 중 하나. 간단히 '바빕' 혹은 '배빕'으로 부른다.

인플레이로 이어진 타구에 대한 타율을 계산하는 용어이다. 타자와 투수 모두에게 적용할 수 있는 스탯. 

 

BABIP이란 무엇인가?
한국프로야구에서 가장 낮은 BABIP를 기록한 투수는 2009 시즌 우주의 기운을 받은 유동훈의 0.181로 2위와는 꽤 많은 차이가 난다. 메이저리그에서도 1871년부터 2012년까지 단일시즌 50이닝 이상 투구를 기준으로 정렬해서 나온 22637건 중에서 유동훈보다 낮은 BABIP을 기록한 경우는 겨우 9건이다. 반대로 가장 높은 BABIP를 기록한 타자는 2013 시즌 채태인으로 0.472를 기록했다. 이 수치는 100년 넘는 메이저리그 역대 단일시즌 스탯에도 없었던 수치이다.

출처 : 나무위키

쉽게 접근하면 BABIP은 투수는 낮을수록, 타자는 높을수록 좋은 지표라고 할 수 있다. 

WPA

야구에서, 승리 확률 기여도(Win Probability Added, WPA)는 두 상황 간의 기대 승률(Win Expectancy, WE) 차이를 나타낸다. 여기서 말하는 상황은 주자 상황, 아웃 개수, 이닝, 점수차의 조합으로 정의되며, 기대 승률은 그렇게 정의된 각각의 상황에서 출발했을 때 최종적으로 팀이 승리할 확률을 의미한다. 플레이를 통해 소속팀의 기대 승률을 증가 혹은 시킨 선수는 그 변화량을 자신의 WPA로 갖게 된다.

예를 들어 설명하자면, 어떤 선수가 타석에 들어서기 직전의 이길 확률이 0.1이었고 그 선수의 플레이가 끝났을 때 (쉽게 말해 아웃. 주루사도 포함) 이길 확률이 0.3이었다면 WPA는 0.2가 된다. 물론 시즌 중에 한 타석만 들어가는 건 아니므로 이 수치들을 누적한다. 하여간 쉽게 말해 우리가 막연하게 느끼는 "영양가"라 보면 대충 맞는다. 예를 들어 같은 홈런을 쳐도 왕창 이기고 있을 때만 펑펑치고 정작 중요할 때는 침묵하는 선수는 타율이나 장타율 등의 스탯에 비해 WPA 가 낮다.

유의해야 할 것이, 모든 경기는 승률 50%에서 시작하므로 WPA가 1이면 한 경기가 아니라 두 경기를 자력으로 승리로 이끌었다는 뜻이 된다.

출처 : 나무위키

쉽게말해 WPA가 높으면 좋은 것으로 보면 되나 다른 기록에 비해서는 정확하고 유의미 한 부분이 떨어질 순 있음 

2. 투수

ERA

평균자책점()은 야구에서 투수가 한 게임(9이닝) 당 내준 평균(Average) 자책점(Earned Runs)이다. Earned run average의 약칭인 ERA, 평자점, 평자, 평자책으로 줄여부른다. 2000년대 중반까지는 방어율이라는 용어가 주로 사용됐지만 2010년대부터는 잘 쓰이지 않고 있다.
야구에서 주로 쓰이기는 하지만 다른 구기에서도 쓰인다. 경기당 실점(Goals Against Average; GAA/AGA)이라고 하며 출장 시간을 사용한다. 주로 쓰이는 대상은 골키퍼. 이게 낮을 수록 골키퍼와 수비 간의 조율이 잘 된다고 보고 있다.

출처 : 나무위키

쉽게 접근하면 ERA는 낮을수록 좋고, 과거에는 다승이 높은 가치를 가졌다면 현대야구는 ERA의 가치가 더 높아지는 추세이다. 

WHIP

Walks plus Hits divided by Innings Pitched. 이닝당 볼넷+안타 허용률.

투수들을 평가하는 기록(Stat) 중 하나. 1979년 야구기자이자 작가이며, 판타지 리그의 표준으로 자리잡은 로티서리 방식의 창시자인 대니얼 오크렌트가 창안해 낸 스탯이다.

인터넷 등지에서 이닝당 출루허용률이라는 식으로 잘못 부르는 경우가 매우 많은데 이렇게 부를 경우 몸에 맞는 볼을 포함시키는 이름이 되기 때문에 문제가 있다. 몸에 맞는 볼까지 포함하는 WHIP+라는 기록을 따로 표현하기도 한다.

출처 : 나무위키

쉽게 접근하면 1이닝당 동안 던졌을 때 홈에서 떠나보낸 타자의 예상 숫자라 할 수 있는데, 선발투수 기준에서 리그 최상위권 에이스의 경우 1.0 전후, 역대 최고투수는 0점대이고 보통 1.8 이상의 숫자가 나오면 대체선수급으로 아무튼 낮을수록 좋은 기록이라고 보면 된다. 

3. 타자

wRC+

Weighted Runs Created의 줄임말로 조정 득점 창출력을 말한다. 뒤에 +가 붙은 건 파크팩터 등을 추가로 반영했다는 의미다. 한국 야구팬들 사이에서는 주로 우르크라는 약칭으로 불린다.

의미 그대로 타자의 득점 생산력을 나타내며, 현존하는 타격 스탯 중 가장 정확한 타격 스탯으로 여겨진다.

출처 : 나무위키

wRC+ 스케일 표

표를 보면 알듯이 좋은 타자의 기준은 115 이상이라고 보면 되고 80 이하의 선수는 대체선수급이라고 보면 된다.

 

이번에는 세이버메트릭스의 정의와 세이버메트릭스중 가장 널리 쓰이고 대표적인 기록, 지표에 대해서 알아봤는데

이것 이외에도 수많은 기록들이 결집되어 있는것이 세이버메트릭스이고 그러한 부분들이 야구팀과 선수들을 정확하게 표현하는 것은 아니지만 '기록의 스포츠'라고 일컫는 '야구'를 더 수준 높게, 재밌게 만드는 큰 요소인 것만큼은 분명하다고 생각한다. 

반응형

댓글