Sabermetrics

Ajustar Compartir Imprimir Citar
Análisis de las estadísticas de béisbol

En el análisis deportivo, Sabermetrics (originalmente SABRmetrics) es el análisis empírico del béisbol, especialmente las estadísticas de béisbol que miden la actividad en el juego. Los sabermetristas recopilan y resumen los datos relevantes de esta actividad en el juego para responder preguntas específicas. El término se deriva del acrónimo SABR, que significa Society for American Baseball Research, fundada en 1971. El término "sabermetrics" fue acuñado por Bill James, quien es uno de sus pioneros y, a menudo, se lo considera su defensor y rostro público más destacado.

Historia temprana

Henry Chadwick, un periodista deportivo de Nueva York, desarrolló el box score en 1858. Esta fue la primera forma en que los estadísticos pudieron describir el deporte del béisbol mediante el seguimiento numérico de varios aspectos del juego. La creación de la puntuación de caja les ha dado a los estadísticos de béisbol un resumen de las actuaciones individuales y de equipo para un juego determinado.

La investigación de la sabermetría comenzó a mediados del siglo XX con los escritos de Earnshaw Cook, uno de los primeros sabermetristas. El libro de Cook de 1964 Percentage Baseball fue uno de los primeros de su tipo. Al principio, la mayoría de los equipos de béisbol organizados y los profesionales descartaron el trabajo de Cook como algo sin sentido. La idea de una ciencia de las estadísticas del béisbol comenzó a legitimarse en 1977 cuando Bill James comenzó a publicar Baseball Abstracts, su compendio anual de datos de béisbol. Sin embargo, las ideas de James tardaron en encontrar una amplia aceptación.

Bill James creía que había un malentendido generalizado acerca de cómo se jugaba el juego de béisbol, alegando que el deporte no estaba definido por sus reglas, sino que en realidad, como resumió el profesor de ingeniería Richard J. Puerzer, "definido por las condiciones bajo las cuales se juega el juego, específicamente, los estadios pero también los jugadores, la ética, las estrategias, el equipo y las expectativas del público." Los sabermetristas, a veces considerados estadísticos del béisbol, comenzaron a tratar de reemplazar la estadística favorita desde hace mucho tiempo conocida como promedio de bateo. Se ha afirmado que el promedio de bateo del equipo proporciona un ajuste relativamente pobre para las carreras anotadas por el equipo. El razonamiento sabermétrico diría que las carreras ganan juegos de pelota, y que una buena medida del valor de un jugador es su capacidad para ayudar a su equipo a anotar más carreras que el equipo contrario.

Antes de que Bill James popularizara la sabermetría, Davey Johnson utilizó un IBM System/360 en la cervecería del propietario del equipo, Jerold Hoffberger, para escribir una simulación informática de béisbol FORTRAN mientras jugaba para los Orioles de Baltimore a principios de la década de 1970. Usó sus resultados en un intento fallido de promoverle a su manager Earl Weaver la idea de que debería batear segundo en la alineación. Escribió programas IBM BASIC para ayudarlo a administrar Tidewater Tides, y después de convertirse en gerente de los Mets de Nueva York en 1984, hizo arreglos para que un empleado del equipo escribiera una aplicación dBASE II para compilar y almacenar métricas avanzadas en las estadísticas del equipo. Craig R. Wright fue otro empleado de Major League Baseball, trabajando con los Texas Rangers a principios de la década de 1980. Durante su tiempo con los Rangers, se hizo conocido como el primer empleado de la oficina principal en la historia de la MLB en trabajar bajo el título de Sabermetrician.

David Smith fundó Retrosheet en 1989, con el objetivo de computarizar el puntaje de caja de todos los partidos de béisbol de las Grandes Ligas jamás jugados, para recopilar y comparar con mayor precisión las estadísticas del juego.

Los Atléticos de Oakland comenzaron a utilizar un enfoque más cuantitativo del béisbol centrándose en los principios sabermétricos en la década de 1990. Esto comenzó inicialmente con Sandy Alderson como gerente general del equipo cuando usó los principios para obtener jugadores relativamente infravalorados. Sus ideas continuaron cuando Billy Beane asumió como gerente general en 1997, cargo que ocupó hasta 2015, y contrató a su asistente Paul DePodesta. A través del análisis estadístico realizado por Beane y DePodesta en la temporada 2002, los Atléticos de Oakland ganaron 20 juegos seguidos. Este fue un momento histórico para la franquicia, en el que se disputó el partido número 20 en el Coliseo del Condado de Alameda. Sus enfoques del béisbol pronto ganaron reconocimiento nacional cuando Michael Lewis publicó Moneyball: The Art of Winning an Unfair Game en 2003 para detallar el uso de Sabermetrics por parte de Beane. En 2011, una película basada en Lewis' El libro, también llamado Moneyball, fue lanzado y dio una amplia exposición a las técnicas utilizadas en los Oakland Athletics' Oficina frontal.

Medidas tradicionales

Sabermetrics se creó en un intento de que los fanáticos del béisbol aprendan sobre el deporte a través de evidencia objetiva. Esto se lleva a cabo evaluando a los jugadores en todos los aspectos del juego, específicamente en bateo, lanzamiento y fildeo. Estas medidas de evaluación generalmente se expresan en términos de carreras o victorias del equipo, ya que las estadísticas más antiguas se consideraron ineficaces.

Medidas de bateo

La medida tradicional del rendimiento de bateo se considera como hits divididos por el número total de turnos al bate. Bill James, junto con otros padres de la sabermetría, encontraron que esta medida era defectuosa, ya que ignora cualquier otra forma en que un bateador puede llegar a la base además de un hit. Esto condujo a la creación del porcentaje en base, que toma en consideración las bases por bolas y los golpes por lanzamiento. Para calcular el porcentaje en base, el número total de hits + bases por bolas + hit por lanzamiento se divide por turnos al bate + bases por bolas + hit por lanzamiento + elevados de sacrificio.

Otro problema con la medida tradicional del promedio de bateo es que no distingue entre hits (es decir, sencillos, dobles, triples y jonrones) y otorga a cada hit el mismo valor. Por lo tanto, se creó una medida que diferencia entre estos cuatro resultados de golpe, el porcentaje de slugging. Para calcular el porcentaje de slugging, el número total de bases de todos los hits se divide por el número total de veces al bate. Stephen Jay Gould propuso que la desaparición del promedio de bateo de.400 es en realidad una señal de mejora general en el bateo. Esto se debe a que, en la era moderna, los jugadores se están enfocando más en golpear por poder que por el promedio. Por lo tanto, se ha vuelto más valioso comparar jugadores usando el porcentaje de slugging y el porcentaje de embase sobre el promedio de bateo.

Estas dos medidas sabermétricas mejoradas son habilidades importantes para medir en un bateador y se han combinado para crear la estadística moderna en base más slugging (OPS). OPS es la suma del porcentaje en base y el porcentaje de slugging. Esta estadística moderna se ha vuelto útil para comparar jugadores y es un método poderoso para predecir las carreras anotadas por un determinado jugador.

Algunas de las otras estadísticas que usan los sabermetristas para evaluar el rendimiento de bateo son el promedio en base ponderado, el promedio secundario, las carreras creadas y el promedio equivalente.

Medidas de lanzamiento

La medida tradicional del desempeño de los lanzadores es el promedio de carreras ganadas. Se calcula como carreras limpias permitidas por 9 entradas. El promedio de carreras limpias no separa la habilidad del lanzador de las habilidades de los fildeadores con los que juega. Otra medida clásica para lanzar es el porcentaje de victorias de un lanzador. El porcentaje de victorias se calcula dividiendo las victorias por el número de decisiones (ganadas y derrotas). El porcentaje de victorias también depende en gran medida del equipo del lanzador, particularmente de la cantidad de carreras que anota.

Los sabermetristas han intentado encontrar diferentes medidas del desempeño de los lanzadores que excluyan el desempeño de los fildeadores involucrados. Uno de los primeros desarrollados, y uno de los más populares en uso, es la base por bolas más hits por entrada lanzada (WHIP, por sus siglas en inglés), que si bien no es completamente independiente de la defensa, tiende a indicar cuántas veces es probable que un lanzador coloque a un jugador en la base. (ya sea por base sobre bolas, golpe por lanzamiento o golpe de base) y, por lo tanto, qué tan efectivos son los bateadores contra un lanzador en particular para alcanzar la base. Un desarrollo más reciente es la creación del sistema de estadísticas de lanzamiento independiente de defensa (DIPS). A Voros McCracken se le atribuye el desarrollo de este sistema en 1999. A través de su investigación, McCracken pudo demostrar que hay poca o ninguna diferencia entre los lanzadores en la cantidad de hits que permiten en las bolas puestas en juego, independientemente de su nivel de habilidad.. Algunos ejemplos de estas estadísticas son la efectividad independiente de la defensa, el lanzamiento independiente del campo y la efectividad del componente independiente de la defensa. Otros sabermétricos han promovido el trabajo en DIPS, como Tom Tango, que dirige el sitio web de sabermetría Tango on Baseball.

Baseball Prospectus creó otra estadística llamada ERA periférica. Esta medida del rendimiento de un lanzador toma hits, bases por bolas, jonrones permitidos y ponches mientras se ajusta a los factores del estadio. Cada estadio tiene diferentes dimensiones en lo que respecta a la pared del jardín, por lo que un lanzador no debe tener las mismas medidas para cada uno de estos parques.

El promedio de bateo en bolas en juego (BABIP) es otra medida útil para determinar el rendimiento de los lanzadores. Cuando un lanzador tiene un BABIP alto, a menudo mostrará mejoras en la temporada siguiente, mientras que un lanzador con un BABIP bajo a menudo mostrará una disminución en la temporada siguiente. Esto se basa en el concepto estadístico de regresión a la media. Otros han creado varios medios para tratar de cuantificar lanzamientos individuales en función de las características del lanzamiento, a diferencia de las carreras ganadas o las bolas golpeadas.

Métodos avanzados

El valor sobre el jugador de reemplazo (VORP) alguna vez se consideró una estadística sabermétrica popular. Esta estadística demuestra cuánto contribuye un jugador a su equipo en comparación con un jugador hipotético que se desempeña al nivel mínimo necesario para ocupar un puesto en el roster de un equipo de las Grandes Ligas. Esta medida fue inventada por Keith Woolner, ex escritor del grupo/sitio web sabermetric Baseball Prospectus.

Las victorias por encima del reemplazo (WAR) son otra estadística sabermétrica popular para evaluar las contribuciones de un jugador a su equipo. Similar a VORP, WAR compara a un jugador dado con un jugador de nivel de reemplazo para determinar la cantidad de victorias adicionales que el jugador ha brindado a su equipo. Los valores de WAR varían con las posiciones de bateo y están determinados en gran medida por el desempeño exitoso de un jugador y la cantidad de tiempo de juego.

Análisis cuantitativo en béisbol

Muchas estadísticas tradicionales y modernas, como ERA y Wins Shared, no brindan una comprensión completa de lo que sucede en el campo. Las proporciones simples no son suficientes para comprender los datos estadísticos del béisbol. El análisis cuantitativo estructurado es capaz de explicar muchos aspectos del juego, por ejemplo, para examinar con qué frecuencia un equipo debe intentar robar.

Aplicaciones

Sabermetrics se puede utilizar para múltiples propósitos, pero los más comunes son evaluar el rendimiento pasado y predecir el rendimiento futuro para determinar las contribuciones de un jugador a su equipo. Estos pueden ser útiles para determinar quién debe ganar premios de fin de temporada, como MVP, y para determinar el valor de realizar un intercambio determinado.

La mayoría de los jugadores de béisbol tienden a jugar algunos años en las ligas menores antes de ser llamados a las ligas mayores. Las diferencias competitivas junto con los efectos de estadio de béisbol hacen que la comparación exacta de las estadísticas de un jugador sea un problema. Los sabermetristas han podido solucionar este problema ajustando las estadísticas de ligas menores del jugador, también conocidas como equivalencia de ligas menores. A través de estos ajustes, los equipos pueden ver el desempeño de un jugador tanto en AA como en AAA para determinar si es apto para ser llamado a las mayores.

Estadísticas aplicadas

Los métodos de Sabremetrics generalmente se usan para tres propósitos:

  1. Para comparar los resultados clave entre ciertos jugadores específicos en condiciones realistas de datos. La evaluación del rendimiento pasado de un jugador permite un panorama analítico. La comparación de estos datos entre jugadores puede ayudar a entender puntos clave como sus valores de mercado. De esa manera, se puede definir el papel y el salario que se debe dar a ese jugador.
  2. Proporcionar predicción del rendimiento futuro de un determinado jugador o un equipo. Cuando los datos pasados están disponibles sobre el rendimiento de un equipo o un jugador específico, Sabermetrics se puede utilizar para predecir los resultados futuros promedio para la próxima temporada. Así, se puede hacer una predicción con cierta probabilidad sobre el número de victorias y pérdidas.
  3. Para proporcionar una función útil de las contribuciones del jugador a su equipo. Cuando se analizan los datos, se puede entender las contribuciones que un jugador hace al éxito/failure de su equipo. Dada esa correlación, se puede firmar o liberar objetivamente a los jugadores con ciertas características.

Modelo de aprendizaje automático

Se puede crear un modelo de aprendizaje automático utilizando conjuntos de datos disponibles en fuentes como baseball-reference. Este modelo dará estimaciones de probabilidad para el resultado de juegos específicos o el desempeño de jugadores particulares. Estas estimaciones son cada vez más precisas cuando se aplican a un gran número de eventos a largo plazo. El resultado del juego (ganar/perder) se trata como si tuviera una distribución binomial.

Las predicciones se pueden hacer usando un modelo de regresión logística con variables explicativas que incluyen: oponentes' carreras anotadas, carreras anotadas, tiempo de blanqueadas al bate, porcentaje de victorias y látigo del lanzador.

Avances recientes

Muchos sabermetristas siguen trabajando arduamente para contribuir al campo mediante la creación de nuevas medidas y la formulación de nuevas preguntas. Bill James' dos ediciones de Resumen histórico del béisbol y el libro Win Shares han seguido avanzando en el campo de la sabermetría, 25 años después de que ayudó a iniciar el movimiento. Su ex asistente Rob Neyer, quien ahora es escritor senior en ESPN.com y editor nacional de béisbol de SBNation, también trabajó en la popularización de sabermetrics desde mediados de la década de 1980.

Nate Silver, ex escritor y socio gerente de Baseball Prospectus, inventó PECOTA. Este acrónimo significa Algoritmo de prueba de optimización y comparación empírica de jugadores, y es un sistema sabermétrico para pronosticar el rendimiento de los jugadores de las Grandes Ligas. En pocas palabras, supone que las carreras de jugadores similares seguirán una trayectoria similar. Este sistema ha sido propiedad de Baseball Prospectus desde 2003 y ayuda a los autores del sitio web a inventar o mejorar técnicas y medidas sabermétricas ampliamente utilizadas.

A partir de la temporada de béisbol de 2007, la MLB comenzó a buscar tecnología para registrar información detallada sobre cada lanzamiento que se realiza en un juego. Esto se conoció como el sistema PITCHf/x, que es capaz de registrar la velocidad del lanzamiento, en su punto de lanzamiento y cuando cruzó el plato, así como la ubicación y el ángulo del quiebre de ciertos lanzamientos a través de cámaras de video. FanGraphs es un sitio web que favorece este sistema, así como el análisis de datos jugada a jugada. El sitio web también se especializa en publicar estadísticas avanzadas de béisbol, así como gráficos que evalúan y rastrean el desempeño de jugadores y equipos.

En la cultura popular