Gráfico de violín

Compartir Imprimir Citar

Un gráfico de violín es un método para trazar datos numéricos. Es similar a un diagrama de caja, con la adición de un diagrama de densidad kernel rotado en cada lado.

Los diagramas de violín son similares a los diagramas de caja, excepto que también muestran la densidad de probabilidad de los datos en diferentes valores, generalmente suavizados por un estimador de densidad kernel. Por lo general, un diagrama de violín incluirá todos los datos que se encuentran en un diagrama de caja: un marcador para la mediana de los datos; un cuadro o marcador que indica el rango intercuartílico; y posiblemente todos los puntos de muestra, si el número de muestras no es demasiado alto.

Los gráficos de violín están disponibles como extensiones de varios paquetes de software, como DataVisualization en CRAN y el paquete md-plot en PyPI.

Un diagrama de violín es más informativo que un diagrama de caja simple. Mientras que un diagrama de caja solo muestra estadísticas resumidas, como la media/mediana y los rangos intercuartílicos, el diagrama de violín muestra la distribución completa de los datos. La diferencia es particularmente útil cuando la distribución de datos es multimodal (más de un pico). En este caso, un diagrama de violín muestra la presencia de diferentes picos, su posición y amplitud relativa.

Al igual que los diagramas de caja, los diagramas de violín se utilizan para representar la comparación de una distribución variable (o distribución de muestra) entre diferentes "categorías" (por ejemplo, la distribución de temperatura comparada entre el día y la noche, o la distribución de precios de automóviles comparada entre diferentes fabricantes de automóviles).

Una trama de violín puede tener varias capas. Por ejemplo, la forma exterior representa todos los resultados posibles. La siguiente capa interior podría representar los valores que ocurren el 95% del tiempo. La siguiente capa (si existe) dentro podría representar los valores que ocurren el 50% del tiempo.

Aunque son más informativos que los diagramas de caja, son menos populares. Debido a su impopularidad, su significado puede ser más difícil de comprender para muchos lectores que no están familiarizados con la representación de la trama del violín. En este caso, una alternativa más accesible puede ser trazar una serie de histogramas apilados o distribuciones de densidad de kernel.

Los diagramas de violín están disponibles como extensiones de varios paquetes de software, incluidos los paquetes de R vioplot, wvioplot, caroline, UsingR, lattice y ggplot2, el comando adicional de Stata vioplot y las bibliotecas de Python matplotlib, Plotly, ROOT y Seaborn, una tipo de gráfico en Origin, IGOR Pro, el paquete de trazado estadístico de Julia StatsPlots.jl y DistributionChart en Mathematica.