Resumen de cinco números

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Conjunto de estadísticas descriptivas

El resumen de cinco números es un conjunto de estadísticas descriptivas que proporciona información sobre un conjunto de datos. Consta de los cinco percentiles muestrales más importantes:

  1. mínimo de la muestra (smallest observation)
  2. el cuartil inferior o primer cuartil
  3. la mediana (el valor medio)
  4. el cuartil superior o tercer cuartil
  5. el máximo de la muestra (observación mayor)

Además de la mediana de un único conjunto de datos, existen dos estadísticas relacionadas denominadas cuartiles superior e inferior. Si los datos se colocan en orden, el cuartil inferior es central para la mitad inferior de los datos y el cuartil superior es central para la mitad superior de los datos. Estos cuartiles se utilizan para calcular el rango intercuartílico, lo que ayuda a describir la dispersión de los datos y determinar si los puntos de datos son atípicos o no.

Para que existan estas estadísticas, las observaciones deben ser de una variable univariada que se pueda medir en una escala ordinal, de intervalo o de razón.

Uso y representación

El resumen de cinco números proporciona un resumen conciso de la distribución de las observaciones. Informar cinco números evita la necesidad de decidir sobre la estadística de resumen más adecuada. El resumen de cinco números brinda información sobre la ubicación (desde la mediana), la dispersión (desde los cuartiles) y el rango (desde el mínimo y el máximo de la muestra) de las observaciones. Dado que informa estadísticas de orden (en lugar de, por ejemplo, la media), el resumen de cinco números es adecuado para mediciones ordinales, así como para mediciones de intervalos y proporciones.

Es posible comparar rápidamente varios conjuntos de observaciones comparando sus resúmenes de cinco números, que se pueden representar gráficamente mediante un diagrama de caja.

Además de los puntos en sí, se pueden calcular muchos estimadores L a partir del resumen de cinco números, incluido el rango intercuartílico, la bisagra media, el rango, el rango medio y el trimean.

El resumen de cinco números a veces se representa como en la siguiente tabla:

mediana
Primer cuartil3o cuartil
MínimoMáximo

Ejemplo

Este ejemplo calcula el resumen de cinco números para el siguiente conjunto de observaciones: 0, 0, 1, 2, 63, 61, 27, 13. Estos son el número de lunas de cada planeta en el Sistema Solar.

Es útil poner las observaciones en orden ascendente: 0, 0, 1, 2, 13, 27, 61, 63. Hay ocho observaciones, por lo que la mediana es la media de los dos números del medio (2 + 13)/2 = 7,5. Dividir las observaciones a ambos lados de la mediana da dos grupos de cuatro observaciones. La mediana del primer grupo es el cuartil inferior o primero, y es igual a (0 + 1)/2 = 0,5. La mediana del segundo grupo es el cuartil superior o tercero, y es igual a (27 + 61)/2 = 44. Las observaciones más pequeñas y más grandes son 0 y 63.

Entonces, el resumen de cinco números sería 0, 0.5, 7.5, 44, 63.

Ejemplo en R

Es posible calcular el resumen de cinco números en el lenguaje de programación R usando la función fivenum. La función summary, cuando se aplica a un vector, muestra el resumen de cinco números junto con la media (que no forma parte del resumen de cinco números). fivenum utiliza un método diferente para calcular los percentiles que la función summary.

lunas . c()0, 0, 1, 2, 63, 61, 27, 13)cinco años()lunas)[1] 0,0 0,5 7,5 44,0 63,0Resumen()lunas) Min. 1st Qu. Median Mean 3rd Qu. Max.  0,00 0,75 7,50 20,88 35,50 63,00

Ejemplo en Python

Este ejemplo de Python usa la función percentile de la biblioteca numérica numpy y funciona en Python 2 y 3.

importación numposo como npdef cinco años()datos): ""Five-number summary."" retorno np.percentil()datos, [0, 25, 50, 75, 100] método="midpoint")
, titulado lunas = [0, 0, 1, 2, 63, 61, 27, 13], titulado impresión()cinco años()lunas)[ 0,5 7,5 44. 63. ]

Ejemplo en SAS

Puede usar PROC UNIVARIATE en SAS (software) para obtener el resumen de cinco números:

 datos cinco años;
 entrada x @@;
 Datalines; 1 2 3 4 20 202 392 4 38 20; correr;ods seleccionar Quantiles; proc univariate datos = 5 años;
 Producto Fuera. = 5nums min = min; correr;  proc print datos = 5 años; correr;

Ejemplo en Stata

Un resumen de cinco números de una distribución de datos.
 entrada byte
 0 0 1 2 63 61 27 13 final  lista  tabstat y, estadísticas (min q max)

Contenido relacionado

Clasificación de raíz

En informática, radix sort es un algoritmo de clasificación no comparativo. Evita la comparación al crear y distribuir elementos en cubos de acuerdo con su...

Topología diferencial

En matemáticas, la topología diferencial es el campo que se ocupa de las propiedades topológicas y las propiedades uniformes de las variedades uniformes....

Autocorrelación

Autocorrelación, a veces conocida como correlación en serie en el caso de tiempo discreto, es la correlación de una señal con una copia retrasada de sí...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save