Rango medio

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

En estadística, el rango medio o extremo medio es una medida de tendencia central de una muestra definida como la media aritmética de los valores máximo y mínimo de la conjunto de datos:

El rango medio está estrechamente relacionado con el rango, una medida de dispersión estadística definida como la diferencia entre los valores máximo y mínimo. Las dos medidas son complementarias en el sentido de que si se conocen el rango medio y el rango, se pueden encontrar los valores máximo y mínimo de la muestra.

El rango medio rara vez se utiliza en el análisis estadístico práctico, ya que carece de eficiencia como estimador para la mayoría de las distribuciones de interés, porque ignora todos los puntos intermedios y carece de solidez, ya que los valores atípicos lo cambian significativamente. De hecho, para muchas distribuciones es una de las estadísticas menos eficientes y menos sólidas. Sin embargo, encuentra algún uso en casos especiales: es el estimador de máxima eficiencia para el centro de una distribución uniforme, los rangos medios recortados abordan la robustez y, como estimador L, es fácil de entender y calcular.

Robustez

El rango medio es altamente sensible a los overliers e ignora todos menos dos puntos de datos. Por lo tanto, es una estadística muy no rota, teniendo un punto de descomposición de 0, lo que significa que una observación única puede cambiarla arbitrariamente. Además, está muy influenciada por los outliers: aumentar el máximo de la muestra o disminuir el mínimo de la muestra por x cambia el rango medio por mientras que cambia la muestra significa, que también tiene punto de descomposición de 0, por sólo Por lo tanto, es de poco uso en las estadísticas prácticas, a menos que los outliers ya sean manejados.

Un rango medio recortado se conoce como midsummary: el rango medio recortado n% es el promedio de los percentiles n% y (100−n)%, y es más robusto y tiene un punto de ruptura del n%. En medio de estos está la bisagra media, que es el resumen medio del 25%. La mediana puede interpretarse como el rango medio totalmente recortado (50%); esto concuerda con la convención de que la mediana de un número par de puntos es la media de los dos puntos medios.

Estos rangos medios recortados también son de interés como estadísticas descriptivas o como estimadores L de ubicación central o asimetría: las diferencias de resúmenes medios, como la bisagra media menos la mediana, dan medidas de asimetría en diferentes puntos de la cola.

Eficiencia

A pesar de sus inconvenientes, en algunos casos es útil: el rango medio es un estimador altamente eficiente de μ, dada una pequeña muestra de una distribución suficientemente platicúrtica, pero es ineficiente para distribuciones mesocúrticas, como la normal.

Por ejemplo, para una distribución uniforme continua con máximo y mínimo desconocidos, el rango medio es el estimador insesgado de varianza mínima uniforme (UMVU) para la media. El máximo y el mínimo de la muestra, junto con el tamaño de la muestra, son estadísticas suficientes para el máximo y el mínimo de la población; la distribución de otras muestras, condicionada a un máximo y un mínimo dados, es simplemente la distribución uniforme entre el máximo y el mínimo y, por lo tanto, suman sin información. Consulte el problema de los tanques alemanes para obtener más información. Por lo tanto, el rango medio, que es un estimador insesgado y suficiente de la media poblacional, es de hecho el UMVU: usar la media muestral solo agrega ruido basado en la distribución no informativa de los puntos dentro de este rango.

Por el contrario, para la distribución normal, la media muestral es el estimador UMVU de la media. Por lo tanto, para las distribuciones platicúrticas, que a menudo se pueden considerar entre una distribución uniforme y una distribución normal, la informatividad de los puntos muestrales medios versus los valores extremos varía de "igual" para normal a "poco informativo" para distribuciones uniformes y diferentes, una u otra (o alguna combinación de ellas) puede ser más eficiente. Un análogo robusto es el trimean, que promedia la bisagra media (25 % del rango medio recortado) y la mediana.

Pequeñas muestras

Para tamaños de muestra pequeños (n de 4 a 20) extraídos de una distribución suficientemente platicúrtica (curtosis excesiva negativa, definida como γ2 = (μ4 /(μ2)²) − 3), el rango medio es un estimador eficiente de la media μ. La siguiente tabla resume los datos empíricos que comparan tres estimadores de la media para distribuciones de curtosis variada; la media modificada es la media truncada, donde se eliminan el máximo y el mínimo.

Exceso de kurtosis (γ2)Estimador más eficiente μ
−1.2 a 0,8Midrange
−0,8 a 2.0Significa
2.0 a 6.0Significado modificado

Para n = 1 o 2, el rango medio y la media son iguales (y coinciden con la mediana) y son más eficientes para todas las distribuciones. Para n = 3, la media modificada es la mediana y, en cambio, la media es la medida de tendencia central más eficiente para valores de γ2 de 2,0 a 6,0 así como de −0,8 a 2,0.

Propiedades de muestreo

Para una muestra de tamaño n de la distribución normal estándar, el rango medio M es insesgado y tiene una varianza dada por:

Para una muestra de tamaño n de la distribución estándar de Laplace, el rango medio M es insesgado y tiene una varianza dada por:

y, en particular, la varianza no disminuye a cero a medida que crece el tamaño de la muestra.

Para una muestra de tamaño n de una distribución uniforme centrada en cero, el rango medio M es insesgado, nM tiene un valor asintótico distribución que es una distribución de Laplace.

Desviación

Mientras que la media de un conjunto de valores minimiza la suma de cuadrados de desviaciones y la mediana minimiza la desviación absoluta promedio, el rango medio minimiza la desviación máxima (definida como ): es una solución a un problema de variación.

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save