Desviación absoluta promedio

Compartir Imprimir Citar
Resumen estadístico de variabilidad

La desviación absoluta promedio (AAD) de un conjunto de datos es el promedio de las desviaciones absolutas desde un punto central. Es una estadística resumida de dispersión o variabilidad estadística. En forma general, el punto central puede ser una media, mediana, moda o el resultado de cualquier otra medida de tendencia central o cualquier valor de referencia relacionado con el conjunto de datos dado. AAD incluye la desviación absoluta media y la desviación absoluta media (ambas abreviadas como MAD).

Medidas de dispersión

Varias medidas de dispersión estadística se definen en términos de desviación absoluta. El término "desviación absoluta promedio" no identifica de forma única una medida de dispersión estadística, ya que existen varias medidas que se pueden usar para medir las desviaciones absolutas, y hay varias medidas de tendencia central que también se pueden usar. Por tanto, para identificar de forma única la desviación absoluta es necesario especificar tanto la medida de desviación como la medida de tendencia central. La literatura estadística aún no ha adoptado una notación estándar, ya que tanto la desviación absoluta media alrededor de la media como la desviación absoluta mediana alrededor de la mediana se han indicado con sus iniciales "MAD" en la literatura, lo que puede llevar a confusión, ya que en general pueden tener valores considerablemente diferentes entre sí.

Desviación media absoluta alrededor de un punto central

La desviación media absoluta de un conjunto {x1, x2,..., xn} es

1n.. i=1nSilencioxi− − m()X)Silencio.{displaystyle {frac {fn} {fnK}}}}sum} ¿Qué?

La elección de medida de tendencia central, m()X){displaystyle m(X)}, tiene un efecto marcado en el valor de la desviación media. Por ejemplo, para el conjunto de datos {2, 2, 3, 4, 14}:

Medición de la tendencia central m()X){displaystyle m(X)}Una desviación absoluta
Significado Aritmético = 5 Silencio2− − 5Silencio+Silencio2− − 5Silencio+Silencio3− − 5Silencio+Silencio4− − 5Silencio+Silencio14− − 5Silencio5=3.6{fnMicroc} {Principalmente 2-5 personas que han sido detenidas*}=3.6}
Mediano = 3 Silencio2− − 3Silencio+Silencio2− − 3Silencio+Silencio3− − 3Silencio+Silencio4− − 3Silencio+Silencio14− − 3Silencio5=2.8{fnMicroc} {Principalmente 2-3 personas sometidas a tortura2 a 3 personas sometidas a tortura4 a 3 personas sometidas a tortura+14-3 sometidas}{5}=2.8}
Modo = 2 Silencio2− − 2Silencio+Silencio2− − 2Silencio+Silencio3− − 2Silencio+Silencio4− − 2Silencio+Silencio14− − 2Silencio5=3.0{fnMicroc} {resistentes2-2}{5}=3.0}

Desviación media absoluta alrededor de la media

La desviación media absoluta (MAD), también conocida como "desviación media" o, a veces, "desviación absoluta promedio", es la media de las desviaciones absolutas de los datos alrededor de la media de los datos: la distancia promedio (absoluta) desde la media. "Desviación absoluta promedio" puede referirse a este uso o a la forma general con respecto a un punto central específico (ver arriba).

Se ha propuesto utilizar MAD en lugar de la desviación estándar, ya que se corresponde mejor con la vida real. Dado que la MAD es una medida de variabilidad más simple que la desviación estándar, puede resultar útil en la enseñanza escolar.

La precisión del pronóstico de este método está muy relacionada con el método del error cuadrático medio (MSE), que es simplemente el error cuadrático promedio de los pronósticos. Aunque estos métodos están muy relacionados, MAD se usa más comúnmente porque es más fácil de calcular (evitando la necesidad de elevar al cuadrado) y más fácil de entender.

Para la distribución normal, la proporción de media de desviación absoluta de la media a la desviación estándar es 2/π π =0,9788456...... {fnMicrosoft Sans Serif}. Así si X es una variable aleatoria normalmente distribuida con valor esperado 0 entonces, ver Geary (1935):

w=ESilencioXSilencioE()X2)=2π π .{displaystyle w={frac {fnK}{sqrt {E(X^{2}}}={sqrt {fnMicroc {2}{pi} }}}
nwn▪ ▪ [0,1]{displaystyle w_{n}in [0,1]n

Did you mean:

The mean absolute deviation from the mean is less than or equal to the standard deviation; one way of proving this relies on Jensen 's inequality.

Prueba

La desigualdad de Jensen es φ φ ()E[Y])≤ ≤ E[φ φ ()Y)]{displaystyle varphi left(mathbb {E} [Y]right)leq mathbb {E} left[varphi (Y)right]}, donde φ es una función convexa, esto implica para Y=SilencioX− − μ μ Silencio{displaystyle Y=vert X-mu vert } que:

()ESilencioX− − μ μ Silencio)2≤ ≤ E()SilencioX− − μ μ Silencio2){displaystyle left(mathbb {E} SilencioX-mu right sobre la vida)^{2}leq mathbb {E} left(PrinceX-mu Silencio^{2}right)}
()ESilencioX− − μ μ Silencio)2≤ ≤ Var⁡ ⁡ ()X){displaystyle left(mathbb {E} SilencioX-mu right sobre la vida)^{2}leq operatorname {Var} (X)}

Dado que ambas partes son positivas, y la raíz cuadrada es una función monotonicamente creciente en el dominio positivo:

E()SilencioX− − μ μ Silencio)≤ ≤ Var⁡ ⁡ ()X){displaystyle mathbb {E} left(PrinceX-muright privacy)leq {sqrt {operatorname {Var} (X)}}}}

Para un caso general de esta declaración, vea la desigualdad de Hölder.

Desviación media absoluta alrededor de la mediana

La mediana es el punto sobre el cual se minimiza la desviación media. La mediana MAD ofrece una medida directa de la escala de una variable aleatoria alrededor de su mediana

Dmed=ESilencioX− − medianaSilencio{displaystyle ¿Qué?

Este es el estimador de probabilidad máximo del parámetro escala b{displaystyle b} de la distribución Laplace.

Puesto que la mediana minimiza la distancia absoluta promedio, tenemos Dmed≤ ≤ D#{displaystyle D_{text{med}leq D_{text{mean}}. La desviación absoluta media de la mediana es inferior o igual a la media absoluta desviación de la media. De hecho, la media absoluta desviación de la mediana es siempre menos o igual a la media absoluta desviación de cualquier otro número fijo.

Utilizando la función de dispersión general, Habib (2011) definió MAD sobre la mediana como

Dmed=ESilencioX− − medianaSilencio=2Cov⁡ ⁡ ()X,IO){displaystyle ################################################################################################################################################################################################################################################################ {Cov} (X,I_{O})}
{text{median}},\0&{text{otherwise}}.end{cases}}}" display="block" xmlns="http://www.w3.org/1998/Math/MathML">IO:={}1six■mediana,0de otra manera.{displaystyle mathbf {I} {fnMicrosoft Sans Serif} }x titulado{text{median}}, Dame {text{otherwise}end{cases}}
{text{median}},\0&{text{otherwise}}.end{cases}}}" aria-hidden="true" class="mwe-math-fallback-image-display" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/3ca0e3956cbfc0bb589955da4a2ade4af789d55d" style="vertical-align: -2.505ex; width:26.602ex; height:6.176ex;"/>

Esta representación permite obtener coeficientes de correlación mediana MAD.

Desviación absoluta mediana alrededor de un punto central

Aunque en principio se podría tomar la media o cualquier otro punto central como punto central para la desviación absoluta de la mediana, la mayoría de las veces se toma en su lugar el valor de la mediana.

Desviación absoluta de la mediana alrededor de la mediana

Did you mean:

The median absolute deviation (also MAD) is the median of the absolute deviation from the mean. It is a robust estimator of dispersion.

Para el ejemplo {2, 2, 3, 4, 14}: 3 es la mediana, por lo que las desviaciones absolutas de la mediana son {1, 1, 0, 1, 11} (reordenadas como {0, 1, 1, 1, 11}) con una mediana de 1, en este caso no afectada por el valor del valor atípico 14, por lo que la desviación absoluta de la mediana es 1.

Para una distribución simétrica, la desviación absoluta mediana es igual a la mitad del rango intercuartil.

Desviación absoluta máxima

El máxima desviación absoluta alrededor de un punto arbitrario es el máximo de las desviaciones absolutas de una muestra desde ese punto. Aunque no es estrictamente una medida de tendencia central, la desviación absoluta máxima se puede encontrar utilizando la fórmula para la desviación absoluta promedio como arriba m()X)=max()X){displaystyle m(X)=max(X)}, donde max()X){displaystyle max(X)} es el máximo de la muestra.

Minimización

Las medidas de dispersión estadística derivadas de la desviación absoluta caracterizan varias medidas de tendencia central como minimizadoras de la dispersión: La mediana es la medida de tendencia central más asociada con la desviación absoluta. Algunos parámetros de ubicación se pueden comparar de la siguiente manera:

Estimación

La desviación media absoluta de una muestra es un estimador sesgado de la desviación media absoluta de la población. Para que la desviación absoluta sea un estimador insesgado, el valor esperado (promedio) de todas las desviaciones absolutas de la muestra debe ser igual a la desviación absoluta de la población. Sin embargo, no es así. Para la población 1,2,3, tanto la desviación absoluta de la población con respecto a la mediana como la desviación absoluta de la población con respecto a la media son 2/3. El promedio de todas las desviaciones absolutas muestrales respecto de la media de tamaño 3 que se pueden extraer de la población es 44/81, mientras que el promedio de todas las desviaciones absolutas muestrales respecto de la mediana es 4/9. Por tanto, la desviación absoluta es un estimador sesgado.

Sin embargo, este argumento se basa en la noción de imparcialidad de la media. Cada medida de ubicación tiene su propia forma de insesgamiento (ver entrada sobre estimador sesgado). La forma relevante de imparcialidad aquí es la imparcialidad mediana.