Rango (estadísticas)

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

Concepto de las estadísticas

En estadística, el rango de un conjunto de datos es la diferencia entre los valores mayor y menor, el resultado de restar el máximo y el mínimo de la muestra. Se expresa en las mismas unidades que los datos.

En las estadísticas descriptivas, el rango es el tamaño del intervalo más pequeño que contiene todos los datos y proporciona una indicación de la dispersión estadística. Dado que solo depende de dos de las observaciones, es más útil para representar la dispersión de pequeños conjuntos de datos.

Para variables aleatorias IID continuas

Para n variables aleatorias continuas independientes e idénticamente distribuidas X₁, X₂,..., X_n con la función de distribución acumulativa G(x) y una densidad de probabilidad función g(x), sea T el rango de las mismas, es decir, T= max(X₁, X₂,..., X_n)- min(X₁, X₂,..., X_n).

Distribución

El rango, T, tiene la función de distribución acumulativa

{displaystyle F(t)=nint _{-infty }^{infty }g(x)[G(x+t)-G(x)]^{n-1},{text{d}}x.}

Gumbel señala que la "belleza de esta fórmula se ve completamente empañada por el hecho de que, en general, no podemos expresar G(x + t) por G(x), y que la integración numérica es larga y tediosa."

Si la distribución de cada X_i está limitada a la derecha (oa la izquierda), entonces la distribución asintótica del rango es igual a la distribución asintótica del valor más grande (más pequeño). Para distribuciones más generales, la distribución asintótica se puede expresar como una función de Bessel.

Momentos

El rango medio viene dado por

{displaystyle nint _{0}^{1}x(G)[G^{n-1}-(1-G)^{n-1}],{text{d}}G}

donde x(G) es la función inversa. En el caso de que cada una de las X_i tenga una distribución normal estándar, el rango medio viene dado por

{displaystyle int _{-infty }^{infty }(1-(1-Phi (x))^{n}-Phi (x)^{n}),{text{d}}x.}

Para variables aleatorias continuas no IID

Para n variables aleatorias continuas independientes no idénticamente distribuidas X₁, X₂,..., X_n con funciones de distribución acumulativas G₁(x), G₂(x),..., G_n(x) y funciones de densidad de probabilidad g₁(x), g₂(x),..., g_n(x), el rango tiene función de distribución acumulativa

{displaystyle F(t)=sum _{i=1}^{n}int _{-infty }^{infty }g_{i}(x)prod _{j=1,jneq i}^{n}[G_{j}(x+t)-G_{j}(x)],{text{d}}x.}

Para variables aleatorias IID discretas

Para n variables aleatorias discretas independientes e idénticamente distribuidas X₁, X₂,..., X_n con función de distribución acumulativa G(x) y la función de masa de probabilidad g(x) el rango de la X_i es el rango de una muestra de tamaño n de una población con función de distribución G(x). Podemos suponer sin pérdida de generalidad que el soporte de cada X_i es {1,2,3,..., N} donde N es un número entero positivo o infinito.

Distribución

El rango tiene función de masa de probabilidad

{displaystyle f(t)={begin{cases}sum _{x=1}^{N}[g(x)]^{n}&t=0\[6pt]sum _{x=1}^{N-t}left({begin{alignedat}{2}&[G(x+t)-G(x-1)]^{n}\{}-{}&[G(x+t)-G(x)]^{n}\{}-{}&[G(x+t-1)-G(x-1)]^{n}\{}+{}&[G(x+t-1)-G(x)]^{n}\end{alignedat}}right)&t=1,2,3ldotsN-1.end{cases}}}

Ejemplo

Si suponemos que g(x) = 1/N, la distribución uniforme discreta para todo x, entonces encontramos

{displaystyle f(t)={begin{cases}{frac {1}{N^{n-1}}}&t=0\[4pt]sum _{x=1}^{N-t}left(left[{frac {t+1}{N}}right]^{n}-2left[{frac {t}{N}}right]^{n}+left[{frac {t-1}{N}}right]^{n}right)&t=1,2,3ldotsN-1.end{cases}}}

Derivación

La probabilidad de tener un valor de rango específico, t, se puede determinar añadiendo las probabilidades de tener dos muestras diferentes t, y cada otra muestra que tiene un valor entre los dos extremos. La probabilidad de que una muestra tenga un valor x es ${displaystyle ng(x)}$ . La probabilidad de que otro tenga un valor t más grande que x es:

{displaystyle (n-1)g(x+t).}

La probabilidad de que todos los demás valores se encuentren entre estos dos extremos es:

{displaystyle left(int _{x}^{x+t}g(x),{text{d}}xright)^{n-2}=left(G(x+t)-G(x)right)^{n-2}.}

Combinando los tres rendimientos juntos:

{displaystyle f(t)=n(n-1)int _{-infty }^{infty }g(x)g(x+t)[G(x+t)-G(x)]^{n-2},{text{d}}x}

Cantidades relacionadas

El rango es un ejemplo específico de estadísticas de pedidos. En particular, el rango es una función lineal de las estadísticas de orden, lo que lo lleva al alcance de la estimación L.

Contenido relacionado

Más resultados...