Rango (estadísticas)
En estadística, el rango de un conjunto de datos es la diferencia entre los valores mayor y menor, el resultado de restar el máximo y el mínimo de la muestra. Se expresa en las mismas unidades que los datos.
En las estadísticas descriptivas, el rango es el tamaño del intervalo más pequeño que contiene todos los datos y proporciona una indicación de la dispersión estadística. Dado que solo depende de dos de las observaciones, es más útil para representar la dispersión de pequeños conjuntos de datos.
Para variables aleatorias IID continuas
Para n variables aleatorias continuas independientes e idénticamente distribuidas X1, X2,..., Xn con la función de distribución acumulativa G(x) y una densidad de probabilidad función g(x), sea T el rango de las mismas, es decir, T= max(X1, X2,..., Xn)- min(X1, X2,..., Xn).
Distribución
El rango, T, tiene la función de distribución acumulativa
- F()t)=n∫ ∫ − − JUEGO JUEGO JUEGO JUEGO g()x)[G()x+t)− − G()x)]n− − 1dx.{displaystyle F(t)=nint _{-infty }{infty }g(x)[G(x+t)-G(x)]^{n-1},{text{d}x.}
Gumbel señala que la "belleza de esta fórmula se ve completamente empañada por el hecho de que, en general, no podemos expresar G(x + t) por G(x), y que la integración numérica es larga y tediosa."
Si la distribución de cada Xi está limitada a la derecha (oa la izquierda), entonces la distribución asintótica del rango es igual a la distribución asintótica del valor más grande (más pequeño). Para distribuciones más generales, la distribución asintótica se puede expresar como una función de Bessel.
Momentos
El rango medio viene dado por
- n∫ ∫ 01x()G)[Gn− − 1− − ()1− − G)n− − 1]dG{displaystyle nint _{0}{1}x(G)[G^{n-1}-(1-G)^{n-1}],{text{d}G}
donde x(G) es la función inversa. En el caso de que cada una de las Xi tenga una distribución normal estándar, el rango medio viene dado por
- ∫ ∫ − − JUEGO JUEGO JUEGO JUEGO ()1− − ()1− − CCPR CCPR ()x))n− − CCPR CCPR ()x)n)dx.{displaystyle int _{-infty } {infty }(1-(1-Phi (x)^{n}-Phi (x)^{n}),{text{d}x.}
Para variables aleatorias continuas no IID
Para n variables aleatorias continuas independientes no idénticamente distribuidas X1, X2,..., Xn con funciones de distribución acumulativas G1(x), G2(x),..., Gn(x) y funciones de densidad de probabilidad g1(x), g2(x),..., g n(x), el rango tiene función de distribución acumulativa
- F()t)=.. i=1n∫ ∫ − − JUEGO JUEGO JUEGO JUEGO gi()x)∏ ∏ j=1,jل ل in[Gj()x+t)− − Gj()x)]dx.{displaystyle F(t)=sum ¿Qué? ¿Por qué?
Para variables aleatorias IID discretas
Para n variables aleatorias discretas independientes e idénticamente distribuidas X1, X2,..., Xn con función de distribución acumulativa G(x) y la función de masa de probabilidad g(x) el rango de la Xi es el rango de una muestra de tamaño n de una población con función de distribución G(x). Podemos suponer sin pérdida de generalidad que el soporte de cada Xi es {1,2,3,..., N} donde N es un número entero positivo o infinito.
Distribución
El rango tiene función de masa de probabilidad
- f()t)={}.. x=1N[g()x)]nt=0.. x=1N− − t()[G()x+t)− − G()x− − 1)]n− − [G()x+t)− − G()x)]n− − [G()x+t− − 1)− − G()x− − 1)]n+[G()x+t− − 1)− − G()x)]n)t=1,2,3...... ,N− − 1.{displaystyle f(t)={begin{cases}sum ################################################################################################################################################################################################################################################################ {x=1} {} {}} {} {}} {}} {}} {}}} {}}} {}}} {}} {}} {}} {}} {} {}}} {} {}}} {}} {}}}} {}}}}}}}} {}} {}}}}}} {}}}}} {}} {}}}}} {}}}}}}} {}}}}}}}}} {}}}}}}}}}} {}}}}}}}}}}} {}}}}}}}} {}}}}}}}}}} {}}}}}}}}}}}}}}}}} {}}}}}}}}}} {}}}}}}}}}}}}} {} {}}}}}}}}}} {}}}}}}}}}}} {}}}}}}}}}}}} {}}}}}}}}}}}}}}
Ejemplo
Si suponemos que g(x) = 1/N, la distribución uniforme discreta para todo x, entonces encontramos
- f()t)={}1Nn− − 1t=0.. x=1N− − t()[t+1N]n− − 2[tN]n+[t− − 1N]n)t=1,2,3...... ,N− − 1.{displaystyle f(t)={begin{cases}{frac {1}{N^{n-1} {0}[4pt]sum ¿Por qué? [T+1} {N}derecha] {n}2left[{frac] Está bien. [{frac {t-1}{n}right] {n}right) Damet=1,2,3ldotsN-1.end{cases}}
Derivación
La probabilidad de tener un valor de rango específico, t, se puede determinar añadiendo las probabilidades de tener dos muestras diferentes t, y cada otra muestra que tiene un valor entre los dos extremos. La probabilidad de que una muestra tenga un valor x es ng()x){displaystyle ng(x)}. La probabilidad de que otro tenga un valor t más grande que x es:
- ()n− − 1)g()x+t).{displaystyle (n-1)g(x+t). }
La probabilidad de que todos los demás valores se encuentren entre estos dos extremos es:
- ()∫ ∫ xx+tg()x)dx)n− − 2=()G()x+t)− − G()x))n− − 2.{displaystyle left(int _{x+t}g(x),{text{d}xright)^{n-2}=left(G(x+t)-G(x)right)^{n-2}
Combinando los tres rendimientos juntos:
- f()t)=n()n− − 1)∫ ∫ − − JUEGO JUEGO JUEGO JUEGO g()x)g()x+t)[G()x+t)− − G()x)]n− − 2dx{displaystyle f(t)=n(n-1)int _{-infty }{infty }g(x+t)[G(x+t)-G(x)]^{n-2},{text{d}x}x}
Cantidades relacionadas
El rango es un ejemplo específico de estadísticas de pedidos. En particular, el rango es una función lineal de las estadísticas de orden, lo que lo lleva al alcance de la estimación L.
Contenido relacionado
4
Teorema de Falting
Emilio Julio Gumbel