Distribución Gumbel
En teoría de probabilidad y estadística, la distribución de Gumbel (también conocida como distribución generalizada de valores extremos de tipo I) se utiliza para modelar la distribución del máximo (o el mínimo) de un número de muestras de varias distribuciones.
Esta distribución podría usarse para representar la distribución del nivel máximo de un río en un año en particular si hubiera una lista de valores máximos para los últimos diez años. Es útil para predecir la posibilidad de que ocurra un terremoto extremo, una inundación u otro desastre natural. La aplicabilidad potencial de la distribución de Gumbel para representar la distribución de máximos se relaciona con la teoría del valor extremo, lo que indica que es probable que sea útil si la distribución de los datos de la muestra subyacente es del tipo normal o exponencial. Este artículo utiliza la distribución de Gumbel para modelar la distribución del valor máximo. Para modelar el valor mínimo, use el negativo de los valores originales.
La distribución de Gumbel es un caso particular de la distribución generalizada de valores extremos (también conocida como distribución de Fisher-Tippett). También se conoce como distribución log-Weibull y distribución exponencial doble (un término que a veces se usa alternativamente para referirse a la distribución de Laplace). Está relacionado con la distribución de Gompertz: cuando su densidad se refleja primero sobre el origen y luego se restringe a la media línea positiva, se obtiene una función de Gompertz.
En la formulación de variables latentes del modelo logit multinomial, común en la teoría de la elección discreta, los errores de las variables latentes siguen una distribución de Gumbel. Esto es útil porque la diferencia de dos variables aleatorias distribuidas por Gumbel tiene una distribución logística.
La distribución de Gumbel lleva el nombre de Emil Julius Gumbel (1891–1966), según sus documentos originales que describen la distribución.
Definiciones
La función de distribución acumulativa de la distribución de Gumbel es
- F()x;μ μ ,β β )=e− − e− − ()x− − μ μ )/β β .{displaystyle F(x;mubeta)=e^{-e^{-(x-mu)/beta }.
Distribución Gumbel estándar
La distribución estándar de Gumbel es el caso donde μ μ =0{displaystyle mu =0} y β β =1{displaystyle beta =1} con función de distribución acumulativa
- F()x)=e− − e()− − x){displaystyle F(x)=e^{-e^{(-x)},}
y función de densidad de probabilidad
- f()x)=e− − ()x+e− − x).{displaystyle f(x)=e^{-(x+e^{-x}}}
En este caso el modo es 0, la mediana es − − In ()In ()2)).. 0,3665{displaystyle -ln(ln(2))approx 0.3665}, la media es γ γ .. 0,572{displaystyle gamma approx 0.5772} (la constante Euler-Mascheroni), y la desviación estándar es π π /6.. 1.2825.{displaystyle pi /{sqrt {6}approx 1.2825}
Los cumulantes, por n > 1, están dadas por
- κ κ n=()n− − 1)!Especificaciones Especificaciones ()n).{displaystyle kappa _{n}=(n-1)!zeta (n).}
Propiedades
El modo es μ, mientras que la mediana es μ μ − − β β In ()In 2),{displaystyle mu -beta ln left(ln 2right),} y la media es dada por
- E ()X)=μ μ +γ γ β β {displaystyle operatorname {E} (X)=mu +gamma beta },
Donde γ γ {displaystyle gamma } es la constante Euler-Mascheroni.
La desviación estándar σ σ {displaystyle sigma } es β β π π /6{displaystyle beta pi /{sqrt {6}} de aquí β β =σ σ 6/π π .. 0,78σ σ .{displaystyle beta =sigma {6}/pi approx 0.78sigma.}
En el modo, donde x=μ μ {displaystyle x=mu}, el valor de F()x;μ μ ,β β ){displaystyle F(x;mubeta)} se convierte en e− − 1.. 0.37{displaystyle e^{-1}approx 0.37}, independientemente del valor de β β .{displaystyle beta.}
Si G1,...,Gk{displaystyle G_{1},... iid Gumbel variables aleatorias con parámetros ()μ μ ,β β ){displaystyle (mubeta)} entonces max{}G1,...,Gk}{displaystyle max{G_{1},... es también una variable aleatoria Gumbel con parámetros ()μ μ +β β In k,β β ){displaystyle (mu +beta ln k,beta)}.
Si G1,G2,...{displaystyle G_{1},G_{2}, son variables aleatorias tales que max{}G1,...,Gk}− − β β In k{displaystyle max{G_{1},... tiene la misma distribución G1{displaystyle G_{1} para todos los números naturales k{displaystyle k}, entonces G1{displaystyle G_{1} es necesariamente Gumbel distribuido con parámetro escala β β {displaystyle beta } (realmente basta considerar sólo dos valores distintos de k título1 que son coprime).
Distribuciones relacionadas
- Si X{displaystyle X} tiene una distribución de Gumbel, luego la distribución condicional Y=X dado que Y es positivo, o equivalentemente dado que X es negativo, tiene una distribución de Gompertz. El cdf G de Y está relacionado con F, el cdf de X, por la fórmula G()Sí.)=P()Y≤ ≤ Sí.)=P()X≥ ≥ − − Sí.▪ ▪ X≤ ≤ 0)=()F()0)− − F()− − Sí.))/F()0){displaystyle G(y)=P(Yleq y)=P(Xgeq -ymid Xleq 0)=(F(0)-F(-y))/F(0)} para Sí.■ 0. En consecuencia, las densidades están relacionadas con g()Sí.)=f()− − Sí.)/F()0){displaystyle g(y)=f(-y)/F(0)}: la densidad de Gompertz es proporcional a una densidad de Gumbel reflejada, restringida a la media línea positiva.
- Si X es una variable distribuida exponencialmente con media 1, luego −log(X) tiene una distribución estándar de Gumbel.
- Si X♪ ♪ Gumbel()α α X,β β ){displaystyle Xsim mathrm {Gumbel} (alpha _{X},beta)} y Y♪ ♪ Gumbel()α α Y,β β ){displaystyle Ysim mathrm {Gumbel} (alpha _{Y},beta)} son independientes, entonces X− − Y♪ ♪ Logistic()α α X− − α α Y,β β ){displaystyle X-Ysim mathrm {Logistic} (alpha _{X}-alpha _{Y},beta),} (ver distribución logística).
- Si X,Y♪ ♪ Gumbel()α α ,β β ){displaystyle X,Ysim mathrm {Gumbel} (alphabeta)} son independientes, entonces X+Y≁ ≁ Logistic()2α α ,β β ){displaystyle X+Ynsim mathrm {Logistic} (2alphabeta)}. Note que E()X+Y)=2α α +2β β γ γ ل ل 2α α =E()Logistic()2α α ,β β )){displaystyle E(X+Y)=2alpha +2beta gamma neq 2alpha =Eleft(mathrm {Logistic} (2alphabeta)right)}. Más generalmente, la distribución de combinaciones lineales de variables independientes Gumbel aleatorias puede ser aproximada por las distribuciones GNIG y GIG.
La teoría relacionada con la distribución log-gamma multivariante generalizada proporciona una versión multivariante de la distribución de Gumbel.
Ocurrencia y aplicaciones

Gumbel ha demostrado que el valor máximo (o estadística de último orden) en una muestra de variables aleatorias que siguen una distribución exponencial menos el logaritmo natural del tamaño de la muestra se aproxima a la distribución de Gumbel a medida que aumenta el tamaño de la muestra.
Concretamente, dejemos *** *** ()x)=e− − x{displaystyle rho (x)=e^{-x} ser la distribución de probabilidad x{displaystyle x} y Q()x)=1− − e− − x{displaystyle Q(x)=1-e^{-x} su distribución acumulativa. Entonces el valor máximo fuera de N{displaystyle N} realizaciones de x{displaystyle x} es más pequeño que X{displaystyle X} si y sólo si todas las realizaciones son más pequeñas que X{displaystyle X}. Así que la distribución acumulativa del valor máximo x~ ~ {displaystyle {tilde {x}} satisfizo
- P()x~ ~ − − log ()N)≤ ≤ X)=P()x~ ~ ≤ ≤ X+log ()N))=[Q()X+log ()N))]N=()1− − e− − XN)N,{displaystyle P({tilde {x}}-log(N)leq X)=P({tilde {x}leq X+log(N)=[Q(X+log(N)]}{N}=left(1-{frac {e^{-X}}}{N}}}}}right)} {n}}}}}} {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {n}}}}}}}}}}}} {n} {n}} {n}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}
y, para grandes N{displaystyle N}, el lado derecho converge a e− − e()− − X).{displaystyle e^{-e^{(-X)}}}
En hidrología, por lo tanto, la distribución de Gumbel se utiliza para analizar variables tales como valores máximos mensuales y anuales de lluvia diaria y volúmenes de descarga de ríos, y también para describir sequías.
Gumbel también ha demostrado que el estimador r⁄(n+1) para la probabilidad de un evento, donde r es el número de rango del valor observado en la serie de datos y n es el número total de observaciones: es un estimador imparcial de la probabilidad acumulada en torno a la moda de la distribución. Por lo tanto, este estimador se usa a menudo como una posición de trazado.
En la teoría de números, la distribución de Gumbel se aproxima al número de términos en una partición aleatoria de un número entero, así como a los tamaños ajustados a la tendencia de las brechas máximas de números primos y las brechas máximas entre constelaciones de números primos.
Did you mean:Gumbel reparameterization tricks
En el aprendizaje automático, la distribución de Gumbel a veces se emplea para generar muestras a partir de la distribución categórica. Esta técnica se llama "truco Gumbel-max" y es un ejemplo especial de "trucos de reparametrización".
En detalle, dejemos ()π π 1,...... ,π π n){displaystyle (pi _{1},ldotspi _{n}} ser no negativo, y no todo cero, y dejar g1,...... ,gn{displaystyle g_{1},ldotsg_{n} ser muestras independientes de Gumbel(0, 1), luego por integración rutinaria,
Equivalentemente, dado cualquier x1,...,xn▪ ▪ R{displaystyle x_{1},...,x_{n}in {R}, podemos probar su distribución de Boltzmann por
- Si x♪ ♪ Gastos ()λ λ ){displaystyle xsim operatorname {Exp} (lambda)}, entonces ()− − In x− − γ γ )♪ ♪ Gumbel()− − γ γ +In λ λ ,1){displaystyle (-ln x-gamma)sim {text{Gumbel}(-gamma +lnlambda1)}.
- arg maxi()gi+log π π i)♪ ♪ Categorística()π π j.. iπ π i)j{displaystyle arg max _{i}(g_{i}+log pi _{i})sim {text{Categorical}}left({frac {pi} ¿Qué? - Sí..
- maxi()gi+log π π i)♪ ♪ Gumbel()log ().. iπ π i),1){displaystyle max _{i}(g_{i}+log pi _{i})sim {text{Gumbel}}left(log left(sum _{i}pi _{i}right),1right)}}. Es decir, la distribución Gumbel es una familia de distribución máx.
- E[maxi()gi+β β xi)]=log ().. ieβ β xi)+γ γ .{displaystyle mathbb {E} [max _{i}(g_{i}+beta x_{i})=log left(sum _{i}e^{beta x_{i}right)+gamma.}
Generación de variables aleatorias
Desde la función cuntil (función de distribución acumulativa inversa), Q()p){displaystyle Q(p)}, de una distribución Gumbel es dada por
- Q()p)=μ μ − − β β In ()− − In ()p)),{displaystyle Q(p)=mu -beta ln(-ln(p)),}
el variate Q()U){displaystyle Q(U)} tiene una distribución Gumbel con parámetros μ μ {displaystyle mu } y β β {displaystyle beta } cuando el variate al azar U{displaystyle U} se extrae de la distribución uniforme en el intervalo ()0,1){displaystyle (0,1)}.
Papel de probabilidad
En el papel de probabilidad de tiempos pre-software se utilizó para imaginar la distribución de Gumbel (ver ilustración). El papel se basa en la linealización de la función de distribución acumulativa F{displaystyle F}:
- − − In [− − In ()F)]=x− − μ μ β β {displaystyle -ln[-ln(F)]={frac {x-mu}{beta }
En el papel el eje horizontal se construye a doble escala de troncos. El eje vertical es lineal. Por conspirar F{displaystyle F} sobre el eje horizontal del papel y el x{displaystyle x}-variable en el eje vertical, la distribución está representada por una línea recta con una pendiente 1/β β {displaystyle /beta }. Cuando el software de fijación de distribución como CumFreq se puso a disposición, la tarea de trazar la distribución se hizo más fácil.
Contenido relacionado
Radioisótopo sintético
Detector (desambiguación)
Mercado de asesinatos