Experimento social
Un experimento social es una metodología de investigación utilizada en la psicología y la sociología para analizar cómo las personas reaccionan ante... (leer más)
La distribución de Pareto, llamada así por el ingeniero civil, economista y sociólogo italiano Vilfredo Pareto (italiano: [paˈreːto] pə-RAY-toh), es una distribución de probabilidad de ley de potencia que se utiliza en la descripción de control social, de calidad, científico, geofísico, actuarial, y muchos otros tipos de fenómenos observables; el principio se aplicó originalmente para describir la distribución de la riqueza en una sociedad, y se ajusta a la tendencia de que una gran parte de la riqueza está en manos de una pequeña fracción de la población. El principio de Pareto o "regla 80-20" afirmar que el 80 % de los resultados se deben al 20 % de las causas se nombró en honor a Pareto, pero los conceptos son distintos y solo las distribuciones de Pareto con valor de forma (α ) de log45 ≈ 1.16 lo refleja con precisión. La observación empírica ha demostrado que esta distribución 80-20 se ajusta a una amplia gama de casos, incluidos los fenómenos naturales y las actividades humanas.
Si X es una variable aleatoria con una distribución de Pareto (Tipo I), entonces la probabilidad de que X sea mayor que algún número x, es decir, la función de supervivencia (también llamada función de cola), viene dada por
donde xm es el valor mínimo posible (necesariamente positivo) de X, y α es un parámetro positivo. La distribución de Pareto Tipo I se caracteriza por un parámetro de escala xm y un parámetro de forma α, que se conoce como el índice de cola . Cuando esta distribución se utiliza para modelar la distribución de la riqueza, el parámetro α se denomina índice de Pareto.
De la definición, la función de distribución acumulada de una variable aleatoria de Pareto con parámetros α y xm es
Se sigue (por diferenciación) que la función de densidad de probabilidad es
Cuando se traza en ejes lineales, la distribución asume la familiar curva en forma de J que se aproxima asintóticamente a cada uno de los ejes ortogonales. Todos los segmentos de la curva son autosimilares (sujetos a factores de escala apropiados). Cuando se traza en un gráfico logarítmico, la distribución se representa mediante una línea recta.
Así pues, puesto que la expectativa no converge en un intervalo abierto que contiene t=0{displaystyle t=0} decimos que la función generadora del momento no existe.
Los parámetros pueden resolverse utilizando el método de los momentos.
La distribución condicional de probabilidad de una variable aleatoria distribuida por Pareto, dado que es mayor o igual a un número determinadox1{displaystyle x_{1}} en exceso xm{displaystyle x_{text{m}}, es una distribución de Pareto con el mismo índice de Paretoα α {displaystyle alpha } pero con mínimox1{displaystyle x_{1}} en lugar de xm{displaystyle x_{text{m}}. Esto implica que el valor esperado condicional (si es finito, es decir. 1}" xmlns="http://www.w3.org/1998/Math/MathML">α α ■1{displaystyle alpha }1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/17d81dbbc4786493c7b8548cc324a978d7cf5dbd" style="vertical-align: -0.338ex; width:5.749ex; height:2.176ex;"/>) es proporcional a x1{displaystyle x_{1}}. En caso de variables aleatorias que describen la vida de un objeto, esto significa que la esperanza de vida es proporcional a la edad, y se llama el efecto Lindy o la Ley de Lindy.
Suppose X1,X2,X3,...... {displaystyle X_{1},X_{2},X_{3},dotsc son independientes idénticamente distribuidas variables aleatorias cuya distribución de probabilidad se soporta en el intervalo [xm,JUEGO JUEGO ){displaystyle [x_{text{m}},infty)} para algunos 0}" xmlns="http://www.w3.org/1998/Math/MathML">xm■0{displaystyle x_{text{m} {f}}} {fnMicrosoft}}}}} {fnK}}}}}}0" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/4f4d17f55b7a3113b04a88d752f00ca2b88cd38a" style="vertical-align: -0.671ex; width:7.192ex; height:2.509ex;"/>. Supongamos eso para todos n{displaystyle n}, las dos variables aleatorias min{}X1,...... ,Xn}{displaystyle min{X_{1},dotscX_{n}}} y ()X1+⋯ ⋯ +Xn)/min{}X1,...... ,Xn}{displaystyle (X_{1}+dotsb +X_{n}/min{X_{1},dotscX_{n}}} son independientes. Entonces la distribución común es una distribución de Pareto.
La media geométrica (G) es
La media armónica (H) es
La característica curva 'cola larga' distribución cuando se traza en una escala lineal, enmascara la simplicidad subyacente de la función cuando se traza en un gráfico logarítmico, que luego toma la forma de una línea recta con gradiente negativo: De la fórmula para la función de densidad de probabilidad se deduce que para x ≥ xm,
Dado que α es positivo, el gradiente −(α + 1) es negativo.
Existe una jerarquía de distribuciones de Pareto conocida como distribuciones de Pareto Tipo I, II, III, IV y Feller-Pareto. Pareto Tipo IV contiene Pareto Tipo I-III como casos especiales. La distribución Feller-Pareto generaliza el Tipo IV de Pareto.
La jerarquía de distribución de Pareto se resume en la siguiente tabla comparando las funciones de supervivencia (CDF complementaria).
Cuando μ = 0, la distribución de Pareto Tipo II también se conoce como distribución Lomax.
En esta sección, el símbolo xm, utilizado anteriormente para indicar el valor mínimo de x, se sustituye por σ .
F̄ ̄ ()x)=1− − F()x){displaystyle {overline {F}(x)=1-F(x)} | Apoyo | Parámetros | |
---|---|---|---|
Tipo I | [xσ σ ]− − α α {displaystyle left[{frac {x}{sigma Bien. | x≥ ≥ σ σ {displaystyle xgeq sigma } | 0,alpha }" xmlns="http://www.w3.org/1998/Math/MathML">σ σ ■0,α α {displaystyle sigma >0,alpha } 0, alpha" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/754f7860537646aecb5a1dd34fd99dfb792c98ed" style="vertical-align: -0.671ex; width:8.112ex; height:2.509ex;"/> |
Tipo II | [1+x− − μ μ σ σ ]− − α α {displaystyle left[1+{frac {x-mu }{sigma }right]^{-alpha }} | x≥ ≥ μ μ {displaystyle xgeqmu} | 0,alpha }" xmlns="http://www.w3.org/1998/Math/MathML">μ μ ▪ ▪ R,σ σ ■0,α α {displaystyle mu in mathbb {R}sigma œ0,alpha } 0, alpha" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/40d133c8542cb10d35880958772047afe9e286c2" style="vertical-align: -0.838ex; width:15.067ex; height:2.676ex;"/> |
Lomax | [1+xσ σ ]− − α α {displaystyle left[1+{frac {x}{sigma Bien. | x≥ ≥ 0{displaystyle xgeq 0} | 0,alpha }" xmlns="http://www.w3.org/1998/Math/MathML">σ σ ■0,α α {displaystyle sigma >0,alpha } 0, alpha" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/754f7860537646aecb5a1dd34fd99dfb792c98ed" style="vertical-align: -0.671ex; width:8.112ex; height:2.509ex;"/> |
Tipo III | [1+()x− − μ μ σ σ )1/γ γ ]− − 1{displaystyle left[1+left({frac {x-mu }{sigma }right)^{1/gamma - Sí. | x≥ ≥ μ μ {displaystyle xgeqmu} | 0}" xmlns="http://www.w3.org/1998/Math/MathML">μ μ ▪ ▪ R,σ σ ,γ γ ■0{displaystyle mu in mathbb {R}sigmagamma } 0" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/9dbf5d82227cde44d7f9244c41e02971516e1be0" style="vertical-align: -0.838ex; width:14.841ex; height:2.676ex;"/> |
Tipo IV | [1+()x− − μ μ σ σ )1/γ γ ]− − α α {displaystyle left[1+left({frac {x-mu }{sigma }right)^{1/gamma }right]^{-alpha }}} | x≥ ≥ μ μ {displaystyle xgeqmu} | 0,alpha }" xmlns="http://www.w3.org/1998/Math/MathML">μ μ ▪ ▪ R,σ σ ,γ γ ■0,α α {displaystyle mu in mathbb {R}sigmagamma } 0, alpha" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/10e6c204db2658745897265a373f0dac44364442" style="vertical-align: -0.838ex; width:17.363ex; height:2.676ex;"/> |
El parámetro de forma α es el índice de la cola, μ es la ubicación, σ es la escala, γ es un parámetro de desigualdad. Algunos casos especiales de Pareto Tipo (IV) son
La finitud de la media, y la existencia y la finitud de la varianza dependen del índice de cola α (índice de desigualdad γ). En particular, los δ-momentos fraccionarios son finitos para algunos δ > 0, como se muestra en la siguiente tabla, donde δ no es necesariamente un número entero.
E [X]{displaystyle operatorname {E} [X]} | Estado | E [Xδ δ ]{displaystyle operatorname [X^{delta] | Estado | |
---|---|---|---|---|
Tipo I | σ σ α α α α − − 1{displaystyle {frac {sigma alpha ♫{alpha - Sí. | 1}" xmlns="http://www.w3.org/1998/Math/MathML">α α ■1{displaystyle alpha }1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/17d81dbbc4786493c7b8548cc324a978d7cf5dbd" style="vertical-align: -0.338ex; width:5.749ex; height:2.176ex;"/> | σ σ δ δ α α α α − − δ δ {displaystyle {frac {sigma }{delta Alpha -delta } | <math alttext="{displaystyle delta δ δ .α α {displaystyle delta]<img alt=" delta |
Tipo II | σ σ α α − − 1+μ μ {displaystyle {frac {sigma ♫{alpha - ¿Qué? | 1}" xmlns="http://www.w3.org/1998/Math/MathML">α α ■1{displaystyle alpha }1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/17d81dbbc4786493c7b8548cc324a978d7cf5dbd" style="vertical-align: -0.338ex; width:5.749ex; height:2.176ex;"/> | σ σ δ δ .. ()α α − − δ δ ).. ()1+δ δ ).. ()α α ){displaystyle {frac {sigma }{delta }Gamma (alpha -delta)Gamma (1+delta)}{Gamma (alpha)}}} | <math alttext="{displaystyle 0<delta 0.δ δ .α α {displaystyle 0 madedelta<img alt="{displaystyle 0<delta |
Tipo III | σ σ .. ()1− − γ γ ).. ()1+γ γ ){displaystyle sigma Gamma (1-gamma)Gamma (1+gamma)} | <math alttext="{displaystyle -1<gamma − − 1.γ γ .1{displaystyle -1 se hizo gamma.<img alt=" -1<gamma | σ σ δ δ .. ()1− − γ γ δ δ ).. ()1+γ γ δ δ ){displaystyle sigma ^{delta }Gamma (1-gamma delta)Gamma (1+gamma delta)} | <math alttext="{displaystyle -gamma ^{-1}<delta − − γ γ − − 1.δ δ .γ γ − − 1{displaystyle - ¿Qué? ♪♪gamma ^{-1}<img alt="-gamma^{-1}<delta |
Tipo IV | σ σ .. ()α α − − γ γ ).. ()1+γ γ ).. ()α α ){displaystyle {frac {sigma Gamma (alpha -gamma)Gamma (1+gamma)}{Gamma (alpha)}}}} | <math alttext="{displaystyle -1<gamma − − 1.γ γ .α α {displaystyle -1 se hizo gamma<img alt=" -1<gamma | σ σ δ δ .. ()α α − − γ γ δ δ ).. ()1+γ γ δ δ ).. ()α α ){displaystyle {frac {sigma }{delta }Gamma (alpha -gamma delta)Gamma (1+gamma delta)}{Gamma (alpha)}}}} | <math alttext="{displaystyle -gamma ^{-1}<delta − − γ γ − − 1.δ δ .α α /γ γ {displaystyle - ¿Qué? # Imagino #<img alt="-gamma^{-1}<delta |
Feller define una variable de Pareto mediante la transformación U = Y−1 − 1 de una variable aleatoria beta Y, cuya función de densidad de probabilidad es
donde B() es la función beta. Si
entonces W tiene una distribución Feller-Pareto FP(μ, σ, γ, γ1, γ2).
Si U1♪ ♪ .. ()δ δ 1,1){displaystyle U_{1}sim Gamma (delta _{1},1)} y U2♪ ♪ .. ()δ δ 2,1){displaystyle U_{2}sim Gamma (delta _{2},1)} son variables independientes Gamma, otra construcción de una variable Feller-Pareto (FP) es
y escribimos W ~ FP(μ, σ, γ, δ1, δ2). Los casos especiales de la distribución de Feller-Pareto son
Cuando una variable aleatoria Y{displaystyle Sí. sigue una distribución pareto, luego su inverso X=1/Y{displaystyle X=1/Y} sigue una distribución Inverse Pareto. Distribución inversa de Pareto es equivalente a una distribución de Poder
La distribución de Pareto está relacionada con la distribución exponencial de la siguiente manera. Si X tiene una distribución de Pareto con xm mínimos e índice α, entonces
se distribuye exponencialmente con el parámetro de tasa α. De manera equivalente, si Y se distribuye exponencialmente con tasa α, entonces
tiene una distribución de Pareto con un mínimo de xm y un índice α.
Esto se puede mostrar utilizando las técnicas estándar de cambio de variable:
La última expresión es la función de distribución acumulativa de una distribución exponencial con tasa α.
La distribución de Pareto puede ser construida por distribuciones exponenciales jerárquicas. Vamos φ φ Silencioa♪ ♪ Gastos()a){fnMicrosoft Sans Serif}(a)} y .. Silencioφ φ ♪ ♪ Gastos()φ φ ){displaystyle eta Silenciophi sim {text{Exp}(phi)}. Entonces tenemos p().. Silencioa)=a()a+.. )2{fnMicrosoft Sans Serif}}} y, como resultado, a+.. ♪ ♪ Pareto()a,1){displaystyle a+eta sim {text{Pareto}(a,1)}.
Más en general, si λ λ ♪ ♪ Gamma()α α ,β β ){displaystyle lambda sim {text{Gamma}}(alphabeta)} (parametrización de tipos de formas) y .. Silencioλ λ ♪ ♪ Gastos()λ λ ){displaystyle eta tenciónlambda sim {text{Exp}(lambda)}, entonces β β +.. ♪ ♪ Pareto()β β ,α α ){displaystyle beta +eta sim {text{Pareto} {betaalpha)}.
Equivalentemente, si Y♪ ♪ Gamma()α α ,1){displaystyle Ysim {text{Gamma} {alpha1)} y X♪ ♪ Gastos()1){displaystyle Xsim {text{Exp}(1)}, entonces xm()1+XY)♪ ♪ Pareto()xm,α α ){displaystyle x_{text{m}!left(1+{frac} {X}{Y}right)sim {text{Pareto} {x_{text{m},alpha)}.
La distribución de Pareto y la distribución log-normal son distribuciones alternativas para describir los mismos tipos de cantidades. Una de las conexiones entre los dos es que ambos son las distribuciones de la exponencial de las variables aleatorias distribuidas de acuerdo con otras distribuciones comunes, respectivamente, la distribución exponencial y la distribución normal. (Consulte la sección anterior).
La distribución de Pareto es un caso especial de la distribución de Pareto generalizada, que es una familia de distribuciones de forma similar, pero que contiene un parámetro adicional de tal manera que el soporte de la distribución está acotado por debajo (en un punto variable), o acotadas tanto por arriba como por abajo (donde ambas son variables), con la distribución Lomax como caso especial. Esta familia también contiene distribuciones exponenciales desplazadas y no desplazadas.
Distribución de Pareto con escala xm{displaystyle x_{m} y forma α α {displaystyle alpha } es equivalente a la distribución generalizada de Pareto con ubicación μ μ =xm{displaystyle mu =x_{m}, escala σ σ =xm/α α {displaystyle sigma =x_{m}/alpha } y forma .. =1/α α {displaystyle xi =1/alpha }. Vice versa uno puede conseguir la distribución de Pareto del GPD por xm=σ σ /.. {displaystyle x_{m}=sigma /xi } y α α =1/.. {displaystyle alpha =1/xi }.
La distribución de Pareto acotada (o truncada) tiene tres parámetros: α, L y H. Como en la distribución estándar de Pareto α determina la forma. L indica el valor mínimo y H indica el valor máximo.
La función de densidad de probabilidad es
donde L ≤ x ≤ H, y α > 0.
Si U se distribuye uniformemente en (0, 1), entonces se aplica el método de transformación inversa
es una distribución de Pareto acotada.
El propósito de la distribución de Pareto simétrica y la distribución de Pareto simétrica cero es capturar alguna distribución estadística especial con un pico de probabilidad pronunciado y colas de probabilidad largas y simétricas. Estas dos distribuciones se derivan de la distribución de Pareto. La cola de probabilidad larga normalmente significa que la probabilidad decae lentamente. La distribución de Pareto realiza un trabajo de ajuste en muchos casos. Pero si la distribución tiene una estructura simétrica con dos colas que decaen lentamente, Pareto no podría hacerlo. Luego se aplica la distribución Pareto simétrico o Pareto simétrico cero.
La función de distribución acumulativa (CDF) de la distribución simétrica de Pareto se define de la siguiente manera:
<math alttext="{displaystyle F(X)=P(x<X)={begin{cases}{tfrac {1}{2}}({b over 2b-X})^{a}&XF()X)=P()x.X)={}12()b2b− − X)aX.b1− − 12()bX)aX≥ ≥ b{begin{cases}{tfrac {1}{b over 2b-X})} {{a} {1tfrac {2}{bover 2b-X})}{a} {1-{2}{tfrac {2} {tfrac {b}{X}}}}}} {a}}} {}}} {}} {}} {}}}} {}}}}}}} {}} {}}}}}}} {}} {}} {}}}}}}}} {} {}} {}}}} {}}}}} {}}}}}}}}}}}} {}}}}}}}}} {} {} {}}} {}}}}} {} {}}}}} {}}}}}}}}}}}} {}}}}}} {}}}}}}}}}}}}}}}}} {}}}}}}}}}}}}} { Xgeq bend{cases}}<img alt="{displaystyle F(X)=P(x<X)={begin{cases}{tfrac {1}{2}}({b over 2b-X})^{a}&X
La función de densidad de probabilidad correspondiente (PDF) es:
p()x)=aba2()b+Silenciox− − bSilencio)a+1,X▪ ▪ R{displaystyle p(x)={ab^{a} over 2(b+leftvert x-brightvert)^{a+1}, Xin R}
Esta distribución tiene dos parámetros: a y b. Es simétrica por b. Entonces la expectativa matemática es b. Cuando, tiene varianza de la siguiente manera:
E()()x− − b)2)=∫ ∫ − − JUEGO JUEGO JUEGO JUEGO ()x− − b)2p()x)dx=2b2()a− − 2)()a− − 1){displaystyle E(x-b)^{2})=int _{-infty }{infty }(x-b)^{2}p(x)dx={2b^{2} over (a-2)(a-1)}}
La distribución CDF de Zero Symmetric Pareto (ZSP) se define de la siguiente manera:
<math alttext="{displaystyle F(X)=P(x<X)={begin{cases}{tfrac {1}{2}}({b over b-X})^{a}&XF()X)=P()x.X)={}12()bb− − X)aX.01− − 12()bb+X)aX≥ ≥ 0{displaystyle F(X)=P(x obtenidosX)={begin{cases}{tfrac {1}{2} {b over b-X})^{a {01-{tfrac {1}{2} {tfrac {b}{b}{b+X}})} {a} {a} {a} {0g}}}}}}}}}}}}} {ccH00}} {c}}} {c}}}}}}}}}}} {ccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccccc<img alt="{displaystyle F(X)=P(x<X)={begin{cases}{tfrac {1}{2}}({b over b-X})^{a}&X
El PDF correspondiente es:
p()x)=aba2()b+SilencioxSilencio)a+1,X▪ ▪ R{displaystyle p(x)={ab^{a} over 2(b+leftvert xrightvert)^{a+1}},Xin R}
Esta distribución es simétrica por cero. El parámetro a está relacionado con la tasa de disminución de la probabilidad y (a/2b) representa la magnitud máxima de la probabilidad.
La distribución de Pareto univariante se ha ampliado a una distribución de Pareto multivariante.
La función de verosimilitud para los parámetros de distribución de Pareto α y xm, dada una muestra independiente x = (x1, x2,..., xn), es
Por lo tanto, la función de verosimilitud logarítmica es
Se puede ver que l l ()α α ,xm){displaystyle ell (alphax_{mathrm {m})} aumenta monotonicamente con xm, es decir, cuanto mayor sea el valor xm, cuanto mayor sea el valor de la función de probabilidad. Por lo tanto, desde x ≥ xm, concluimos que
Para encontrar el estimador de α, calculamos la derivada parcial correspondiente y determinamos dónde es cero:
Por lo tanto, el estimador de máxima verosimilitud para α es:
El error estadístico esperado es:
Malik (1970) da la distribución conjunta exacta ()x^ ^ m,α α ^ ^ ){displaystyle ({hat {x}_{mathrm},{hat {alpha}}}}}}. En particular, x^ ^ m{displaystyle {hat {x}_{mathrm {m}}} {fn}} {fn}} {fn}}} y α α ^ ^ {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f} {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\\\\fnMicrosoft {\\\fn\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicrosoft } son independientes x^ ^ m{displaystyle {hat {x}_{mathrm {m}}} {fn}} {fn}} {fn}}} es Pareto con parámetro escala xm y parámetro de forma n, mientras α α ^ ^ {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f} {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\\\\fnMicrosoft {\\\fn\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicrosoft } tiene una distribución inversa-gamma con parámetros de forma y escala n− 1 y n, respectivamente.
Vilfredo Pareto usó originalmente esta distribución para describir la distribución de la riqueza entre los individuos, ya que parecía mostrar bastante bien la forma en que una porción más grande de la riqueza de cualquier sociedad es propiedad de un porcentaje más pequeño de personas en esa sociedad. También lo usó para describir la distribución del ingreso. Esta idea a veces se expresa más simplemente como el principio de Pareto o la 'regla 80-20'. que dice que el 20% de la población controla el 80% de la riqueza. Sin embargo, la regla 80-20 corresponde a un valor particular de α y, de hecho, los datos de Pareto sobre los impuestos sobre la renta británicos en su Cours d'économie politique indica que alrededor del 30% de la población tenía alrededor del 70% de los ingresos. El gráfico de la función de densidad de probabilidad (PDF) al principio de este artículo muestra que la "probabilidad" o fracción de la población que posee una pequeña cantidad de riqueza por persona es bastante alta y luego disminuye constantemente a medida que aumenta la riqueza. (Sin embargo, la distribución de Pareto no es realista para la riqueza del extremo inferior. De hecho, el valor neto puede incluso ser negativo). Esta distribución no se limita a describir la riqueza o el ingreso, sino a muchas situaciones en las que se encuentra un equilibrio en el distribución de la "pequeña" al "grande". Los siguientes ejemplos a veces se ven como aproximadamente distribuidos en Pareto:
La distribución de Pareto es una distribución continua de probabilidad. La ley de Zipf, también llamada la distribución de zeta, es una distribución discreta, separando los valores en un ranking simple. Ambos son una simple ley de poder con un exponente negativo, escalado para que sus distribuciones acumulativas sean iguales 1. El Zipf puede derivarse de la distribución de Pareto si x{displaystyle x} valores (ingresos) se vinculan N{displaystyle N} rangos para que el número de personas en cada bin siga un patrón de 1/rank. La distribución se normaliza definiendo xm{displaystyle x_{m} así α α xmα α =1H()N,α α − − 1){displaystyle alpha x_{mathrm {m} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} }={frac {1}{H(N,alpha -1)}}} Donde H()N,α α − − 1){displaystyle H(N,alpha -1)} es el número armónico generalizado. Esto hace que la función de densidad de probabilidad de Zipf se deriva de la de Pareto.
Donde s=α α − − 1{displaystyle s=alpha -1} y x{displaystyle x} es un número entero que representa el rango de 1 a N, donde N es el mayor rango de ingresos. Así que una persona seleccionada al azar (o palabra, enlace web o ciudad) de una población (o idioma, Internet o país) tiene f()x){displaystyle f(x)} probabilidad de clasificación x{displaystyle x}.
La "ley 80-20", según la cual el 20% de todas las personas reciben el 80% de todos los ingresos, y el 20% del 20% más afluente recibe el 80% de ese 80%, y así sucesivamente, sostiene precisamente cuando el índice de Pareto es α α =log4 5=log10 5log10 4.. 1.161{displaystyle alpha =log _{4}4}approx 1.161}. Este resultado puede derivarse de la fórmula curva Lorenz que se da a continuación. Además, se ha demostrado que los siguientes son matemáticamente equivalentes:
Esto no se aplica solo a los ingresos, sino también a la riqueza, oa cualquier otra cosa que pueda ser modelada por esta distribución.
Esto excluye las distribuciones de Pareto en las que 0 < α ≤ 1, que, como se señaló anteriormente, tienen un valor esperado infinito y, por lo tanto, no pueden modelar razonablemente la distribución del ingreso.
La ley de raíz cuadrada de precio se ofrece a veces como una propiedad de o como similar a la distribución de Pareto. However, the law only holds in the case that α α =1{displaystyle alpha =1}. Tenga en cuenta que en este caso, la cantidad total y esperada de la riqueza no se define, y la regla sólo se aplica asintomáticamente a las muestras al azar. El principio ampliado de Pareto mencionado anteriormente es una regla mucho más general.
La curva de Lorenz se usa a menudo para caracterizar las distribuciones de ingresos y riqueza. Para cualquier distribución, la curva de Lorenz L(F) se escribe en términos de PDF f o CDF F como
donde x(F) es la inversa de la CDF. Para la distribución de Pareto,
y la curva de Lorenz se calcula para ser
Para <math alttext="{displaystyle 00.α α ≤ ≤ 1{displaystyle 0 realizadasalpha leq 1}<img alt="{displaystyle 0 el denominador es infinito, rindiendo L=0. Ejemplos de la curva Lorenz para una serie de distribuciones de Pareto se muestran en el gráfico de la derecha.
Según Oxfam (2016), las 62 personas más ricas tienen tanta riqueza como la mitad más pobre de la población mundial. Podemos estimar el índice de Pareto que se aplicaría a esta situación. Letting ε equal 62/()7× × 109){displaystyle 62/(7times 10^{9}} tenemos:
o
La solución es que α equivale aproximadamente a 1,15, y aproximadamente el 9 % de la riqueza es propiedad de cada uno de los dos grupos. Pero en realidad, el 69% más pobre de la población adulta mundial posee solo alrededor del 3% de la riqueza.
El coeficiente Gini es una medida de la desviación de la curva Lorenz de la línea de distribución que es una línea que conecta [0, 0] y [1, 1], que se muestra en negro (αEn la parcela de Lorenz a la derecha. Específicamente, el coeficiente Gini es el doble del área entre la curva Lorenz y la línea de distribución. Luego se calcula el coeficiente Gini para la distribución de Pareto (para α α ≥ ≥ 1{displaystyle alpha geq 1}Para ser
(ver Aaberge 2005).
Se pueden generar muestras aleatorias mediante el muestreo por transformada inversa. Dada una variable aleatoria U extraída de la distribución uniforme en el intervalo unitario (0, 1], la variable T dada por
es una distribución de Pareto. Si U se distribuye uniformemente en [0, 1), se puede intercambiar con (1 − U).
Un experimento social es una metodología de investigación utilizada en la psicología y la sociología para analizar cómo las personas reaccionan ante... (leer más)
La metodología de la filosofía, o metodología filosófica, es el estudio de los métodos empleados para hacer filosofía. El término abarca tanto los... (leer más)
La investigación narrativa o análisis narrativo surgió como una disciplina dentro del campo más amplio de la investigación cualitativa a principios del... (leer más)