Ley de potencia

Compartir Imprimir Citar
Relación funcional entre dos cantidades
Un gráfico de la ley de poder de ejemplo que demuestra la clasificación de popularidad. A la derecha está la cola larga, y a la izquierda son los pocos que dominan (también conocido como la regla 80-20).

En estadística, una ley de potencia es una relación funcional entre dos cantidades, donde un cambio relativo en una cantidad da como resultado un cambio relativo proporcional en la otra cantidad, independientemente del tamaño inicial de esas cantidades.: una cantidad varía como potencia de otra. Por ejemplo, considerando el área de un cuadrado en términos de la longitud de su lado, si la longitud se duplica, el área se multiplica por un factor de cuatro.

Ejemplos empíricos

Las distribuciones de una amplia variedad de fenómenos físicos, biológicos y creados por el hombre siguen aproximadamente una ley de potencia en un amplio rango de magnitudes: estos incluyen los tamaños de los cráteres en la luna y de las erupciones solares, el patrón de alimentación de varios especies, los tamaños de los patrones de actividad de las poblaciones neuronales, las frecuencias de las palabras en la mayoría de los idiomas, las frecuencias de los nombres de las familias, la riqueza de especies en clados de organismos, los tamaños de los cortes de energía, las erupciones volcánicas, los juicios humanos sobre la intensidad de los estímulos y muchas otras cantidades. Pocas distribuciones empíricas se ajustan a una ley de potencia para todos sus valores, sino que siguen una ley de potencia en la cola. La atenuación acústica sigue leyes de potencia de frecuencia dentro de amplias bandas de frecuencia para muchos medios complejos. Las leyes de escalamiento alométrico para las relaciones entre variables biológicas se encuentran entre las funciones de ley de potencia más conocidas en la naturaleza.

Propiedades

Invariancia de escala

Un atributo de las leyes de poder es su invariancia de escala. Dada una relación f()x)=ax− − k{displaystyle f(x)=ax^{-k}, escalando el argumento x{displaystyle x} por un factor constante c{displaystyle c} causa sólo un escalado proporcional de la función misma. Eso es,

f()cx)=a()cx)− − k=c− − kf()x)∝ ∝ f()x),{displaystyle f(cx)=a(cx)^{-k}=c^{-k}f(x)propto f(x),!}

Donde ∝ ∝ {displaystyle propto } denota proporcionalidad directa. Es decir, escalando por una constante c{displaystyle c} simplemente multiplica la relación potencia-ley original por la constante c− − k{displaystyle c^{-k}. Por lo tanto, sigue que todas las leyes de poder con un exponente de escalado particular son equivalentes a factores constantes, ya que cada una es simplemente una versión escalada de los otros. Este comportamiento es lo que produce la relación lineal cuando se toman logaritmos de ambos f()x){displaystyle f(x)} y x{displaystyle x}, y la línea recta en la trama log-log se llama a menudo firma de una ley de poder. Con datos reales, tal rectitud es una condición necesaria, pero no suficiente, para los datos siguientes a una relación de poder. De hecho, hay muchas maneras de generar cantidades finitas de datos que imitan este comportamiento de firma, pero, en su límite asintotico, no son verdaderas leyes de poder (por ejemplo, si el proceso de generación de algunos datos sigue una distribución de Log-normal). Por lo tanto, los modelos de ley de poder que se ajusten y validen con precisión son un área activa de investigación en las estadísticas.

Falta de un valor promedio bien definido

Una ley de poder x− − k{displaystyle x^{-k} tiene una media bien definida x▪ ▪ [1,JUEGO JUEGO ){displaystyle xin [1,infty]} sólo si 2}" xmlns="http://www.w3.org/1998/Math/MathML">k■2{displaystyle k]2}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/fa7a4bb0e17a911cb4b3f6c4e455be472a295299" style="vertical-align: -0.338ex; width:5.472ex; height:2.176ex;"/>, y tiene una varianza finita sólo si 3}" xmlns="http://www.w3.org/1998/Math/MathML">k■3{displaystyle k confiar3}3}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/45c55b4ff0d61c81d264463917a795a521e8e5c8" style="vertical-align: -0.338ex; width:5.472ex; height:2.176ex;"/>; la mayoría de las leyes de poder identificadas en la naturaleza tienen exponentes tales que la media está bien definida pero la varianza no es, lo que implica que son capaces de comportamiento del cisne negro. Esto se puede ver en el siguiente experimento de pensamiento: imagina una habitación con tus amigos y estima el ingreso mensual promedio en la habitación. Ahora imagina la persona más rica del mundo que entra en la habitación, con un ingreso mensual de alrededor de 1.000 millones de dólares. ¿Qué pasa con el ingreso promedio en la habitación? Los ingresos se distribuyen según una ley de poder conocida como la distribución de Pareto (por ejemplo, el valor neto de los estadounidenses se distribuye según una ley de poder con un exponente de 2).

Por un lado, esto hace que sea incorrecto aplicar estadísticas tradicionales que se basan en la varianza y la desviación estándar (como el análisis de regresión). Por otro lado, esto también permite intervenciones rentables. Por ejemplo, dado que los gases de escape de los automóviles se distribuyen de acuerdo con una ley de potencias entre los automóviles (muy pocos automóviles contribuyen a la mayor parte de la contaminación), sería suficiente eliminar esos pocos automóviles de la carretera para reducir sustancialmente los gases de escape totales.

La mediana existe, sin embargo: para una ley de poder xk, con exponente 1}" xmlns="http://www.w3.org/1998/Math/MathML">k■1{displaystyle k] 1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/5cda43bd4034dc2d04cd562005d0af81d3d2dbc6" style="vertical-align: -0.338ex; width:5.472ex; height:2.176ex;"/>, toma el valor 21/(k – 1)xmin, donde xmin es el valor mínimo para el cual la ley de poder sostiene.

Universalidad

La equivalencia de leyes de potencia con un exponente de escala particular puede tener un origen más profundo en los procesos dinámicos que generan la relación ley de potencia. En física, por ejemplo, las transiciones de fase en los sistemas termodinámicos están asociadas con la aparición de distribuciones de leyes de potencia de ciertas cantidades, cuyos exponentes se denominan exponentes críticos del sistema. Se puede demostrar, a través de la teoría de grupos de renormalización, que diversos sistemas con los mismos exponentes críticos, es decir, que muestran un comportamiento de escala idéntico a medida que se acercan a la criticidad, comparten la misma dinámica fundamental. Por ejemplo, el comportamiento del agua y el CO2 en sus puntos de ebullición caen en la misma clase de universalidad porque tienen exponentes críticos idénticos. De hecho, casi todas las transiciones de fase materiales están descritas por un pequeño conjunto de clases de universalidad. Se han hecho observaciones similares, aunque no tan completas, para varios sistemas críticos autoorganizados, donde el punto crítico del sistema es un atractor. Formalmente, este intercambio de dinámicas se denomina universalidad, y se dice que los sistemas con exactamente los mismos exponentes críticos pertenecen a la misma clase de universalidad.

Funciones de ley de potencia

El interés científico en las relaciones de ley de potencia se deriva en parte de la facilidad con la que ciertas clases generales de mecanismos las generan. La demostración de una relación de ley de potencia en algunos datos puede apuntar a tipos específicos de mecanismos que podrían ser la base del fenómeno natural en cuestión y puede indicar una conexión profunda con otros sistemas aparentemente no relacionados; ver también universalidad arriba. La ubicuidad de las relaciones entre leyes de potencia en física se debe en parte a restricciones dimensionales, mientras que en sistemas complejos, las leyes de potencia a menudo se consideran firmas de jerarquía o de procesos estocásticos específicos. Algunos ejemplos notables de leyes de potencia son la ley de distribución de ingresos de Pareto, la autosimilitud estructural de los fractales y las leyes de escala en los sistemas biológicos. La investigación sobre los orígenes de las relaciones de ley de potencia y los esfuerzos para observarlas y validarlas en el mundo real es un tema activo de investigación en muchos campos de la ciencia, incluida la física, la informática, la lingüística, la geofísica, la neurociencia, la sistemática, la sociología, etc. economía y más.

Sin embargo, gran parte del interés reciente en las leyes de potencia proviene del estudio de las distribuciones de probabilidad: las distribuciones de una amplia variedad de cantidades parecen seguir la forma de ley de potencia, al menos en su extremo superior (grandes eventos). El comportamiento de estos grandes eventos conecta estas cantidades con el estudio de la teoría de las grandes desviaciones (también llamada teoría del valor extremo), que considera la frecuencia de eventos extremadamente raros como caídas del mercado de valores y grandes desastres naturales. Es principalmente en el estudio de distribuciones estadísticas que el nombre "ley de potencia" se usa

En contextos empíricos, una aproximación a una ley de poder o()xk){displaystyle o(x^{k}} a menudo incluye un término de desviación ε ε {displaystyle varepsilon }, que puede representar la incertidumbre en los valores observados (tal vez errores de medición o muestreo) o proporcionar una manera sencilla de que las observaciones se desvíen de la función de la ley de poder (tal vez por razones estocásticas):

Sí.=axk+ε ε .{displaystyle Y=ax^{k}+varepsilon.

Matemáticamente, una estricta ley de poder no puede ser una distribución de probabilidad, pero una distribución que es una función de potencia truncada es posible: p()x)=Cx− − α α {displaystyle p(x)=Cx^{-alpha } para x_{text{min}}}" xmlns="http://www.w3.org/1998/Math/MathML">x■xmin{displaystyle x confianzax_{text{min}} x_text{min}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/e9a5bd64976314b674ab7d520ea49b11c0b3b780" style="vertical-align: -0.671ex; width:8.73ex; height:2.176ex;"/> donde el exponente α α {displaystyle alpha } (Carta griega alfa, para no confundirse con el factor de escalado a{displaystyle a} utilizado arriba) es mayor que 1 (otras la cola tiene área infinita), el valor mínimo xmin{displaystyle x_{text{min}} se necesita de otra manera la distribución tiene área infinita como x acercamientos 0, y la constante C es un factor de escalado para asegurar que el área total es 1, según lo requerido por una distribución de probabilidad. Más a menudo uno utiliza una ley de poder asintotico – una que sólo es verdad en el límite; vea distribución de probabilidad de la ley de poder a continuación para obtener detalles. Típicamente el exponente cae en el rango <math alttext="{displaystyle 2<alpha 2.α α .3{displaystyle 2 realizadasalpha.<img alt="2 < alpha , aunque no siempre.

Ejemplos

Se han identificado más de cien distribuciones de ley de potencias en física (p. ej., avalanchas de montones de arena), biología (p. ej., extinción de especies y masa corporal) y ciencias sociales (p. ej., tamaño de ciudades e ingresos). Entre ellos están:

Astronomía

Física

Psicología

Biología

Meteorología

Ciencias generales

Matemáticas

Economía

Finanzas

Variantes

Ley de potencia rota

Algunos modelos de la función de masa inicial utilizan una ley de poder rota; aquí Kroupa (2001) en rojo.

Una ley de potencia incumplida es una función por partes, que consta de dos o más leyes de potencia, combinadas con un umbral. Por ejemplo, con dos leyes de potencia:

f()x)∝ ∝ xα α 1{displaystyle f(x)propto x^{alpha ¿Qué? para <math alttext="{displaystyle xx.xT,{displaystyle x wonx_{text{th}}}<img alt="x
x_{text{th}}}" xmlns="http://www.w3.org/1998/Math/MathML">f()x)∝ ∝ xTα α 1− − α α 2xα α 2parax■xT{displaystyle f(x)propto x_{text{th}{alpha ♪ {1}-alpha ¿Por qué?x_text{th}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/71be37181343c96e74b30f97cd16118b42b987e1" style="vertical-align: -1.005ex; width:29.06ex; height:3.343ex;"/>.

Ley de potencia con corte exponencial

Una ley de potencia con un corte exponencial es simplemente una ley de potencia multiplicada por una función exponencial:

f()x)∝ ∝ x− − α α e− − β β x.{displaystyle f(x)propto x^{-alpha }e^{-beta x}

Ley de potencia curva

f()x)∝ ∝ xα α +β β x{displaystyle f(x)propto x^{alpha +beta x}

Distribuciones de probabilidad de ley de potencia

En un sentido más suelto, una distribución de probabilidad de la ley de poder es una distribución cuya función de densidad (o función de masa en el caso discreto) tiene la forma, para grandes valores de x{displaystyle x},

x)sim L(x)x^{-(alpha -1)}}" xmlns="http://www.w3.org/1998/Math/MathML">P()X■x)♪ ♪ L()x)x− − ()α α − − 1){displaystyle P(X confidencialx)sim L(x)x^{-(alpha -1)}}x)sim L(x)x^{-(alpha -1)}}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/66acb55b9fe85412f615f7cdf645b00a2e47d10e" style="vertical-align: -0.838ex; width:25.055ex; height:3.343ex;"/>

Donde 1}" xmlns="http://www.w3.org/1998/Math/MathML">α α ■1{displaystyle alpha }1" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/17d81dbbc4786493c7b8548cc324a978d7cf5dbd" style="vertical-align: -0.338ex; width:5.749ex; height:2.176ex;"/>, y L()x){displaystyle L(x)} es una función que varía lentamente, que es cualquier función que satisface limx→ → JUEGO JUEGO L()rx)/L()x)=1{displaystyle lim _{xrightarrow infty }L(r,x)/L(x)=1} para cualquier factor positivo r{displaystyle r}. Esta propiedad de L()x){displaystyle L(x)} sigue directamente del requisito de que p()x){displaystyle p(x)} ser invariante a escala asintótica; por lo tanto, la forma de L()x){displaystyle L(x)} sólo controla la forma y el alcance finito de la cola inferior. Por ejemplo, si L()x){displaystyle L(x)} es la función constante, entonces tenemos una ley de poder que sostiene para todos los valores de x{displaystyle x}. En muchos casos, es conveniente asumir un límite inferior xmin{displaystyle x_{mathrm {min}} de la cual la ley sostiene. Combinando estos dos casos, y donde x{displaystyle x} es una variable continua, la ley de potencia tiene la forma de la distribución Pareto

p()x)=α α − − 1xmin()xxmin)− − α α ,{displaystyle p(x)={frac {alpha -1} {x_{min}}}}derecho {frac {x}}derecha)}{-alpha }}

donde el prefactor a α α − − 1xmin{fnMicroc {fnMicrosoft {fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {\\fnMicrosoft {\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ - ¿Qué? es la constante normalizadora. Ahora podemos considerar varias propiedades de esta distribución. Por ejemplo, sus momentos son dados por

.. xm.. =∫ ∫ xminJUEGO JUEGO xmp()x)dx=α α − − 1α α − − 1− − mxminm{displaystyle langle x^{m}rangle =int _{x_{min }^{infty }x^{m}p(x),mathrm {d} x={frac {alpha -1}{alpha - ¿Qué?

que sólo está bien definida <math alttext="{displaystyle mm.α α − − 1{displaystyle m贸nalpha -1}<img alt="m . Es decir, todos los momentos m≥ ≥ α α − − 1{displaystyle mgeq alpha -1} buceo: cuando α α ≤ ≤ 2{displaystyle alpha leq 2}, el promedio y todos los momentos de orden superior son infinitos; cuando <math alttext="{displaystyle 2<alpha 2.α α .3{displaystyle 2 realizadasalpha.<img alt="2<alpha, la media existe, pero la variabilidad y los momentos de orden superior son infinitos, etc. Para las muestras de tamaño finito extraídas de tal distribución, este comportamiento implica que los estimadores del momento central (como la media y la varianza) para los momentos divergentes nunca convergerán – ya que se acumulan más datos, continúan creciendo. Estas distribuciones de probabilidad de la ley de poder también se denominan distribuciones tipo Pareto, distribuciones con colas de Pareto o distribuciones con colas regulares variables.

Una modificación, que no satisface la forma general anterior, con un corte exponencial, es

p()x)∝ ∝ L()x)x− − α α e− − λ λ x.{displaystyle p(x)propto L(x)x^{-alpha }mathrm {e} ^{-lambda x}

En esta distribución, el término de decadencia exponencial e− − λ λ x{displaystyle mathrm {e} eventualmente abruma el comportamiento de la ley de poder a valores muy grandes x{displaystyle x}. Esta distribución no escala y por lo tanto no es asintomáticamente como una ley de poder; sin embargo, hace aproximadamente escala sobre una región finita antes del corte. La forma pura arriba es un subconjunto de esta familia, con λ λ =0{displaystyle lambda =0}. Esta distribución es una alternativa común a la distribución de la ley asintotica porque captura naturalmente efectos de tamaño finito.

Las distribuciones de Tweedie son una familia de modelos estadísticos caracterizados por cierre bajo convolución aditiva y reproductiva, así como bajo transformación de escala. En consecuencia, todos estos modelos expresan una relación de ley de potencia entre la varianza y la media. Estos modelos tienen un papel fundamental como focos de convergencia matemática similar al papel que tiene la distribución normal como foco en el teorema del límite central. Este efecto de convergencia explica por qué la ley de potencia de la varianza a la media se manifiesta tan ampliamente en los procesos naturales, como ocurre con la ley de Taylor en ecología y con la escala de fluctuación en física. También se puede demostrar que esta ley de potencia de la varianza a la media, cuando se demuestra mediante el método de expansión de bins, implica la presencia de 1/f ruido y que 1/f el ruido puede surgir como consecuencia de este efecto de convergencia Tweedie.

Métodos gráficos de identificación

Aunque se han propuesto métodos más sofisticados y sólidos, los métodos gráficos utilizados con mayor frecuencia para identificar distribuciones de probabilidad de ley de potencia utilizando muestras aleatorias son los diagramas de cuantil-cuantil de Pareto (o diagramas Q-Q de Pareto), los diagramas de vida residual media y el registro logarítmico. –gráficos logarítmicos. Otro método gráfico más sólido utiliza paquetes de funciones de cuantiles residuales. (Tenga en cuenta que las distribuciones de ley de potencia también se denominan distribuciones de tipo Pareto). Aquí se supone que se obtiene una muestra aleatoria de una distribución de probabilidad y que queremos saber si la cola de la distribución sigue una ley de potencia. (en otras palabras, queremos saber si la distribución tiene una "cola de Pareto"). Aquí, la muestra aleatoria se llama "los datos".

Las parcelas Pareto Q-Q comparan los quantiles de los datos transformados con los quantiles correspondientes de una distribución exponencial con la media 1 (o con los quantiles de una distribución estándar de Pareto) trazando el primero contra el segundo. Si el scatterplot resultante sugiere que los puntos trazados "converjan asintomáticamente" a una línea recta, entonces se debe sospechar una distribución de la ley de poder. Una limitación de las parcelas de Pareto Q-Q es que se comportan mal cuando el índice de cola α α {displaystyle alpha } (también llamado índice Pareto) está cerca de 0, ya que las parcelas Pareto Q-Q no están diseñadas para identificar distribuciones con colas variando lentamente.

Por otro lado, en su versión para identificar distribuciones de probabilidad de ley de potencia, el gráfico de vida residual media consiste en primero transformar logarítmicamente los datos y luego graficar el promedio de aquellos datos transformados logarítmicamente que son más altos que i-ésimo orden frente al estadístico de i-ésimo orden, para i = 1,..., n, donde n es el tamaño de la muestra aleatoria. Si el diagrama de dispersión resultante sugiere que los puntos graficados tienden a "estabilizarse" sobre una línea recta horizontal, entonces se debe sospechar una distribución de ley de potencias. Dado que el gráfico de vida residual media es muy sensible a los valores atípicos (no es robusto), por lo general produce gráficos que son difíciles de interpretar; por esta razón, tales tramas suelen llamarse tramas de terror de Hill.

Una línea recta en una trama log-log es necesaria pero insuficiente evidencia para los suegros de poder, la pendiente de la línea recta corresponde al exponente de la ley de poder.

Los diagramas logarítmicos son una forma alternativa de examinar gráficamente la cola de una distribución utilizando una muestra aleatoria. Sin embargo, se debe tener precaución, ya que se necesita una gráfica logarítmica pero no hay evidencia suficiente para una relación de ley de potencia, ya que muchas distribuciones que no son de ley de potencia aparecerán como líneas rectas en una gráfica logarítmica. Este método consiste en graficar el logaritmo de un estimador de la probabilidad de que ocurra un número particular de la distribución versus el logaritmo de ese número particular. Por lo general, este estimador es la proporción de veces que aparece el número en el conjunto de datos. Si los puntos del gráfico tienden a "convergir" a una línea recta para números grandes en el eje x, entonces el investigador concluye que la distribución tiene una cola de ley de potencia. Se han publicado ejemplos de la aplicación de este tipo de tramas. Una desventaja de estos gráficos es que, para que brinden resultados confiables, requieren una gran cantidad de datos. Además, son apropiados solo para datos discretos (o agrupados).

Se ha propuesto otro método gráfico para la identificación de las distribuciones de probabilidad de la ley de poder utilizando muestras aleatorias. Esta metodología consiste en trazar una paquete para la muestra transportada por log. Originalmente propuesto como una herramienta para explorar la existencia de momentos y la función de generación de momento utilizando muestras aleatorias, la metodología del paquete se basa en funciones cuantitativas residuales (RQFs), también llamadas funciones percentiles residuales, que proporcionan una caracterización completa del comportamiento de cola de muchas distribuciones de probabilidad conocidas, incluyendo distribuciones de poder, distribuciones con otros tipos de colas pesadas, e incluso distribuciones de cola no pesada. Las parcelas Bundle no tienen las desventajas de las parcelas Pareto Q-Q, significan parcelas residuales de vida y parcelas log-log mencionadas anteriormente (son robustas a los outliers, permiten identificar visualmente las leyes de poder con pequeños valores de α α {displaystyle alpha }, y no exigen la recopilación de muchos datos). Además, otros tipos de comportamiento de cola se pueden identificar usando parcelas de paquetes.

Trazar distribuciones de ley de potencias

En general, las distribuciones de la ley de poder se trazan sobre ejes doblemente logarítmicos, que enfatiza la región de la cola superior. La forma más conveniente de hacerlo es a través de la distribución acumulativa (complementaria) (ccdf) es decir, la función de supervivencia, x)}" xmlns="http://www.w3.org/1998/Math/MathML">P()x)=Pr()X■x){displaystyle P(x)=mathrm {Pr} (X confíax)} x)" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/f6eee35035f3ac11c8a8e26339b6a0ff11d5f8cb" style="vertical-align: -0.838ex; width:18.695ex; height:2.843ex;"/>,

x)=Cint _{x}^{infty }p(X),mathrm {d} X={frac {alpha -1}{x_{min }^{-alpha +1}}}int _{x}^{infty }X^{-alpha },mathrm {d} X=left({frac {x}{x_{min }}}right)^{1-alpha }.}" xmlns="http://www.w3.org/1998/Math/MathML">P()x)=Pr()X■x)=C∫ ∫ xJUEGO JUEGO p()X)dX=α α − − 1xmin− − α α +1∫ ∫ xJUEGO JUEGO X− − α α dX=()xxmin)1− − α α .{displaystyle P(x)=Pr(X confidencialx)=Cint _{x}^{infty }p(X),mathrm {d} X={frac {Alpha -1}{x_{min}{-alpha +1}int _{x}{infty }X^{-alpha ¿Qué? }x)=Cint _{x}^{infty }p(X),mathrm {d} X={frac {alpha -1}{x_{min }^{-alpha +1}}}int _{x}^{infty }X^{-alpha },mathrm {d} X=left({frac {x}{x_{min }}}right)^{1-alpha }.}" aria-hidden="true" class="mwe-math-fallback-image-inline" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/272ec36014fb4410461f29f442ab7da028d97a13" style="vertical-align: -3.005ex; width:76.242ex; height:7.009ex;"/>

El cdf es también una función de la ley de poder, pero con un exponente de escalada más pequeño. Para los datos, una forma equivalente del cdf es el enfoque de frecuencia de rango, en el que primero clasificamos el n{displaystyle n} valores observados en orden ascendente, y trazarlos contra el vector [1,n− − 1n,n− − 2n,...... ,1n]{displaystyle left[1,{frac {n-1}{n},{frac {n-2}{n}}dots{frac {1}{n}}right].

Aunque puede ser conveniente registrar los datos en bins o suavizar la función de densidad de probabilidad (masa) directamente, estos métodos introducen un sesgo implícito en la representación de los datos y, por lo tanto, deben evitarse. La función de supervivencia, por otro lado, es más robusta (pero no sin) tales sesgos en los datos y conserva la firma lineal en ejes doblemente logarítmicos. Aunque se prefiere una representación de función de supervivencia sobre la de pdf mientras se ajusta una ley de potencia a los datos con el método de mínimos cuadrados lineales, no está exento de inexactitud matemática. Por lo tanto, al estimar los exponentes de una distribución de ley de potencia, se recomienda el estimador de máxima verosimilitud.

Estimación del exponente a partir de datos empíricos

Hay muchas formas de estimar el valor del exponente de escala para una cola de ley de potencia, sin embargo, no todas producen respuestas imparciales y consistentes. Algunas de las técnicas más fiables suelen basarse en el método de máxima verosimilitud. Los métodos alternativos a menudo se basan en hacer una regresión lineal en la probabilidad logarítmica, la función de distribución acumulativa logarítmica o en datos agrupados en logaritmos, pero estos enfoques deben evitarse ya que pueden conducir a estimaciones altamente sesgadas de la exponente de escala

Máxima probabilidad

Para datos con valores reales, independientes y distribuidos de forma idéntica, ajustamos una distribución de ley de potencias de la forma

p()x)=α α − − 1xmin()xxmin)− − α α {displaystyle p(x)={frac {alpha -1} {x_{min}}}derecha {frac {x}{min}}derecha)}{-alpha }}

a los datos x≥ ≥ xmin{displaystyle xgeq x_{min}}, donde el coeficiente α α − − 1xmin{fnMicroc {fnMicrosoft {fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {\\fnMicrosoft {\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ - ¿Qué? se incluye para asegurar que la distribución sea normalizada. Dada la elección xmin{displaystyle x_{min}}, la función de probabilidad de registro se convierte en:

L()α α )=log⁡ ⁡ ∏ ∏ i=1nα α − − 1xmin()xixmin)− − α α {displaystyle {mathcal {L}(alpha)=log prod - ¿Qué? {Alpha -1}{x_{min}}left({frac Bien.

El máximo de esta probabilidad se encuentra diferenciando con respecto al parámetro α α {displaystyle alpha }, estableciendo el resultado igual a cero. Al reorganizarse, esto produce la ecuación del estimador:

α α ^ ^ =1+n[.. i=1nIn⁡ ⁡ xixmin]− − 1{fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f} {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\\\\fnMicrosoft {\\\fn\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicrosoft #=1+nleft [sum] _{i=1}{n}ln {frac Está bien.

Donde {}xi}{displaystyle {x_{i}}} son n{displaystyle n} Puntos de datos xi≥ ≥ xmin{displaystyle x_{i}geq x_{min }. Este estimador exhibe un pequeño sesgo de tamaño de muestra finito de orden O()n− − 1){displaystyle O(n^{-1}}, que es pequeño cuando nAdemás, el error estándar de la estimación es σ σ =α α ^ ^ − − 1n+O()n− − 1){displaystyle sigma ={hat {alpha }-1}{sqrt {n}}+O(n^{-1}. Este estimador es equivalente al popular estimador de Hill de la financiación cuantitativa y la teoría del valor extremo.

Para un conjunto de n integer-valued data points {}xi}{displaystyle {x_{i}}}, de nuevo donde cada xi≥ ≥ xmin{displaystyle x_{i}geq x_{min }, el exponente de probabilidad máxima es la solución a la ecuación trascendental

Especificaciones Especificaciones .()α α ^ ^ ,xmin)Especificaciones Especificaciones ()α α ^ ^ ,xmin)=− − 1n.. i=1nIn⁡ ⁡ xixmin{displaystyle {frac {zeta ' {hat {alpha }},x_{min }}{zeta ({hat {alpha },x_{min }}=-{frac {1} {n}sum} ################################################################################################################################################################################################################################################################ {x_{i}{x_{min}}}} {cH}}} {cH}}} {cH}}}}} {cH}}}}}}} {cH}}}}}}}}} {cH}}}}} {cH}}}}}}} {cH}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {c}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {c}}} {c}}}}}}}}}}}}}}}}}}}}} {ccccccccccccccccccccccH}}}}}}}}

Donde Especificaciones Especificaciones ()α α ,xmin){displaystyle zeta (alphax_{mathrm {min})} es la función incompleta zeta. La incertidumbre en esta estimación sigue la misma fórmula que para la ecuación continua. Sin embargo, las dos ecuaciones para α α ^ ^ {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f} {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\\\\fnMicrosoft {\\\fn\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicrosoft } no son equivalentes, y la versión continua no debe ser aplicada a datos discretos, ni viceversa.

Además, ambos estimadores requieren la elección de xmin{displaystyle x_{min}}. Para funciones con un no-trivial L()x){displaystyle L(x)} función, elección xmin{displaystyle x_{min}} demasiado pequeño produce un sesgo significativo en α α ^ ^ {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f} {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\\\\fnMicrosoft {\\\fn\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicrosoft }, mientras que la elección demasiado grande aumenta la incertidumbre en α α ^ ^ {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f} {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\\\\fnMicrosoft {\\\fn\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicrosoft }, y reduce el poder estadístico de nuestro modelo. En general, la mejor opción xmin{displaystyle x_{min}} depende fuertemente de la forma particular de la cola inferior, representada por L()x){displaystyle L(x)} arriba.

Puede encontrar más información sobre estos métodos y las condiciones en las que se pueden usar. Además, este artículo de revisión integral proporciona código utilizable (Matlab, Python, R y C++) para las rutinas de estimación y prueba de la ley de potencias. distribuciones.

Estimación de Kolmogorov-Smirnov

Otro método para la estimación del exponente de la ley de poder, que no asume datos independientes y distribuidos de forma idéntica, utiliza la minimización de la estadística Kolmogorov–Smirnov, D{displaystyle D}, entre las funciones de distribución acumulativa de los datos y la ley de poder:

α α ^ ^ =argminα α Dα α {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f} {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {\fnMicrosoft {\fnMicrosoft {\\fnMicrosoft {fnMicrosoft {\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {\\\\fnMicrosoft {\\\fn\\fnMicrosoft {fnMicrosoft {fnMicrosoft {\\fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {\\\\\\fnMicrosoft {fnMicrosoft {fnMicrosoft Sans Serif} {fnMicrosoft Sans Serif} ♪♪

con

Dα α =maxxSilencioPemp()x)− − Pα α ()x)Silencio{displaystyle D_{alpha }=max _{x} arrestP_{mathrm {emp}(x)-P_{alpha }(x)

Donde Pemp()x){displaystyle P_{mathrm {emp}(x)} y Pα α ()x){displaystyle P_{alpha }(x)} denota los cdfs de los datos y la ley de poder con exponente α α {displaystyle alpha }, respectivamente. Como este método no asume los datos iid, proporciona una forma alternativa para determinar el exponente de la ley de poder para conjuntos de datos en los que no se puede ignorar la correlación temporal.

Método de ajuste de dos puntos

Este criterio se puede aplicar para la estimación del exponente de ley de potencia en el caso de distribuciones libres de escala y proporciona una estimación más convergente que el método de máxima verosimilitud. Se ha aplicado para estudiar distribuciones de probabilidad de aberturas de fracturas. En algunos contextos, la distribución de probabilidad se describe, no por la función de distribución acumulativa, por la frecuencia acumulativa de una propiedad X, definida como el número de elementos por metro (o unidad de área, segundo, etc.) para que X > Se aplica x, donde x es un número real variable. Como ejemplo, la distribución acumulativa de la apertura de la fractura, X, para una muestra de N elementos se define como 'el número de fracturas por metro que tienen una apertura mayor que x. El uso de la frecuencia acumulada tiene algunas ventajas, p. permite poner en el mismo diagrama datos recopilados de líneas de muestra de diferentes longitudes a diferentes escalas (por ejemplo, de afloramiento y de microscopio).

Validación de leyes de potencia

Aunque las relaciones de ley de potencia son atractivas por muchas razones teóricas, demostrar que los datos siguen una relación de ley de potencia requiere más que simplemente ajustar un modelo particular a los datos. Esto es importante para comprender el mecanismo que da lugar a la distribución: superficialmente, pueden surgir distribuciones similares por razones significativamente diferentes, y diferentes modelos producen predicciones diferentes, como la extrapolación.

Por ejemplo, las distribuciones logarítmicas normales a menudo se confunden con distribuciones de ley de potencia: un conjunto de datos extraído de una distribución logarítmica normal será aproximadamente lineal para valores grandes (lo que corresponde a que la cola superior de logaritmo normal esté cerca de una ley de potencia), pero para valores pequeños, el logaritmo normal caerá significativamente (inclinándose hacia abajo), lo que corresponde a que la cola inferior del logaritmo normal sea pequeña (hay muy pocos valores pequeños, en lugar de muchos valores pequeños en una ley de potencia).

Por ejemplo, la ley de Gibrat sobre los procesos de crecimiento proporcional produce distribuciones que son logarítmicas normales, aunque sus diagramas logarítmicos parecen lineales en un rango limitado. Una explicación de esto es que aunque el logaritmo de la función de densidad lognormal es cuadrático en log(x), lo que produce un "arqueado" forma en un gráfico logarítmico, si el término cuadrático es pequeño en relación con el término lineal, el resultado puede parecer casi lineal, y el comportamiento lognormal solo es visible cuando domina el término cuadrático, lo que puede requerir muchos más datos. Por lo tanto, una gráfica logarítmica que esté ligeramente "inclinada" hacia abajo puede reflejar una distribución logarítmica normal, no una ley de potencia.

En general, muchas formas funcionales alternativas pueden parecer seguir una forma de ley de potencia hasta cierto punto. Stumpf &amperio; Porter (2012) propuso graficar la función de distribución acumulativa empírica en el dominio log-log y afirmó que una ley potencial candidata debería cubrir al menos dos órdenes de magnitud. Además, los investigadores generalmente tienen que enfrentar el problema de decidir si una distribución de probabilidad del mundo real sigue o no una ley de potencia. Como solución a este problema, Díaz propuso una metodología gráfica basada en muestras aleatorias que permiten discernir visualmente entre diferentes tipos de comportamiento de la cola. Esta metodología utiliza paquetes de funciones de cuantiles residuales, también llamadas funciones de vida residual de percentiles, que caracterizan muchos tipos diferentes de colas de distribución, incluidas colas pesadas y no pesadas. Sin embargo, Stumpf & Porter (2012) reivindicó la necesidad de una base teórica y estadística para respaldar una ley de potencia en el mecanismo subyacente que impulsa el proceso de generación de datos.

Un método para validar una relación de ley de potencia prueba muchas predicciones ortogonales de un mecanismo generativo particular contra datos. Simplemente ajustar una relación de ley de potencia a un tipo particular de datos no se considera un enfoque racional. Como tal, la validación de afirmaciones de ley de potencia sigue siendo un campo de investigación muy activo en muchas áreas de la ciencia moderna.