Probit

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Función matemática, inversa de la función de error
Parcela de función probita

En teoría de probabilidad y estadística, la función probit es la función cuantil asociada con la distribución normal estándar. Tiene aplicaciones en análisis de datos y aprendizaje automático, en particular gráficos estadísticos exploratorios y modelado de regresión especializado de variables de respuesta binaria.

Matemáticamente, el probit es el inverso de la función de distribución acumulativa de la distribución normal estándar, que se denota como CCPR CCPR ()z){displaystyle Phi (z)}, por lo que el probit se define como

probit⁡ ⁡ ()p)=CCPR CCPR − − 1()p)parap▪ ▪ ()0,1){displaystyle operatorname {probit}(p)=Phi ^{-1}(p)quad {text{for}quad pin (0,1)}.

En gran parte debido al teorema del límite central, la distribución normal estándar juega un papel fundamental en la teoría de la probabilidad y la estadística. Si consideramos el hecho familiar de que la distribución normal estándar sitúa el 95% de la probabilidad entre −1,96 y 1,96, y es simétrica alrededor de cero, se deduce que

CCPR CCPR ()− − 1.96)=0,025=1− − CCPR CCPR ()1.96).{displaystyle Phi (-1.96)=0.025=1-Phi (1.96).,!}

La función probit proporciona la función 'inversa' cálculo, generando un valor de una variable aleatoria normal estándar, asociada con una probabilidad acumulativa especificada. Siguiendo con el ejemplo,

probit⁡ ⁡ ()0,025)=− − 1.96=− − probit⁡ ⁡ ()0.975){displaystyle operatorname {probit} (0.025)=-1.96=-operatorname {probit} (0.975)}.

En general,

CCPR CCPR ()probit⁡ ⁡ ()p))=p{displaystyle Phi (operatorname {probit} (p)=p}
y
probit⁡ ⁡ ()CCPR CCPR ()z))=z.{displaystyle operatorname {probit} (Phi (z)=z.}

Desarrollo conceptual

La idea de la función probit fue publicada por Chester Ittner Bliss en un artículo de 1934 en Science sobre cómo tratar datos como el porcentaje de una plaga eliminada por un pesticida. Bliss propuso transformar el porcentaje de muertos en una "unidad de probabilidad de capacidad" (o "probit") que estaba linealmente relacionado con la definición moderna (la definió arbitrariamente como igual a 0 para 0,0001 y 1 para 0,9999):

Estas unidades de probabilidad arbitrarias han sido llamadas "probitos"...

Incluyó una tabla para ayudar a otros investigadores a convertir sus porcentajes de muerte a su probit, que luego podrían representar frente al logaritmo de la dosis y así, se esperaba, obtener una línea más o menos recta. El llamado modelo probit sigue siendo importante en toxicología, así como en otros campos. El enfoque se justifica en particular si la variación de la respuesta puede racionalizarse como una distribución lognormal de tolerancias entre los sujetos sometidos a prueba, donde la tolerancia de un sujeto en particular es la dosis suficiente para la respuesta de interés.

El método introducido por Bliss se desarrolló en Análisis Probit, un texto importante sobre aplicaciones toxicológicas de D. J. Finney. Los valores presentados por Finney se pueden derivar de probits tal como se definen aquí agregando un valor de 5. Esta distinción la resume Collett (p. 55): “La definición original de un probit [con 5 agregado] fue principalmente para evitar tener que trabajar con probits negativos;... Esta definición todavía se utiliza en algunos sectores, pero en los principales paquetes de software estadístico para lo que se conoce como análisis probit, los probits se definen sin la adición de 5 ." Cabe señalar que la metodología probit, incluida la optimización numérica para el ajuste de funciones probit, se introdujo antes de la disponibilidad generalizada de la informática electrónica. Al utilizar tablas, era conveniente tener probits uniformemente positivos. Las áreas de aplicación comunes no requieren probits positivos.

Diagnóstico de la desviación de una distribución respecto de la normalidad

Además de proporcionar una base para tipos importantes de regresión, la función probit es útil en el análisis estadístico para diagnosticar la desviación de la normalidad, según el método de trazado Q–Q. Si un conjunto de datos es en realidad una muestra de una distribución normal, una gráfica de los valores frente a sus puntuaciones probit será aproximadamente lineal. Las desviaciones específicas de la normalidad, como la asimetría, las colas pesadas o la bimodalidad, se pueden diagnosticar basándose en la detección de desviaciones específicas de la linealidad. Si bien el gráfico Q-Q se puede utilizar para comparar con cualquier familia de distribución (no solo la normal), el gráfico Q-Q normal es un procedimiento de análisis de datos exploratorio relativamente estándar porque el supuesto de normalidad es a menudo un punto de partida para el análisis.

Cálculo

La CDF de distribución normal y su inversa no están disponibles en forma cerrada y el cálculo requiere un uso cuidadoso de procedimientos numéricos. Sin embargo, las funciones están ampliamente disponibles en software para estadísticas y modelos de probabilidad, y en hojas de cálculo. En Microsoft Excel, por ejemplo, la función probit está disponible como norma.s.inv(p). En entornos informáticos donde se encuentran disponibles implementaciones numéricas de la función de error inverso, la función probit se puede obtener como

probit⁡ ⁡ ()p)=2er.− − 1⁡ ⁡ ()2p− − 1).{displaystyle operatorname {probit} (p)={sqrt {2},operatorname {erf} ^{-1}(2p-1). }

Un ejemplo es MATLAB, donde un 'erfinv' La función está disponible. El lenguaje Mathematica implementa 'InverseErf'. Otros entornos implementan directamente la función probit como se muestra en la siguiente sesión en el lenguaje de programación R.

qnorm()0,025)[1] -1.959964pnorm()-1.96)[1] 0,02499790

Los detalles para calcular la función de error inverso se pueden encontrar en [1]. Wichura ofrece un algoritmo rápido para calcular la función probit con 16 decimales; esto se usa en R para generar variables aleatorias para la distribución normal.

Una ecuación diferencial ordinaria para la función probit

Otro medio de cálculo se basa en formar una ecuación diferencial ordinaria no lineal (ODE) para probit, según el método Steinbrecher y Shaw. Abreviar la función probit como w()p){displaystyle w(p)}, el ODE es

dwdp=1f()w){displaystyle {frac {dw}={frac {1} {f}}} {f}}}}

Donde f()w){displaystyle f(w)} es la función de densidad de probabilidad w.

En el caso del Gaussiano:

dwdp=2π π ew22{displaystyle {frac {dw}{dp}={sqrt {2pi}e^{fnMicroc {fnK}} {2}}}} {c}}} {c}}} {c}}}} {c}}}}}} {c}}}}}}} {c}}}}}}}}} {c}}}}}}}}}} {c}}}}}}}}}}}}} {}}}}}} {}}}}}}}} {}}}}}}}}}}}}}}}}}}}}}}}} {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {}}}} {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}

Diferenciando de nuevo:

d2wdp2=w()dwdp)2{displaystyle {frac {f} {fnK}}=wleft({f} {f} {fn}} {fnK}} {f}}}}} {fnfnfnfnK} {f}fnf}fnfnKfnKf}f}}}}}}}}f}f}fnfnfnfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKfnKf}}fnK {dw} {dp}right)} {2}}

con las condiciones centrales (iniciales)

w()1/2)=0,{displaystyle wleft(1/2right)=0,}
w.()1/2)=2π π .{displaystyle w'left(1/2right)={sqrt {2pi}}

Esta ecuación se puede resolver mediante varios métodos, incluido el enfoque clásico de series de potencias. A partir de esto, se pueden desarrollar soluciones de precisión arbitrariamente alta basadas en el enfoque de Steinbrecher para las series para la función de error inversa. La solución en serie de potencias está dada por

w()p)=π π 2. . k=0JUEGO JUEGO dk()2k+1)()2p− − 1)()2k+1){displaystyle w(p)={sqrt {frac {pi {fnK} {fnK} {fnK} {fnK} {fnK}} {cH00}}}}(2p-1)}{(2k+1)}}

donde los coeficientes dk{displaystyle ♪♪ satisfacer la recurrencia no lineal

dk+1=π π 4. . j=0kdjdk− − j()j+1)()2j+1){displaystyle ################################################################################################################################################################################################################################################################ } {4}sum _{j=0}{k}{frac {d_{j}d_{k-j}{(j+1)(2j+1)}

con d0=1{displaystyle D_{0}=1}. En este formulario la relación dk+1/dk→ → 1{displaystyle #### {k+1}/d_{k}rightarrow 1} como k→ → JUEGO JUEGO {displaystyle krightarrow infty}.

Logit

Comparación de la función logit con un probit escalado (es decir, el CDF inverso de la distribución normal), comparando logit⁡ ⁡ ()x){displaystyle operatorname {logit} (x)} vs. CCPR CCPR − − 1()x)/π π 8{displaystyle Phi ^{-1}(x)/{sqrt {frac {pi } {8}}}, que hace las pendientes iguales en el origen.

Estrechamente relacionados con la función probit (y el modelo probit) están la función logit y el modelo logit. La inversa de la función logística está dada por

logit⁡ ⁡ ()p)=log⁡ ⁡ ()p1− − p).{displaystyle operatorname {logit} (p)=log left({frac {p}{1-p}right).}

De manera análoga al modelo probit, podemos suponer que dicha cantidad está relacionada linealmente con un conjunto de predictores, lo que da como resultado el modelo logit, la base en particular del modelo de regresión logística, la forma más frecuente de análisis de regresión para respuestas categóricas. datos. En la práctica estadística actual, los modelos de regresión probit y logit a menudo se manejan como casos del modelo lineal generalizado.

Contenido relacionado

Conjunto vacío

En matemáticas, el conjunto vacío es el conjunto único que no tiene elementos; su tamaño o cardinalidad es cero. Algunas teorías axiomáticas de...

Historia de la lógica

La historia de la lógica se ocupa del estudio del desarrollo de la ciencia de la inferencia válida tal como se encuentran en el Organon, encontraron una...

Ley de los grandes números

En la teoría de la probabilidad, la ley de los grandes números es un teorema que describe el resultado de realizar el mismo experimento un gran número de...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save