Significados de probabilidad
La palabra probabilidad se ha utilizado de diversas formas desde que se aplicó por primera vez al estudio matemático de los juegos de azar. ¿La... (leer más)
Las aproximaciones de Laplace anidadas integradas (INLA) es un método para la inferencia bayesiana aproximada basada en el método de Laplace. Está diseñado para una clase de modelos llamados modelos gaussianos latentes (LGM), para los cuales puede ser una alternativa rápida y precisa a los métodos de Monte Carlo de la cadena de Markov para calcular las distribuciones marginales posteriores. Debido a su velocidad relativa, incluso con grandes conjuntos de datos para ciertos problemas y modelos, INLA ha sido un método de inferencia popular en estadística aplicada, en particular estadística espacial, ecología y epidemiología. También es posible combinar INLA con una solución de método de elementos finitos de una ecuación diferencial parcial estocástica para estudiar, por ejemplo, procesos puntuales espaciales y modelos de distribución de especies.El método INLA se implementa en el paquete R-INLA R.
Denotemos la variable de respuesta (es decir, las observaciones) que pertenece a una familia exponencial, con la media (de ) vinculada a un predictor lineal a través de una función de enlace apropiada. El predictor lineal puede adoptar la forma de un modelo aditivo (bayesiano). Todos los efectos latentes (el predictor lineal, la intersección, los coeficientes de posibles covariables, etc.) se denotan colectivamente mediante el vector . Los hiperparámetros del modelo se denotan por . Según estadística bayesiana, y son variables aleatorias con distribuciones previas.
Se supone que las observaciones son condicionalmente independientes dados y :
donde es el conjunto de índices para elementos observados de (algunos elementos pueden no ser observados, y para estos INLA calcula una distribución predictiva posterior). Tenga en cuenta que el predictor lineal es parte de .
Para que el modelo sea un modelo gaussiano latente, se supone que es un campo aleatorio gaussiano de Markov (GMRF) (es decir, un gaussiano multivariado con propiedades de independencia condicional adicionales) con densidad de probabilidad
donde es una matriz de precisión dispersa dependiente y es su determinante. La matriz de precisión es escasa debido a la suposición GMRF. No es necesario que la distribución previa de los hiperparámetros sea gaussiana. Sin embargo, se supone que el número de hiperparámetros, , es pequeño (por ejemplo, menos de 15).
En la inferencia bayesiana, uno quiere resolver la distribución posterior de las variables latentes y . Aplicando el teorema de Bayes
la distribución posterior conjunta de y está dada por
Obtener el posterior exacto es generalmente un problema muy difícil. En INLA, el objetivo principal es aproximar los márgenes posteriores
donde _
Una idea clave de INLA es construir aproximaciones anidadas dadas por
donde es una densidad posterior aproximada. La aproximación a la densidad marginal se obtiene de forma anidada aproximando primero y , y luego integrando numéricamente como
donde la suma es sobre los valores de , con pesos de integración dados por . La aproximación de se calcula integrando numéricamente a partir de .
Para obtener la distribución aproximada , se puede usar la relación
como punto de partida. Entonces se obtiene un valor específico de los hiperparámetros con la aproximación de Laplace
donde es la aproximación gaussiana cuyo modo en un dado es . La moda se puede encontrar numéricamente, por ejemplo, con el método de Newton-Raphson.
El truco de la aproximación de Laplace anterior es el hecho de que la aproximación gaussiana se aplica en el condicional completo de en el denominador, ya que suele estar cerca de una gaussiana debido a la propiedad GMRF de . La aplicación de la aproximación aquí mejora la precisión del método, ya que la parte posterior en sí misma no necesita estar cerca de una gaussiana, por lo que la aproximación gaussiana no se aplica directamente en . La segunda propiedad importante de un GMRF, la escasez de la matriz de precisión , se requiere para el cálculo eficiente de para cada valor .
Obtener la distribución aproximada es más complicado, y el método INLA ofrece tres opciones para esto: aproximación gaussiana, aproximación de Laplace o aproximación de Laplace simplificada. Para obtener la integración numérica , también están disponibles tres opciones: búsqueda en cuadrícula, diseño compuesto central o bayesiano empírico.
La palabra probabilidad se ha utilizado de diversas formas desde que se aplicó por primera vez al estudio matemático de los juegos de azar. ¿La... (leer más)
Los métodos bayesianos variacionales son una familia de técnicas para aproximar integrales intratables que surgen en la inferencia bayesiana y el... (leer más)
(leer más)