Causalidad de Granger

Compartir Imprimir Citar

La prueba de causalidad de Granger es una prueba de hipótesis estadística para determinar si una serie de tiempo es útil para pronosticar otra, propuesta por primera vez en 1969. Por lo general, las regresiones reflejan "meras" correlaciones, pero Clive Granger argumentó que la causalidad en economía podría probarse midiendo la capacidad de predecir los valores futuros de una serie de tiempo usando valores previos de otra serie de tiempo. Dado que la cuestión de la "causalidad verdadera" es profundamente filosófica, y debido a la falacia post hoc ergo propter hoc de suponer que una cosa que precede a otra puede usarse como prueba de causalidad, los econometristas afirman que la prueba de Granger solo encuentra "causalidad predictiva".. Usar el término "causalidad" solo es un nombre inapropiado,o, como afirmó el propio Granger más tarde en 1977, "relacionado temporalmente". En lugar de probar si X causa Y, la causalidad de Granger prueba si X pronostica Y.

Se dice que una serie de tiempo X causa Granger Y si se puede demostrar, generalmente a través de una serie de pruebas t y pruebas F sobre valores rezagados de X (y con valores rezagados de Y también incluidos), que esos valores X proporcionan información estadísticamente significativa sobre los valores futuros de Y.

Granger también enfatizó que algunos estudios que utilizaron pruebas de "causalidad de Granger" en áreas fuera de la economía llegaron a conclusiones "ridículas". "Por supuesto, aparecieron muchos papeles ridículos", dijo en su conferencia Nobel. Sin embargo, sigue siendo un método popular para el análisis de causalidad en series de tiempo debido a su simplicidad computacional. La definición original de causalidad de Granger no tiene en cuenta los efectos de confusión latentes y no captura las relaciones causales instantáneas y no lineales, aunque se han propuesto varias extensiones para abordar estos problemas.

Intuición

Decimos que una variable X que evoluciona con el tiempo Granger causa otra variable Y en evolución si las predicciones del valor de Y basadas en sus propios valores pasados y en los valores pasados de X son mejores que las predicciones de Y basadas solo en los propios valores de Y. valores pasados.

Principios subyacentes

Granger definió la relación de causalidad basándose en dos principios:

La causa sucede antes de su efecto.
La causa tiene información única sobre los valores futuros de su efecto.

Dadas estas dos suposiciones sobre la causalidad, Granger propuso probar la siguiente hipótesis para la identificación de un efecto causal de $X$ sobre $Y$ : ${displaystyle mathbb {P} [Y(t+1)in Amid {mathcal {I}}(t)]neq mathbb {P} [Y(t+1)in Amid {mathcal {I}}_{-X}(t)],}$

donde $matemáticas {P}$ se refiere a la probabilidad, $UN$ es un conjunto arbitrario no vacío, y ${mathcal {I}}(t)$ y ${mathcal {I}}_{-X}(t)$ respectivamente denotan la información disponible a partir del tiempo $t$ en todo el universo, y en el universo modificado en el que $X$ se excluye. Si se acepta la hipótesis anterior, decimos que $X$ las causas de Granger $Y$ .

Método

Si una serie de tiempo es un proceso estacionario, la prueba se realiza utilizando los valores de nivel de dos (o más) variables. Si las variables no son estacionarias, entonces la prueba se realiza utilizando primeras (o mayores) diferencias. El número de rezagos a incluir generalmente se elige utilizando un criterio de información, como el criterio de información de Akaike o el criterio de información de Schwarz. Cualquier valor rezagado particular de una de las variables se retiene en la regresión si (1) es significativo de acuerdo con una prueba t, y (2) él y los otros valores rezagados de la variable agregan conjuntamente poder explicativo al modelo de acuerdo con una prueba F. Entonces, la hipótesis nula de que no hay causalidad de Granger no se rechaza si y solo si no se han retenido valores rezagados de una variable explicativa en la regresión.

En la práctica, se puede encontrar que ninguna variable Granger causa la otra, o que cada una de las dos variables Granger causa la otra.

Enunciado matematico

Sean y y x series temporales estacionarias. Para probar la hipótesis nula de que x no causa Granger y, primero se encuentran los valores rezagados adecuados de y para incluirlos en una autorregresión univariada de y: ${displaystyle y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+cdots +a_{m}y_{tm}+{text {error}}_{t}.}$

A continuación, la autorregresión se aumenta al incluir valores rezagados de x: ${displaystyle y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+cdots +a_{m}y_{tm}+b_{p }x_{tp}+cdots +b_{q}x_{tq}+{text{error}}_{t}.}$

En esta regresión se retienen todos los valores rezagados de x que son individualmente significativos de acuerdo con sus estadísticos t, siempre que en conjunto agreguen poder explicativo a la regresión de acuerdo con una prueba F (cuya hipótesis nula es que no hay poder explicativo agregado conjuntamente por x ' s). En la notación de la regresión aumentada anterior, p es el rezago más corto y q es el más largo, para el cual el valor rezagado de x es significativo.

La hipótesis nula de que x no causa Granger y se acepta si y solo si no se retienen valores rezagados de x en la regresión.

Analisis multivariable

El análisis de causalidad multivariante de Granger generalmente se realiza ajustando un modelo autorregresivo vectorial (VAR) a la serie temporal. En particular, sea $X(t)inmathbb {R} ^{dtimes 1}$ for $t=1,ldots,T$ una $d$ serie de tiempo multivariante -dimensional. La causalidad de Granger se realiza ajustando un modelo VAR con $L$ retrasos de tiempo de la siguiente manera: ${displaystyle X(t)=sum_{tau =1}^{L}A_{tau }X(t-tau)+varepsilon (t),}$

donde $varepsilon (t)$ es un vector aleatorio gaussiano blanco y ${displaystyle A_{tau}}$ es una matriz para cada $tau$ . Una serie de tiempo $X_{yo}$ se llama causa de Granger de otra serie de tiempo $X_{j}$ , si al menos uno de los elementos $A_{tau}(j,i)$ es $tau =1,ldots,L$ significativamente mayor que cero (en valor absoluto).

Prueba no paramétrica

Los métodos lineales anteriores son apropiados para probar la causalidad de Granger en la media. Sin embargo, no son capaces de detectar la causalidad de Granger en momentos superiores, por ejemplo, en la varianza. Las pruebas no paramétricas de causalidad de Granger están diseñadas para abordar este problema. La definición de causalidad de Granger en estas pruebas es general y no implica ningún supuesto de modelado, como un modelo autorregresivo lineal. Las pruebas no paramétricas de causalidad de Granger se pueden utilizar como herramientas de diagnóstico para construir mejores modelos paramétricos que incluyan momentos de mayor orden y/o no linealidad.

Limitaciones

Como su nombre lo indica, la causalidad de Granger no es necesariamente una causalidad verdadera. De hecho, las pruebas de causalidad de Granger cumplen solo con la definición humeana de causalidad que identifica las relaciones causa-efecto con conjunciones constantes. Si tanto X como Yson impulsados por un tercer proceso común con diferentes retrasos, uno podría fallar en rechazar la hipótesis alternativa de la causalidad de Granger. Sin embargo, la manipulación de una de las variables no cambiaría la otra. De hecho, las pruebas de causalidad de Granger están diseñadas para manejar pares de variables y pueden producir resultados engañosos cuando la verdadera relación involucra tres o más variables. Habiendo dicho esto, se ha argumentado que dada una visión probabilística de la causalidad, la causalidad de Granger puede considerarse causalidad verdadera en ese sentido, especialmente cuando se tiene en cuenta la noción de "detección" de la causalidad probabilística de Reichenbach. Otras posibles fuentes de resultados de prueba erróneos son: (1) muestreo no lo suficientemente frecuente o demasiado frecuente, (2) relación causal no lineal, (3) no estacionariedad y no linealidad de series de tiempo y (4) existencia de expectativas racionales. Se puede aplicar una prueba similar que involucre más variables con la autorregresión vectorial. Hace pocose ha proporcionado un estudio matemático fundamental del mecanismo subyacente al método de Granger. Al hacer uso exclusivamente de herramientas matemáticas (transformación de Fourier y cálculo diferencial), se ha encontrado que ni siquiera el requisito más básico que subyace a cualquier posible definición de causalidad se cumple con la prueba de causalidad de Granger: cualquier definición de causalidad debe referirse a la predicción de el futuro del pasado; en cambio, al invertir la serie temporal, se puede demostrar que Granger también permite "predecir" el pasado a partir del futuro.

Extensiones

Se ha desarrollado un método para la causalidad de Granger que no es sensible a las desviaciones del supuesto de que el término de error se distribuye normalmente. Este método es especialmente útil en economía financiera, ya que muchas variables financieras no se distribuyen normalmente. Recientemente, se han sugerido pruebas de causalidad asimétrica en la literatura para separar el impacto causal de los cambios positivos de los negativos. También está disponible una extensión de las pruebas de (no) causalidad de Granger a los datos de panel. Una prueba de causalidad de Granger modificada basada en el tipo GARCH (heterocedasticidad condicional autorregresiva generalizada) de modelos de series temporales de valores enteros está disponible en muchas áreas.

En neurociencia

Una creencia de larga data sobre la función neuronal sostenía que diferentes áreas del cerebro eran tareas específicas; que la conectividad estructural local a un área determinada dictaba de alguna manera la función de esa pieza. Al recopilar el trabajo que se ha realizado durante muchos años, ha habido un movimiento hacia un enfoque diferente, centrado en la red, para describir el flujo de información en el cerebro. La explicación de la función está comenzando a incluir el concepto de redes que existen en diferentes niveles y en diferentes lugares del cerebro.El comportamiento de estas redes se puede describir mediante procesos no deterministas que evolucionan a lo largo del tiempo. Es decir, dado el mismo estímulo de entrada, no obtendrá la misma salida de la red. La dinámica de estas redes se rige por probabilidades, por lo que las tratamos como procesos estocásticos (aleatorios) para que podamos capturar este tipo de dinámicas entre diferentes áreas del cerebro.

En el pasado se han explorado diferentes métodos para obtener alguna medida del flujo de información a partir de las actividades de activación de una neurona y el conjunto que la rodea, pero están limitados en el tipo de conclusiones que se pueden extraer y brindan poca información sobre el flujo direccional de la información., el tamaño del efecto y cómo puede cambiar con el tiempo. Recientemente, la causalidad de Granger se ha aplicado para abordar algunos de estos problemas con gran éxito. En pocas palabras, uno examina cómo predecir mejor el futuro de una neurona: usando el conjunto completo o el conjunto completo excepto una determinada neurona objetivo. Si la predicción empeora al excluir la neurona objetivo, entonces decimos que tiene una relación "g-causal" con la neurona actual.

Extensiones a modelos de procesos puntuales

Los métodos de causalidad de Granger anteriores solo podían operar en datos de valor continuo, por lo que el análisis de las grabaciones de trenes de picos neuronales implicaba transformaciones que finalmente alteraron las propiedades estocásticas de los datos, alterando indirectamente la validez de las conclusiones que se podían extraer de ellos. En 2011, sin embargo, se propuso un nuevo marco de causalidad de Granger de propósito general que podría operar directamente en cualquier modalidad, incluidos los trenes de picos neuronales.

Los datos del tren de picos neuronales se pueden modelar como un proceso puntual. Un proceso puntual temporal es una serie de tiempo estocástica de eventos binarios que ocurren en tiempo continuo. Solo puede tomar dos valores en cada punto en el tiempo, lo que indica si un evento realmente ocurrió o no. Este tipo de representación de información con valores binarios se adapta a la actividad de las poblaciones neuronales porque el potencial de acción de una sola neurona tiene una forma de onda típica. De esta forma, lo que lleva la información real que sale de una neurona es la ocurrencia de un “pico”, así como el tiempo entre picos sucesivos. Usando este enfoque, uno podría abstraer el flujo de información en una red neuronal para que sea simplemente los tiempos de pico para cada neurona a través de un período de observación. Un proceso puntual puede representarse ya sea por la sincronización de los picos mismos,

Uno de los tipos más simples de modelos de picos neuronales es el proceso de Poisson. Sin embargo, esto está limitado porque no tiene memoria. No tiene en cuenta ningún historial de picos al calcular la probabilidad actual de disparo. Las neuronas, sin embargo, exhiben una dependencia fundamental de la historia (biofísica) a través de sus períodos refractarios relativos y absolutos. Para abordar esto, se utiliza una función de intensidad condicional para representar la probabilidad de que una neurona se dispare, condicionada por su propia historia. La función de intensidad condicional expresa la probabilidad de disparo instantáneo y define implícitamente un modelo de probabilidad completo para el proceso puntual. Define una probabilidad por unidad de tiempo. Entonces, si esta unidad de tiempo se toma lo suficientemente pequeña como para garantizar que solo pueda ocurrir un pico en esa ventana de tiempo.