Modelo de efectos fijos
En estadística, un modelo de efectos fijos es un modelo estadístico en el que los parámetros del modelo son cantidades fijas o no aleatorias. Esto contrasta con los modelos de efectos aleatorios y los modelos mixtos en los que todos o algunos de los parámetros del modelo son variables aleatorias. En muchas aplicaciones, incluidas la econometría y la bioestadística, un modelo de efectos fijos se refiere a un modelo de regresión en el que las medias de los grupos son fijas (no aleatorias), a diferencia de un modelo de efectos aleatorios en el que las medias de los grupos son una muestra aleatoria de una población. En general, los datos se pueden agrupar según varios factores observados. Las medias de los grupos se pueden modelar como efectos fijos o aleatorios para cada agrupación. En un modelo de efectos fijos, cada media de grupo es una cantidad fija específica del grupo.
En los datos de panel, en los que existen observaciones longitudinales para el mismo sujeto, los efectos fijos representan las medias específicas del sujeto. En el análisis de datos de panel, el término estimador de efectos fijos (también conocido como estimador intra) se utiliza para referirse a un estimador de los coeficientes en el modelo de regresión, incluidos esos efectos fijos (una intersección invariante en el tiempo para cada sujeto).
Descripción cualitativa
Estos modelos ayudan a controlar el sesgo de variable omitida debido a la heterogeneidad no observada cuando esta heterogeneidad es constante a lo largo del tiempo. Esta heterogeneidad se puede eliminar de los datos mediante la diferenciación, por ejemplo, restando el promedio a nivel de grupo a lo largo del tiempo o tomando una primera diferencia que eliminará cualquier componente invariante en el tiempo del modelo.
Existen dos supuestos comunes sobre el efecto específico individual: el supuesto de efectos aleatorios y el supuesto de efectos fijos. El supuesto de efectos aleatorios es que los efectos específicos individuales no están correlacionados con las variables independientes. El supuesto de efectos fijos es que los efectos específicos individuales están correlacionados con las variables independientes. Si el supuesto de efectos aleatorios se cumple, el estimador de efectos aleatorios es más eficiente que el estimador de efectos fijos. Sin embargo, si este supuesto no se cumple, el estimador de efectos aleatorios no es consistente. La prueba de Durbin-Wu-Hausman se utiliza a menudo para discriminar entre los modelos de efectos fijos y aleatorios.
Modelo y hipótesis formales
Considere el modelo lineal de efectos no observados para observaciones y observaciones períodos de tiempo:
- para y
Dónde:
- es la variable dependiente observada para el individuo a la vez .
- es el tiempo-variante (el número de variables independientes) vector de regresión.
- es matriz de parámetros.
- es el efecto individual invariable invariante de tiempo. Por ejemplo, la capacidad innata para las personas o factores históricos e institucionales para los países.
- es el término de error.
Diferente , no se puede observar directamente.
A diferencia del modelo de efectos aleatorios donde el es independiente de para todos , el modelo de efectos fijos (FE) permite estar correlacionado con la matriz de regresión . Exogeneidad estricta con respecto al término de error idiosincrático sigue siendo necesario.
Estimación estadística
Estimador de efectos fijos
Desde no es observable, no puede ser controlado directamente. El modelo FE elimina de significar las variables usando dentro transformación:
Donde , , y .
Desde es constante, y por lo tanto el efecto es eliminado. El estimador FE se obtiene entonces por una regresión OLS on .
Existen al menos tres alternativas a la transformación interior con variaciones.
Una es añadir una variable mutilada para cada individuo (omitiendo al primer individuo debido a la multicollinealidad). Esto es numérico, pero no computacionalmente, equivalente al modelo de efecto fijo y sólo funciona si la suma del número de series y el número de parámetros globales es menor que el número de observaciones. El enfoque variable dummy es particularmente exigente con respecto al uso de la memoria de la computadora y no se recomienda para problemas más grandes que la RAM disponible, y la compilación del programa aplicado, puede acomodar.
La segunda alternativa es utilizar el método de reiteraciones consecutivas para las estimaciones locales y globales. Este método es muy adecuado para sistemas con poca memoria, en los que es mucho más eficiente computacionalmente que el método de variable ficticia.
El tercer enfoque es una estimación anidada, en la que la estimación local de series individuales se programa como parte de la definición del modelo. Este enfoque es el más eficiente en términos computacionales y de memoria, pero requiere habilidades de programación competentes y acceso al código de programación del modelo; sin embargo, se puede programar incluso en SAS.
Finalmente, cada una de las alternativas anteriores se puede mejorar si la estimación específica de la serie es lineal (dentro de un modelo no lineal), en cuyo caso la solución lineal directa para series individuales se puede programar como parte de la definición del modelo no lineal.
Estimador de primera diferencia
Una alternativa a la transformación interior es la primera diferencia transformación, que produce un estimador diferente. Para :
El estimador FD se obtiene entonces por una regresión OLS on .
Cuando , la primera diferencia y los estimadores de efectos fijos son numéricamente equivalentes. Para No lo son. Si los términos del error son homoskedastic sin correlación serial, el estimador de efectos fijos es más eficiente que el primer estimador de diferencia. Si sigue un paseo aleatorio, sin embargo, el primer estimador de diferencia es más eficiente.
Igualdad de efectos fijos y estimaciones de primera diferencia cuando T=2
Para el caso especial de dos períodos), el estimador de efectos fijos (FE) y la primera diferencia (FD) es numéricamente equivalente. Esto se debe a que el estimador FE efectivamente "dobla el conjunto de datos" utilizado en el estimador FD. Para ver esto, establece que el estimador de efectos fijos es:
Desde cada uno puede ser re-escrito como Reescribiremos la línea como:
Método de Chamberlain
El método de Gary Chamberlain, una generalización del estimador interno, reemplaza con su proyección lineal sobre las variables explicativas. Escribiendo la proyección lineal como:
Esto da como resultado la siguiente ecuación:
que puede estimarse mediante la estimación de la distancia mínima.
Método Hausman-Taylor
Necesidad de tener más de un regresión variable de tiempo () y el tiempo invariante regresión (regresor)) y al menos uno y uno que no están relacionados con .
Partición y variables tales como Donde y no están relacionados con . Necesidad .
Estimación via OLS on utilizando y como instrumentos produce una estimación consistente.
Generalización con incertidumbre de insumos
Cuando hay incertidumbre de entrada para datos, , entonces el el valor, en lugar de la suma de los residuos cuadrados, debe minimizarse. Esto se puede lograr directamente de las reglas de sustitución:
- ,
entonces los valores y desviaciones estándar para y se puede determinar mediante el análisis clásico de mínimos cuadrados y la matriz de varianza-covariancia.
Uso para probar la consistencia
Los estimadores de efectos aleatorios pueden ser inconsistentes en ocasiones en el límite de series de tiempo largas, si los efectos aleatorios están mal especificados (es decir, el modelo elegido para los efectos aleatorios es incorrecto). Sin embargo, el modelo de efectos fijos puede ser consistente en algunas situaciones. Por ejemplo, si la serie de tiempo que se está modelando no es estacionaria, los modelos de efectos aleatorios que asumen estacionariedad pueden no ser consistentes en el límite de series largas. Un ejemplo de esto es si la serie de tiempo tiene una tendencia ascendente. Entonces, a medida que la serie se hace más larga, el modelo revisa las estimaciones de la media de períodos anteriores hacia arriba, dando predicciones cada vez más sesgadas de los coeficientes. Sin embargo, un modelo con efectos de tiempo fijos no agrupa información a lo largo del tiempo y, como resultado, las estimaciones anteriores no se verán afectadas.
En situaciones como estas donde se sabe que el modelo de efectos fijos es consistente, la prueba Durbin-Wu-Hausman se puede utilizar para probar si el modelo de efectos aleatorios elegido es consistente. Si es cierto, ambos y son consistentes, pero sólo es eficiente. Si es verdad la consistencia de no se puede garantizar.
Véase también
- Modelo de efectos aleatorios
- Modelo mixto
- Modelo dinámico de efectos no observados
- Efecto fijo Modelo Poisson
Notas
- ^ Greene, W.H., 2011. Econometric Analysis, 7a edición, Prentice Hall
- ^ Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Análisis de datos longitudinales (2a edición). Oxford University Press. pp. 169–171. ISBN 0-19-852484-6.
- ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Análisis de longitud aplicado. Hoboken: John Wiley ' Sons. pp. 326-328. ISBN 0-471-21487-6.
- ^ Laird, Nan M.; Ware, James H. (1982). "Random-Effects Models for Longitudinal Data". Biometrics. 38 (4): 963–974. doi:10.2307/2529876. JSTOR 2529876.
- ^ Gardiner, Joseph C.; Luo, Zhehui; Roman, Lee Anne (2009). "Efectos fijos, efectos aleatorios y GEE: ¿Cuáles son las diferencias?". Estadísticas en Medicina. 28 (2): 221–239. doi:10.1002/sim.3478. PMID 19012297. S2CID 16277040.
- ^ a b Gomes, Dylan G.E. (20 de enero de 2022). "¿Debería usar efectos fijos o efectos aleatorios cuando tengo menos de cinco niveles de un factor de agrupación en un modelo de efectos mixtos?". PeerJ. 10: e12794. doi:10.7717/peerj.12794. PMC 8784019. PMID 35116198.
- ^ Ramsey, F., Schafer, D., 2002. The Statistical Sleuth: A Course in Methods of Data Analysis, 2a edición. Duxbury Press
- ^ Cameron, A. Colin; Trivedi, Pravin K. (2005). Microeconometría: Métodos y Aplicaciones. Cambridge University Press. pp. 717–19. ISBN 9780521848053.
- ^ Nerlove, Marc (2005). Ensayos en Panel Data Econometrics. Cambridge University Press. pp. 36–39. ISBN 9780521022460.
- ^ García, Oscar. (1983). "Un modelo de ecuación diferencial estocástica para el crecimiento de altura de los stands forestales". Biometrics. 39 (4): 1059-1072. doi:10.2307/2531339. JSTOR 2531339.
- ^ Tait, David; Cieszewski, Chris J.; Bella, Imre E. (1986). "La dinámica del soporte del pino de la hoguera". Can. J. For. Res. 18 (10): 1255–1260. doi:10.1139/x88-193.
- ^ Strub, Mike; Cieszewski, Chris J. (2006). "Propiedades de invariancia de base de dos técnicas para estimar los parámetros de los modelos de índice de sitio". Forest Science. 52 (2): 182-186.
- ^ Strub, Mike; Cieszewski, Chris J. (2003). "Fitting global site index parameters when plot or tree site index is treated as a local nuisance parameter In: Burkhart HA, editor. Proceedings of the Symposium on Statistics and Information Technology in Forestry; 2002 September 8–12; Blacksburg, Virginia: Virginia Polytechnic Institute and State University": 97–107.
{{cite journal}}: Cite journal requires|journal=(Ayuda) - ^ Cieszewski, Chris J.; Harrison, Mike; Martin, Stacey W. (2000). "Métodos prácticos para estimar parámetros no imparciales en los modelos de crecimiento y rendimiento de autoreferenciación" (PDF). PMRC Technical Report. 2000 (7): 12.
- ^ Schnute, Jon; McKinnell, Skip (1984). "Un enfoque biológicamente significativo para el análisis superficial de la respuesta". Can. J. Fish. Aquat. Sci. 41 (6): 936–953. doi:10.1139/f84-108.
- ^ Wooldridge, Jeffrey M. (2001). Econometric Analysis of Cross Section and Panel DataMIT Press. pp. 279–291. ISBN 978-0-262-23219-7.
- ^ Chamberlain, Gary (1984). Capítulo 22 Datos del Grupo. Manual de Econometría. Vol. 2. pp. 1247–1318. doi:10.1016/S1573-4412(84)02014-6. ISBN 9780444861863. ISSN 1573-4412.
- ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M.; Pueyo, Laurent; Debes, John H.; Poteet, Charles A.; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A.; Hines, Dean C.; Schneider, Glenn; Soummer, Rémi (2018). "Una década de MWC 758 Disk Images: ¿Dónde están los Planetas Conduciendo-Arm?". The Astrophysical Journal Letters. 857 (1): L9. arXiv:1803.06776. Bibcode:2018 ApJ...857L...9R. doi:10.3847/2041-8213/aab7f5. S2CID 59427417.
Referencias
- Christensen, Ronald (2002). Plane Respuestas a preguntas complejas: Teoría de modelos lineales (Tercera edición). Nueva York: Springer. ISBN 0-387-95361-2.
- Gujarati, Damodar N.; Porter, Dawn C. (2009). "Panel Data Regression Models". Econométrico básico (Quinta edición internacional). Boston: McGraw-Hill. pp. 591-616. ISBN 978-007-127625-2.
- Hsiao, Cheng (2003). "Modelos de efectos fijos". Análisis de los datos del Grupo (2a edición). New York: Cambridge University Press. pp. 95–103. ISBN 0-521-52271-4.
- Wooldridge, Jeffrey M. (2013). "Estimación de efectos fijos". Econometría introductoria: un enfoque moderno (Quinta edición internacional). Mason, OH: South-Western. pp. 466–474. ISBN 978-1-111-53439-4.
Enlaces externos
- Modelos de efectos fijos y al azar
- Ejemplos de todos los modelos ANOVA y ANCOVA con hasta tres factores de tratamiento, incluyendo bloqueo aleatorizado, trama dividida, medidas repetidas y cuadrados latinos, y su análisis en R