Errores estándar consistentes con la heterocedasticidad
En el modelado de la regresión y las series temporales, las formas básicas de los modelos hacen uso de la suposición de que los errores o perturbaciones ui tienen la misma varianza en todos los puntos de observación. Cuando este no es el caso, se dice que los errores son heteroskedastic, o tienen heteroskedasticidad, y este comportamiento se reflejará en los residuos. estimado en un modelo ajustado. Se utilizan errores estándar consistentes en heteroskedasticidad para permitir el ajuste de un modelo que contiene residuales heteroskedastic. El primer enfoque de este tipo fue propuesto por Huber (1967), y se han producido nuevos procedimientos mejorados desde entonces para datos transversales, datos de series temporales y estimación GARCH.
Los errores estándar consistentes con la heterocedasticidad que difieren de los errores estándar clásicos pueden indicar una especificación errónea del modelo. Sustituir los errores estándar consistentes con la heterocedasticidad no resuelve esta especificación errónea, lo que puede generar sesgo en los coeficientes. En la mayoría de los casos, el problema debería detectarse y solucionarse. Otros tipos de ajustes de errores estándar, como los errores estándar agrupados o los errores estándar HAC, pueden considerarse extensiones de los errores estándar HC.Historia
Los errores estándar consistentes en la heterocedasticidad son introducidos por Friedhelm Eicker y popularizados en econometría por Halbert White.
Problema
Considere el modelo de regresión lineal para el escalar .
Donde es un k x 1 columna vector de variables explicativas (features), es un k × 1 columna vector de parámetros a estimar, y es el error residual.
El estimador de mínimos cuadrados ordinarios (OLS) es
Donde es un vector de observaciones , y denota la matriz de apilado valores observados en los datos.
Si los errores de muestra tienen igual variabilidad y son incorrelacionados, luego la estimación de menos cuadras es BLUE (mejor estimador lineal imparcial), y su diferencia se calcula con
Donde son los residuos de regresión.
Cuando los términos de error no tienen varianza constante (es decir, el supuesto de no es cierto), el estimador OLS pierde sus propiedades deseables. Ahora no se puede simplificar la fórmula de la varianza:
Donde
Si bien el estimador de puntos OLS sigue siendo imparcial, no es "mejor" en el sentido de tener un error cuadrado mínimo medio, y el estimador de varianza OLS no proporciona una estimación coherente de la diferencia de las estimaciones de la OLS.
Para cualquier modelo no lineal (por ejemplo, los modelos logit y probit), sin embargo, la heteroscedasticidad tiene consecuencias más graves: las estimaciones de máxima probabilidad de los parámetros estarán sesgadas (en una dirección desconocida), así como inconsistentes (a menos que la función de probabilidad se modifique correctamente en cuenta la forma precisa de la forma heterocada). Como señaló Greene, "simplemente calcular una matriz de covarianza robusta para un estimador inconsistente no le da redención".
Solución
Si los errores de regresión son independientes, pero tienen diferencias distintas Entonces que se puede calcular con . Esto proporciona el estimador de White (1980), a menudo conocido como HCE (estimador heteroskedasticity-consistent):
, donde se encuentra denota la matriz de apilado valores de los datos. El estimador puede derivarse en términos del método generalizado de los momentos (GMM).
También a menudo discutido en la literatura (incluyendo el papel blanco) es la matriz de covariancia de la - distribución de límites consistente:
dónde
Por lo tanto,
La determinación precisa de qué matriz de covarianza es motivo de preocupación depende del contexto.
MacKinnon y White (1985) propusieron estimadores alternativos que corrigen las varianzas desiguales de los residuos de regresión debido a diferentes apalancamientos. A diferencia del estimador asintótico de White, sus estimadores son insesgados cuando los datos son homocedásticos.De las cuatro opciones disponibles, a menudo denominadas HC0-HC3, la especificación HC3 parece ser la más eficaz, ya que las pruebas basadas en el estimador HC3 presentan mayor potencia y mayor proximidad al tamaño objetivo, especialmente en muestras pequeñas. Cuanto mayor sea la muestra, menor será la diferencia entre los diferentes estimadores.Una alternativa al modelado explícito de la heterocedasticidad es utilizar un método de remuestreo como el bootstrap salvaje. Dado que el bootstrap estudentizado, que estandariza la estadística remuestreada por su error estándar, produce un refinamiento asintótico, los errores estándar robustos a la heterocedasticidad siguen siendo útiles.En lugar de tener en cuenta los errores heterocedásticos, la mayoría de los modelos lineales pueden transformarse para incluir términos de error homocedásticos (a menos que el término de error sea heterocedástico por construcción, por ejemplo, en un modelo de probabilidad lineal). Una forma de hacerlo es mediante mínimos cuadrados ponderados, que también presenta propiedades de eficiencia mejoradas.Véase también
- Método Delta
- Plazas mínimas generalizadas
- Ecuaciones de estimación generalizadas
- Montaje de mínimos cuadrados, una formulación alternativa
- Prueba blanca: una prueba para si la heterosquedasticidad está presente.
- Estimador de Newey-West
- Estimación de la probabilidad de cuasi máximo
Software
- EViews: EViews versión 8 ofrece tres métodos diferentes para los mínimos cuadrados robustos: M-estimación (Huber, 1973), S-estimación (Rousseeuw y Yohai, 1984), y MM-estimación (Yohai 1987).
- Julia:
CovarianceMatrices
paquete ofrece varios métodos para matrices de varianza robusta heteroskedastic. - MATLAB: Vea el
hac
función en la caja de herramientas Econometrics. - Python: El paquete Statsmodel ofrece varias estimaciones de errores estándar robustas, ver Estadísticasmodels.regression.linear_model.RegressionResultados para más descripciones
- R: el
vcovHC()
comando from the sandwich paquete. - RATS: terroristas robustos opción está disponible en muchos de los comandos de regresión y optimización (linreg, nlls, etc.).
- Stata:
robust
opción aplicable en muchos procedimientos basados en la pseudo-preferencia. - Gretl: la opción
--robust
a varios comandos de estimación (comools
) en el contexto de un conjunto de datos transversal produce errores estándar robustos.
Referencias
- ^ Kleiber, C.; Zeileis, A. (2006). "Econometría aplicada con R" (PDF). Conferencia UseR-2006. Archivado desde el original (PDF) el 22 de abril de 2007.
- ^ Eicker, Friedhelm (1967). "Teoremas para la regresión con errores inigualables y dependientes". Proceedings of the fifth Berkeley Symposium on Mathematical Statistics and Probability. Vol. 5. pp. 59–82. MR 0214223. Zbl 0217.51201.
- ^ Huber, Peter J. (1967). "El comportamiento de las estimaciones de probabilidad máxima bajo condiciones no estándar". Proceedings of the fifth Berkeley Symposium on Mathematical Statistics and Probability. Vol. 5. pp. 221 –233. MR 0216620. Zbl 0212.21504.
- ^ White, Halbert (1980). "A Heteroskedasticity-Consistent Covariance Matrix Estimator y una prueba directa para la heteroskedasticidad". Econometrica. 48 4): 817–838. CiteSeerX 10.1.1.11.7646. doi:10.2307/1912934. JSTOR 1912934. MR 0575027.
- ^ King, Gary; Roberts, Margaret E. (2015). "How Robust Standard Errores exponen problemas metodológicos que no fijan, y qué hacer al respecto". Análisis político. 23 2): 159 –179. doi:10.1093/pan/mpu015. ISSN 1047-1987.
- ^ Eicker, F. (1963). "La Normalidad y la Consistencia Sintomáticas de los Estimadores de las Plazas Menores para Familias de Regresos Lineales". Los Anales de las Estadísticas Matemáticas. 34 2): 447 –456. doi:10.1214/aoms/1177704156.
- ^ Eicker, Friedhelm (enero de 1967). "Teoremas para regresiones con errores desiguales y dependientes". Proceedings of the fifth Berkeley Symposium on Mathematical Statistics and Probability, Volumen 1: Statistics. 5 1): 59–83.
- ^ Giles, Dave (8 de mayo de 2013). "Robust Standard Errores para modelos no lineales". Econometrics Beat.
- ^ Guggisberg, Michael (2019). "Misspecificified Discrete Choice Models and Huber-White Standard Errores". Journal of Econometric Métodos. 8 (1). doi:10.1515/jem-2016-0002.
- ^ Greene, William H. (2012). Econometric Analysis (Seventh ed.). Educación Pearson. pp. 692 –693. ISBN 978-0-273-75356-8.
- ^ MacKinnon, James G.; White, Halbert (1985). "Some Heteroskedastic-Consistent Covariance Matrix Estimators with Improved Finite Sample Properties". Journal of Econometrics. 29 3): 305–325. doi:10.1016/0304-4076(85)90158-7. hdl:10419/189084.
- ^ Long, J. Scott; Ervin, Laurie H. (2000). "Using Heteroscedasticity Consistent Standard Errores en el modelo de regresión lineal". El Estadístico Americano. 54 3): 217–224. doi:10.2307/2685594. ISSN 0003-1305.
- ^ C., Davison, Anthony (2010). Métodos de arranque y su aplicación. Cambridge Univ. ISBN 978-0-521-57391-7. OCLC 740960962.
{{cite book}}
: CS1 maint: múltiples nombres: lista de autores (link) - ^ "EViews 8 Robo de regresión".
- ^ Covariancia Matrices: Robust Covariance Matrix Estimators
- ^ "Heteroskedasticity and autocorrelation consistent covariance estimators". Econometrics Toolbox.
- ^ sandwich: Robust Covariance Matrix Estimators
- ^ Kleiber, Christian; Zeileis, Achim (2008). Econometría aplicada con R. Nueva York: Springer. pp. 106–110. ISBN 978-0-387-77316-2.
- ^ Vea la ayuda en línea para _robust opción y el comando de regresión.
- ^ "Estimación de la matriz de covariancia rotativa" (PDF). Guía del usuario Gretl, capítulo 22.
Más lectura
- Freedman, David A. (2006). "En The So-Called 'Huber Sandwich Estimator' y 'Robust Standard Errores '". El Estadístico Americano. 60 4): 299 –302. doi:10.1198/000313006X152207. S2CID 6222876.
- Hardin, James W. (2003). "La estimación sándwich de variación". En Fomby, Thomas B.; Hill, R. Carter (eds.). Maximum Likelihood Estimation of Misspecificified Models: Veinte años después. Amsterdam: Elsevier. pp. 45 –74. ISBN 0-7623-1075-8.
- Hayes, Andrew F.; Cai, Li (2007). "Using heteroskedasticity-consistent standard error estimators in OLS regression: Introducción e implementación de software". Métodos de investigación del comportamiento. 39 4): 709 –722. doi:10.3758/BF03192961. PMID 18183883.
- King, Gary; Roberts, Margaret E. (2015). "How Robust Standard Errores exponen problemas metodológicos que no fijan, y qué hacer al respecto". Análisis político. 23 2): 159 –179. doi:10.1093/pan/mpu015.
- Wooldridge, Jeffrey M. (2009). "Heteroskedasticity-Robust Inference after OLS Estimation". Econometría introductoria: un enfoque moderno (Cuarta edición). Sudoccidental. pp. 265–271. ISBN 978-0-324-66054-8.
- Buja, Andreas, et al. "Modelos como aproximaciones-una conspiración de regredores aleatorios y desviaciones modelo contra la inferencia clásica en la regresión." Ciencia Estadística (2015): 1. pdf