Estadística de Durbin-Watson

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

En estadística, el estadístico de Durbin–Watson es un estadístico de prueba utilizado para detectar la presencia de autocorrelación en el retardo 1 en los residuos (errores de predicción) de un análisis de regresión. Recibe su nombre en honor a James Durbin y Geoffrey Watson. La distribución de muestra pequeña de esta razón fue derivada por John von Neumann (von Neumann, 1941). Durbin y Watson (1950, 1951) aplicaron este estadístico a los residuos de regresiones de mínimos cuadrados y desarrollaron pruebas de límites para la hipótesis nula de que los errores no están correlacionados serialmente contra la alternativa de que siguen un proceso autorregresivo de primer orden. Nótese que la distribución de este estadístico de prueba no depende de los coeficientes de regresión estimados ni de la varianza de los errores.

También se puede realizar una evaluación similar con la prueba de Breusch-Godfrey y la prueba de Ljung-Box.

Computación e interpretación de la estadística Durbin-Watson

Si es el residual dado por la estadística de prueba de Durbin-Watson es

Donde es el número de observaciones. Para grandes , es aproximadamente igual a , donde es la autocorrelación de la muestra de los residuos en lag 1. por lo tanto no indica autocorrelación. El valor de siempre mentiras y . Si la estadística Durbin-Watson es sustancialmente inferior a 2, hay evidencia de correlación serial positiva. Como regla aproximada del pulgar, si Durbin–Watson es inferior a 1.0, puede haber causa de alarma. Valores pequeños indican que los términos de error sucesivos están correlacionados positivamente. Si , los términos de error sucesivos se correlacionan negativamente. En las regresiones, esto puede implicar una subestimación del nivel de significación estadística.

Para probar autocorrelación positiva en importancia , la estadística de prueba se compara con valores críticos inferiores y superiores ( y ):

  • Si , hay evidencia estadística de que los términos de error son positivamente autocorrelacionados.
  • Si , hay no evidencia estadística de que los términos de error son positivamente autocorrelacionados.
  • Si , la prueba es inconclusiva.

La correlación serial positiva es aquella en la que un error positivo en una observación aumenta las probabilidades de que se produzca un error positivo en otra observación.

Para probar autocorrelación negativa en importancia , la estadística de prueba se compara con valores críticos inferiores y superiores ( y ):

  • Si , hay evidencia estadística de que los términos de error están negativamente relacionados con la autocoración.
  • Si , hay no evidencia estadística de que los términos de error están negativamente relacionados con la autocoración.
  • Si , la prueba es inconclusiva.

La correlación serial negativa implica que un error positivo en una observación aumenta la probabilidad de un error negativo en otra observación, y un error negativo en una observación aumenta la probabilidad de un error positivo en otra.

Los valores críticos, y , variar por nivel de importancia () y los grados de libertad en la ecuación de regresión. Su derivación es compleja: los estadísticos suelen obtener de los apéndices de los textos estadísticos.

Si la matriz de diseño de la regresión es conocido, valores críticos exactos para la distribución de bajo la hipótesis nula de ninguna correlación serial se puede calcular. Bajo la hipótesis nula se distribuye como

Donde es el número de observaciones y es el número de variables de regresión; son variables aleatorias normales independientes; y son los no cero eigenvalues de Donde es la matriz que transforma los residuos en estadística, es decir. . Existen varios algoritmos computacionales para encontrar percentiles de esta distribución.

Aunque la correlación serial no afecta la consistencia de los coeficientes de regresión estimados, sí afecta nuestra capacidad para realizar pruebas estadísticas válidas. En primer lugar, la estadística F para probar la significancia general de la regresión puede estar inflada bajo una correlación serial positiva porque el error cuadrático medio (MSE) tenderá a subestimar la varianza del error poblacional. En segundo lugar, la correlación serial positiva generalmente hace que los errores estándar de mínimos cuadrados ordinarios (OLS) para los coeficientes de regresión subestimen los errores estándar verdaderos. Como consecuencia, si hay una correlación serial positiva en la regresión, el análisis de regresión lineal estándar generalmente nos llevará a calcular errores estándar artificialmente pequeños para el coeficiente de regresión. Estos pequeños errores estándar harán que la estadística t estimada se infle, sugiriendo significancia donde quizás no la haya. La estadística t inflada, a su vez, puede llevarnos a rechazar incorrectamente hipótesis nulas sobre valores poblacionales de los parámetros del modelo de regresión con más frecuencia de lo que lo haríamos si los errores estándar se estimaran correctamente.

Si la estadística de Durbin-Watson indica la presencia de correlación serial de los residuos, esto se puede solucionar utilizando el procedimiento de Cochrane-Orcutt.

La estadística de Durbin-Watson, aunque se muestra en muchos programas de análisis de regresión, no es aplicable en determinadas situaciones. Por ejemplo, cuando se incluyen variables dependientes rezagadas en las variables explicativas, no es adecuado utilizar esta prueba. Se debe utilizar la prueba h de Durbin (ver más abajo) o las pruebas de razón de verosimilitud, que son válidas en muestras grandes.

Durbin h-statistic

La estadística de Durbin-Watson está sesgada en el caso de los modelos de promedio móvil autorregresivo, por lo que se subestima la autocorrelación. Pero para muestras grandes se puede calcular fácilmente la estadística h de distribución normal imparcial:

utilizando el estadístico de Durbin–Watson d y la varianza estimada

del coeficiente de regresión de la variable dependiente rezagada, siempre que

Implementaciones en conjuntos estadísticos

  1. R: el dwtest función en el paquete Imtest, durbinWatsonTest (o dwt para corto) función en el paquete del coche, y pdwtest y pbnftest para modelos de paneles en el paquete plm.
  2. MATLAB: la función más dwtest en la Caja de Herramientas de Estadísticas.
  3. Mathematica: el Durbin-Watsond) estadística se incluye como una opción en la función LinearModelFit.
  4. SAS: Es una salida estándar cuando se utiliza el modelo proc y es una opción (dw) al utilizar el registro proc.
  5. EViews: Se calcula automáticamente al utilizar la regresión OLS
  6. gretl: Calculado automáticamente al utilizar la regresión OLS
  7. Stata: el comando estat dwatson, siguiente regress en datos de series temporales. La prueba LM de Engle para heteroskedasticidad condicional autoregresiva (ARCH), una prueba para la volatilidad dependiente del tiempo, la prueba Breusch-Godfrey, y la prueba alternativa de Durbin para la correlación serial también están disponibles. Todas las pruebas (excepto -dwatson-) separadamente para correlaciones seriales de mayor orden. La prueba Breusch-Godfrey y la prueba alternativa de Durbin también permiten a los regredores que no son estrictamente exógenos.
  8. Excel: aunque Microsoft Excel 2007 no tiene una función específica de Durbin–Watson, la d-Estadística puede calcularse utilizando =SUMXMY2(x_array,y_array)/SUMSQ(array)
  9. Minitab: la opción de reportar la estadística en la ventana de Sesión se puede encontrar bajo la caja "Opciones" bajo la regresión y a través de la caja "Resultados" bajo la regresión general.
  10. Python: una función durbin_watson está incluida en el paquete Estadísticasmodels (en inglés)statsmodels.stats.stattools.durbin_watson), pero las tablas estadísticas para valores críticos no están disponibles allí.
  11. SPSS: Included as an option in the Regression function.
  12. Julia: DurbinWatson Prueba función está disponible en Hipótesis Pruebas paquete.

Véase también

  • Regreso de las series temporales
  • ACF / PACF
  • Dimensión de correlación
  • Breusch – prueba Godfrey
  • Prueba Ljung-Box

Notas

  1. ^ Chatterjee, Samprit; Simonoff, Jeffrey (2013). Handbook of Regression Analysis. John Wiley & Sons. ISBN 1118532813.
  2. ^ Gujarati (2003) p. 469
  3. ^ Durbin, J.; Watson, G. S. (1971). "Testing for serial correlation in least squares regression. III". Biometrika. 58 (1): 1–19. doi:10.2307/2334313.
  4. ^ Farebrother, R. W. (1980). "Algorithm AS 153: Procedimiento de pan para las probabilidades de cola de la estadística Durbin-Watson". Journal of the Royal Statistical Society, Series C. 29 (2): 224-227.
  5. ^ Hateka, Neeraj R. (2010). "Tests for Detecting Autocorrelation". Principios de Econometría: Introducción (Usando R). SAGE Publications. pp. 379–82. ISBN 978-81-321-0660-9.
  6. ^ "regresar la serie de tiempo de posestimación — Herramientas de postestimación para regresión con series temporales" (PDF). Stata Manual.
  7. ^ "Exámenes de series temporales". juliastats.org. Retrieved 2020-02-04.

Referencias

  • Durbin, J.; Watson, G. S. (1950). "Testing for Serial Correlation in Least Squares Regression, I". Biometrika. 37 (3–4): 409–428. doi:10.1093/biomet/37.3-4.409. JSTOR 2332391.
  • Durbin, J.; Watson, G. S. (1951). "Testing for Serial Correlation in Least Squares Regression, II". Biometrika. 38 (1–2): 159–179. doi:10.1093/biomet/38.1-2.159. JSTOR 2332325.
  • Gujarati, Damodar N.; Porter, Dawn C. (2009). Econometría básica (5a edición). McGraw-Hill Irwin. ISBN 978-0-07-337577-9.
  • Kmenta, Jan (1986). Elementos de la econometría (Segunda edición). Nueva York: Macmillan. pp. 328–332. ISBN 0-02-365070-2.
  • Neumann, John von (1941). "Distribución de la relación de la diferencia sucesiva cuadrada media a la varianza". Annals of Mathematical Statistics. 12 (4): 367–395. doi:10.1214/aoms/1177731677. JSTOR 2235951.
  • Verbeek, Marno (2012). Guía de Econometría Moderna (4a edición). Chichester: John Wiley ' Sons. pp. 117–118. ISBN 978-1-119-95167-4.
  • Tabla de alta n y k Archivado 2011-08-07 en la máquina Wayback
  • Conferencia econométrica (topo: Durbin–Watson estadística) en YouTube por Mark Thoma
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save