Diferencia en diferencias

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

Diferencia en las diferencias ()DID o DD) es una técnica estadística utilizada en la investigación econométrica y cuantitativa en las ciencias sociales que intenta imitar un diseño de investigación experimental utilizando datos de estudio observacional, estudiando el efecto diferencial de un tratamiento en un 'grupo de tratamiento' contra un 'grupo de control' en un experimento natural. Calcula el efecto de un tratamiento (es decir, una variable explicativa o una variable independiente) en un resultado (es decir, una variable de respuesta o variable dependiente) comparando el cambio promedio con el tiempo en la variable de resultado para el grupo de tratamiento con el cambio promedio con el tiempo para el grupo de control. Aunque se pretende mitigar los efectos de factores extraneosos y sesgo de selección, dependiendo de cómo se elija el grupo de tratamiento, este método puede estar sujeto a ciertos sesgos (por ejemplo, regresión media, causalidad inversa y sesgo variable omitido).

A diferencia de una estimación de series temporales del efecto del tratamiento en los sujetos (que analiza las diferencias a lo largo del tiempo) o una estimación transversal del efecto del tratamiento (que mide la diferencia entre los grupos de tratamiento y control), la diferencia en diferencias utiliza datos de panel para medir las diferencias, entre el grupo de tratamiento y de control, de los cambios en la variable de resultado que ocurren a lo largo del tiempo.

Definición general

La diferencia en las diferencias requiere datos medidos de un grupo de tratamiento y un grupo de control en dos o más períodos de tiempo diferentes, específicamente al menos un período de tiempo antes del "tratamiento" y al menos un período de tiempo después del "tratamiento". En el ejemplo ilustrado, el resultado en el grupo de tratamiento está representado por la línea P y el resultado en el grupo de control está representado por la línea S. La variable de resultado (dependiente) en ambos grupos se mide a la hora 1, antes de que ambos grupos hayan recibido el tratamiento (es decir, la variable independiente o explicativa), representada por los puntos P1 y S1. El grupo de tratamiento recibe o experimenta el tratamiento y ambos grupos se miden de nuevo a la vez 2. No toda la diferencia entre los grupos de tratamiento y control a la hora 2 (es decir, la diferencia entre P2 y S2) se puede explicar como un efecto del tratamiento, porque el grupo de tratamiento y el grupo de control no comenzó en el mismo punto a la vez 1. DID, por lo tanto, calcula la diferencia "normal" en la variable de resultado entre los dos grupos (la diferencia que todavía existiría si ningún grupo experimentara el tratamiento), representado por la línea punteada Q. (Nota que la pendiente de P1 a Q es lo mismo que la pendiente desde S1 a S2) El efecto del tratamiento es la diferencia entre el resultado observado (P)2) y el resultado "normal" (la diferencia entre P2 y Q).

Definición formal

Considere el modelo

Donde es la variable dependiente para el individuo y tiempo , es el grupo al que pertenece (es decir, el tratamiento o el grupo de control) y es corto para la variable dummy igual a 1 cuando el evento descrito en es verdad, y 0 de lo contrario. En la trama del tiempo versus por grupo, es la interceptación vertical del gráfico para , y es la tendencia de tiempo compartida por ambos grupos según la hipótesis de tendencia paralela (véase Assumptions below). es el efecto del tratamiento, y es el término residual.

Considere el promedio de la variable dependiente y los indicadores ficticios por grupo y tiempo:

y suponer para la simplicidad que y . Note que no es aleatorio; solo codifica cómo se etiquetan los grupos y los períodos. Entonces...

El supuesto de exogeneidad estricta implica entonces que

Sin pérdida de generalidad, asuma que es el grupo de tratamiento, y es el período posterior, entonces y , dando el estimador DID

que se puede interpretar como el efecto del tratamiento indicado por el . A continuación se muestra cómo este estimador se puede leer como un coeficiente en una regresión mínima ordinaria. El modelo descrito en esta sección es sobre-parametrizado; para remediar que, uno de los coeficientes de las variables muñecos se puede establecer a 0, por ejemplo, podemos establecer .

Suposiciones

Ilustración de la hipótesis de tendencia paralela

Todas las suposiciones del modelo OLS se aplican por igual al DID. Además, el DID requiere un Hipótesis de tendencia paralela. La hipótesis de tendencia paralela dice que son los mismos en ambos y . Dado que la definición formal anterior representa con precisión la realidad, esta suposición se sostiene automáticamente. Sin embargo, un modelo con puede ser más realista. A fin de aumentar la probabilidad de que la hipótesis de tendencia paralela tenga lugar, a menudo se combina un enfoque de diferencia en diferencias con la combinación de coincidencias. Esto implica unidades de 'Matching' conocidas 'tratamiento' con unidades de control antifactual simuladas: unidades características equivalentes que no recibieron tratamiento. Al definir el Resultado Variable como una diferencia temporal (cambio de resultado observado entre los períodos de pre- y post-tratamiento), y Combinando múltiples unidades en una gran muestra sobre la base de historias similares de pre-tratamiento, el ATE resultante (es decir, el ATT: Efecto promedio del tratamiento para el tratado) proporciona una estimación robusta de diferencias en las diferencias de los efectos del tratamiento. Esto sirve a dos fines estadísticos: en primer lugar, condicionados a covariaciones previas al tratamiento, es probable que se sostenga la hipótesis de tendencias paralelas; y en segundo lugar, este enfoque reduce la dependencia de los supuestos de ignorancia asociados necesarios para la inferencia válida.

Como se ilustra a la derecha, el efecto del tratamiento es la diferencia entre el valor observado de y y lo que habría sido el valor de y con tendencias paralelas, si hubiera habido No ha habido tratamiento. El Aquiles' El talón del TID es cuando algo distinto al tratamiento cambia en un grupo pero no en el otro al mismo tiempo que el tratamiento, lo que implica una violación del supuesto de tendencia paralela.

Para garantizar la precisión de la estimación del DID, se supone que la composición de los individuos de los dos grupos permanece sin cambios a lo largo del tiempo. Cuando se utiliza un modelo DID, se deben considerar y abordar varios problemas que pueden comprometer los resultados, como la autocorrelación y las caídas de Ashenfelter.

Implementación

El método DID se puede implementar de acuerdo con la siguiente tabla, donde la celda inferior derecha es el estimador DID.

Diferencia
Cambio

Al ejecutar un análisis de regresión se obtiene el mismo resultado. Considere el modelo OLS

Donde es una variable mutilada para el período, igual a cuando , y es una variable sombría para la membresía de grupo, igual a cuando . La variable compuesta es una variable dummy que indica cuándo . Aunque no se muestra rigurosamente aquí, esta es una adecuada parametrización de la definición formal modelo, además, resulta que los promedios de grupo y período en esa sección se refieren a las estimaciones del parámetro modelo como sigue:

Donde representa promedios condicionales calculados en la muestra, por ejemplo, es el indicador para el período posterior, es un indicador para el grupo de control. Note que es una estimación del contrafactual más que el impacto del grupo de control. El grupo de control se utiliza a menudo como un proxy para el contrafactual (ver, método de control sintético para una comprensión más profunda de este punto). Por ahí, se puede interpretar como el impacto tanto del grupo de control como del contrafactual de la intervención (tratamiento). Análogamente, , debido al supuesto paralelo de tendencia, es también la misma diferencia entre el grupo de tratamiento y control en . Las descripciones anteriores no deben interpretarse para implicar el efecto (promedio) de sólo el grupo de control, para , o sólo la diferencia de los grupos de tratamiento y control en el pre-período, para . Como en Card y Krueger, a continuación, una primera (tiempo) diferencia de la variable de resultado elimina la necesidad de temporización (es decir, ) para formar una estimación imparcial de , implicando que no está realmente condicionado al grupo de tratamiento o control. De manera consistente, una diferencia entre los grupos de tratamiento y control eliminaría la necesidad de diferenciales de tratamiento (es decir, ) para formar una estimación imparcial de . Este matiz es importante para entender cuando el usuario cree (debilidad) que existen violaciones de pre-trend paralelas o en el caso de violaciones de los supuestos de aproximación contrafactual apropiados dada la existencia de choques no comunes o acontecimientos confusos. Para ver la relación entre esta notación y la sección anterior, considere como por encima sólo una observación por período de tiempo para cada grupo, entonces

y así sucesivamente para otros valores y , que equivale a

Pero esta es la expresión para el efecto del tratamiento que se dio en la definición formal y en la tabla anterior.

Ejemplo de Card y Krueger (1994)

El artículo de Card y Krueger sobre el salario mínimo en Nueva Jersey, publicado en 1994, se considera uno de los estudios DID más famosos; Posteriormente, Card recibió el Premio Nobel de Ciencias Económicas de 2021 en parte por este trabajo y otros relacionados. Card y Krueger compararon el empleo en el sector de comida rápida en Nueva Jersey y en Pensilvania, en febrero de 1992 y en noviembre de 1992, después de que el salario mínimo de Nueva Jersey aumentara de $4,25 a $5,05 en abril de 1992. Observando un cambio en el empleo en Nueva Jersey Sólo Jersey, antes y después del tratamiento, no controlaría variables omitidas como el clima y las condiciones macroeconómicas de la región. Al incluir Pensilvania como control en un modelo de diferencias en diferencias, se controla implícitamente cualquier sesgo causado por variables comunes a Nueva Jersey y Pensilvania, incluso cuando estas variables no se observan. Suponiendo que Nueva Jersey y Pensilvania tengan tendencias paralelas a lo largo del tiempo, el cambio en el empleo de Pensilvania puede interpretarse como el cambio que habría experimentado Nueva Jersey si no hubieran aumentado el salario mínimo, y viceversa. La evidencia sugirió que el aumento del salario mínimo no indujo una disminución del empleo en Nueva Jersey, contrariamente a lo que sugeriría alguna teoría económica. La siguiente tabla muestra Tarjeta y datos. Estimaciones de Krueger del efecto del tratamiento sobre el empleo, medido como FTE (o equivalentes a tiempo completo). Card y Krueger estiman que el aumento del salario mínimo de $0,80 en Nueva Jersey condujo a un aumento de 2,75 FTE en el empleo.

New JerseyPennsylvaniaDiferencia
Febrero20.4423.33−2.89
Noviembre21.0321.17−0.14
Cambio0,59−2.162.75

Un ejemplo de aplicación de software de esta investigación se encuentra en el comando Stata -diff- escrito por Juan Miguel Villa.

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save