Correlación no implica causalidad
La frase "correlación no implica causalidad" se refiere a la incapacidad de deducir legítimamente una relación de causa y efecto entre dos eventos o variables únicamente sobre la base de una asociación o correlación observada entre ellos. La idea de que "correlación implica causalidad" es un ejemplo de una falacia lógica de causa cuestionable, en la que se considera que dos eventos que ocurren juntos han establecido una relación de causa y efecto. Esta falacia también se conoce por la frase latina cum hoc ergo propter hoc ('con esto, por lo tanto debido a esto'). Esto difiere de la falacia conocida como post hoc ergo propter hoc("después de esto, por lo tanto debido a esto"), en el que un evento que sigue a otro se ve como una consecuencia necesaria del evento anterior, y de la fusión, la fusión errante de dos eventos, ideas, bases de datos, etc., en uno.
Al igual que con cualquier falacia lógica, identificar que el razonamiento detrás de un argumento es defectuoso no implica necesariamente que la conclusión resultante sea falsa. Se han propuesto métodos estadísticos que utilizan la correlación como base para las pruebas de hipótesis de causalidad, incluida la prueba de causalidad de Granger y el mapeo cruzado convergente.
Uso y significado de 'implicar'
En uso casual, la palabra "implica" vagamente significa sugiere en lugar de requiere. Sin embargo, en lógica, el uso técnico de la palabra "implica" significa "es una condición suficiente para". Este es el significado que pretenden los estadísticos cuando dicen que la causalidad no es segura. De hecho, p implica q tiene el significado técnico del condicional material: si p entonces q se simboliza como p → q. Es decir, "si la circunstancia p es verdadera, entonces se sigue q ". En este sentido, siempre es correcto decir "Correlación no implica causalidad".
Donde hay causalidad, hay correlación, pero también una secuencia en el tiempo de causa a efecto, un mecanismo plausible y, a veces, causas comunes e intermedias. Si bien la correlación se usa a menudo para inferir la causalidad porque es una condición necesaria, no es una condición suficiente.
Análisis causal
El análisis causal es el campo del diseño experimental y las estadísticas relacionadas con el establecimiento de causa y efecto. Para cualesquiera dos eventos correlacionados, A y B, sus posibles relaciones incluyen:
- A causa B (causalidad directa);
- B causa A (causalidad inversa);
- A y B son causados por C (causalidad común);
- A causa B y B causa A (causalidad bidireccional o cíclica);
- No hay conexión entre A y B; la correlación es una coincidencia.
Por lo tanto, no se puede sacar ninguna conclusión con respecto a la existencia o la dirección de una relación de causa y efecto solo por el hecho de que A y B están correlacionados. Determinar si existe una relación real de causa y efecto requiere más investigación, incluso cuando la relación entre A y B es estadísticamente significativa, se observa un gran tamaño del efecto o se explica una gran parte de la varianza.
En filosofía y física
La naturaleza de la causalidad se investiga sistemáticamente en varias disciplinas académicas, incluidas la filosofía y la física.
En la academia, existe un número importante de teorías sobre la causalidad; El Manual de causalidad de Oxford (Beebee, Hitchcock & Menzies 2009) abarca 770 páginas. Entre las teorías más influyentes dentro de la filosofía se encuentran las Cuatro causas de Aristóteles y el ocasionalismo de Al-Ghazali. David Hume argumentó que las creencias sobre la causalidad se basan en la experiencia, y la experiencia se basa de manera similar en la suposición de que el futuro modela el pasado, que a su vez solo puede basarse en la experiencia, lo que lleva a una lógica circular. En conclusión, afirmó que la causalidad no se basa en un razonamiento real: solo se puede percibir realmente la correlación.Immanuel Kant, según Beebee, Hitchcock & Menzies (2009), sostuvo que “un principio causal según el cual todo evento tiene una causa, o se sigue de acuerdo a una ley causal, no puede establecerse por inducción como una afirmación puramente empírica, ya que carecería entonces de estricta universalidad o necesidad".
Fuera del campo de la filosofía, las teorías de la causalidad se pueden identificar en la mecánica clásica, la mecánica estadística, la mecánica cuántica, las teorías del espacio-tiempo, la biología, las ciencias sociales y el derecho. Para establecer una correlación como causal dentro de la física, normalmente se entiende que la causa y el efecto deben conectarse a través de un mecanismo local (cf. por ejemplo, el concepto de impacto) o un mecanismo no local (cf. el concepto de campo), de acuerdo con con leyes conocidas de la naturaleza.
Desde el punto de vista de la termodinámica, las propiedades universales de las causas en comparación con los efectos se han identificado a través de la segunda ley de la termodinámica, lo que confirma la visión antigua, medieval y cartesiana de que "la causa es mayor que el efecto" para el caso particular de la termodinámica. energía gratis. Esto, a su vez, se ve cuestionado por las interpretaciones populares de los conceptos de sistemas no lineales y el efecto mariposa, en los que pequeños eventos provocan grandes efectos debido, respectivamente, a la imprevisibilidad y al improbable desencadenamiento de grandes cantidades de energía potencial.
Causalidad interpretada a partir de estados contrafácticos
Intuitivamente, la causalidad parece requerir no solo una correlación, sino una dependencia contrafáctica. Supongamos que un estudiante se desempeñó mal en un examen y adivina que la causa fue que no estudió. Para probar esto, uno piensa en el contrafactual: el mismo estudiante que escribe la misma prueba en las mismas circunstancias pero que estudió la noche anterior. Si uno pudiera rebobinar la historia y cambiar solo una pequeña cosa (hacer que el estudiante estudie para el examen), entonces se podría observar la causalidad (al comparar la versión 1 con la versión 2). Debido a que uno no puede rebobinar la historia y reproducir eventos después de hacer pequeños cambios controlados, la causalidad solo puede inferirse, nunca saberse con exactitud. Esto se conoce como el problema fundamental de la inferencia causal: es imposible observar directamente los efectos causales.
Un objetivo principal de los experimentos científicos y los métodos estadísticos es aproximarse lo mejor posible al estado hipotético del mundo. Por ejemplo, se podría realizar un experimento con gemelos idénticos que se sabe que obtienen constantemente las mismas calificaciones en sus exámenes. Un gemelo es enviado a estudiar durante seis horas mientras que el otro es enviado al parque de diversiones. Si los puntajes de sus exámenes divergieran repentinamente en gran medida, esto sería una fuerte evidencia de que estudiar (o ir al parque de diversiones) tuvo un efecto causal en los puntajes de los exámenes. En este caso, la correlación entre el estudio y los puntajes de las pruebas casi con seguridad implicaría causalidad.
Los estudios experimentales bien diseñados reemplazan la igualdad de los individuos como en el ejemplo anterior por la igualdad de los grupos. El objetivo es construir dos grupos que sean similares excepto por el trato que reciben los grupos. Esto se logra seleccionando sujetos de una sola población y asignándolos aleatoriamente a dos o más grupos. La probabilidad de que los grupos se comporten de manera similar entre sí (en promedio) aumenta con el número de sujetos en cada grupo. Si los grupos son esencialmente equivalentes excepto por el tratamiento que reciben, y se observa una diferencia en el resultado de los grupos, entonces esto constituye evidencia de que el tratamiento es responsable del resultado, o en otras palabras, el tratamiento causa el efecto observado. Sin embargo, un efecto observado también podría ser causado "por casualidad", por ejemplo, como resultado de perturbaciones aleatorias en la población. Existen pruebas estadísticas para cuantificar la probabilidad de concluir erróneamente que existe una diferencia observada cuando en realidad no existe (por ejemplo, consulte el valor P).
Causalidad predicha por una extrapolación de tendencias
Cuando los estudios experimentales son imposibles y solo se dispone de datos preexistentes, como suele ser el caso, por ejemplo, en economía, se puede utilizar el análisis de regresión. Los factores distintos de la posible variable causal de interés se controlan incluyéndolos como regresores además del regresor que representa la variable de interés. Las inferencias falsas de causalidad debido a la causalidad inversa (o estimaciones erróneas de la magnitud de la causalidad debido a la presencia de causalidad bidireccional) se pueden evitar utilizando explicadores (regresores) que son necesariamente exógenos, como explicadores físicos como la cantidad de lluvia (como factor determinante). de, digamos, precios de futuros), variables rezagadas cuyos valores se determinaron antes de que se determinara el valor de la variable dependiente, variables instrumentales para los explicativos (elegidas en base a su exogeneidad conocida), etc. Ver causalidad en estadística y economía. La correlación espuria debida a la influencia mutua de una tercera variable causal común es más difícil de evitar: el modelo debe especificarse de tal manera que haya una razón teórica para creer que no se ha omitido de su análisis ninguna variable causal subyacente.
Ejemplos de inferir ilógicamente la causalidad a partir de la correlación
B causa A (causalidad inversa o causalidad inversa)
La causalidad inversa o la causalidad inversa o la dirección incorrecta es una falacia informal de causa cuestionable donde la causa y el efecto se invierten. Se dice que la causa es el efecto y viceversa.Ejemplo 1Cuanto más rápido se observa que giran los molinos de viento, más viento se observa.Por lo tanto, el viento es causado por la rotación de los molinos de viento. (O, simplemente: los molinos de viento, como su nombre lo indica, son máquinas que se usan para producir viento).
En este ejemplo, la correlación (simultaneidad) entre la actividad de los molinos de viento y la velocidad del viento no implica que los molinos de viento causen el viento. Es más bien al revés, como sugiere el hecho de que el viento no necesita molinos de viento para existir, mientras que los molinos de viento necesitan viento para girar. El viento se puede observar en lugares donde no hay molinos de viento o molinos de viento que no giran, y hay buenas razones para creer que el viento existía antes de la invención de los molinos de viento.Ejemplo 2Los sujetos con colesterol bajo se correlacionan con un aumento de la mortalidad.Por lo tanto, el colesterol bajo aumenta el riesgo de mortalidad.
Es al revés. Por lo que la enfermedad, como el cáncer, provoca un colesterol bajo debido a una miríada de factores, como la pérdida de peso y un aumento de la mortalidad. Esto también se ve con los ex fumadores. Los ex fumadores tienen más probabilidades de morir de cáncer de pulmón que los fumadores actuales.Cuando a los fumadores de toda la vida se les dice que tienen cáncer de pulmón, muchos dejan de fumar. Este cambio puede hacer que parezca que los ex fumadores tienen más probabilidades de morir de cáncer de pulmón que los fumadores actuales. Esto también se puede ver en los alcohólicos. Cuando a los alcohólicos se les diagnostica cirrosis hepática, muchos dejan de beber. Sin embargo, también experimentan un mayor riesgo de mortalidad. En estos casos, son las enfermedades las que causan un mayor riesgo de mortalidad, pero el aumento de la mortalidad se atribuye a los efectos beneficiosos que siguen al diagnóstico, haciendo que los cambios saludables parezcan nocivos.Ejemplo 3
En otros casos, puede que simplemente no esté claro cuál es la causa y cuál el efecto. Por ejemplo:Los niños que ven mucha televisión son los más violentos. Claramente, la televisión hace que los niños sean más violentos.
Esto podría ser fácilmente al revés; es decir, a los niños violentos les gusta ver más la televisión que a los menos violentos.Ejemplo 4
Una correlación entre el uso de drogas recreativas y los trastornos psiquiátricos podría ser de cualquier manera: tal vez las drogas causen los trastornos, o tal vez las personas usan drogas para automedicarse por condiciones preexistentes. La teoría de las drogas de puerta de enlace puede argumentar que el uso de marihuana lleva al uso de drogas más duras, pero el uso de drogas duras puede llevar al uso de marihuana (ver también confusión de lo contrario). De hecho, en las ciencias sociales, donde los experimentos controlados a menudo no pueden usarse para discernir la dirección de la causalidad, esta falacia puede alimentar argumentos científicos de larga data. Un ejemplo de este tipo se puede encontrar en la economía de la educación, entre los modelos de detección/señalización y capital humano: podría ser que tener una habilidad innata le permite a uno completar una educación, o que completar una educación desarrolla la propia habilidad.Ejemplo 5
Un ejemplo histórico de esto es que los europeos en la Edad Media creían que los piojos eran beneficiosos para la salud, ya que rara vez habría piojos en las personas enfermas. El razonamiento fue que la gente se enfermó porque se fueron los piojos. Sin embargo, la verdadera razón es que los piojos son extremadamente sensibles a la temperatura corporal. Un pequeño aumento de la temperatura corporal, como la fiebre, hará que los piojos busquen otro huésped. El termómetro médico aún no se había inventado, por lo que rara vez se notaba este aumento de temperatura. Los síntomas notables aparecieron más tarde, dando la impresión de que los piojos se fueron antes de que la persona se enfermara.
En otros casos, dos fenómenos pueden ser cada uno una causa parcial del otro; considere la pobreza y la falta de educación, o la procrastinación y la baja autoestima. Sin embargo, quien haga un argumento basado en estos dos fenómenos debe tener cuidado de evitar la falacia de causa y consecuencia circular. La pobreza es una causa de la falta de educación, pero no es la única causa, y viceversa.
El tercer factor C (la variable de causa común) causa tanto A como B
La falacia de la tercera causa (también conocida como ignorar una causa común o una causa cuestionable) es una falacia lógica en la que una relación espuria se confunde con causalidad. Afirma que X causa Y cuando, en realidad, tanto X como Y son causados por Z. Es una variación de la falacia post hoc ergo propter hoc y un miembro del grupo de falacias de causa cuestionable.
Todos estos ejemplos tratan con una variable oculta, que es simplemente una tercera variable oculta que afecta ambas causas de la correlación. A menudo también surge una dificultad cuando el tercer factor, aunque fundamentalmente diferente de A y B, está tan estrechamente relacionado con A y/o B que se confunde con ellos o es muy difícil separarlo científicamente de ellos (ver Ejemplo 4).Ejemplo 1Dormir con los zapatos puestos está fuertemente relacionado con despertarse con dolor de cabeza.Por lo tanto, dormir con los zapatos puestos causa dolor de cabeza.
El ejemplo anterior comete la falacia de correlación-implica-causalidad, ya que concluye prematuramente que dormir con los zapatos puestos causa dolor de cabeza. Una explicación más plausible es que ambos se deban a un tercer factor, en este caso acostarse borracho, lo que da lugar a una correlación. Entonces la conclusión es falsa.Ejemplo 2Los niños pequeños que duermen con la luz encendida tienen muchas más probabilidades de desarrollar miopía en el futuro.Por eso, dormir con la luz encendida provoca miopía.
Este es un ejemplo científico que resultó de un estudio en el Centro Médico de la Universidad de Pensilvania. Publicado en la edición del 13 de mayo de 1999 de Nature, el estudio recibió mucha cobertura en ese momento en la prensa popular. Sin embargo, un estudio posterior en la Universidad Estatal de Ohio no encontró que los bebés que dormían con la luz encendida causaran el desarrollo de miopía. Sí encontró un fuerte vínculo entre la miopía de los padres y el desarrollo de la miopía infantil, y también señaló que los padres miopes eran más propensos a dejar una luz encendida en la habitación de sus hijos. En este caso, la causa de ambas condiciones es la miopía de los padres, y la conclusión anterior es falsa.Ejemplo 3A medida que aumentan las ventas de helados, la tasa de muertes por ahogamiento aumenta considerablemente.Por lo tanto, el consumo de helado provoca ahogamiento.
Este ejemplo no reconoce la importancia de la época del año y la temperatura para las ventas de helados. El helado se vende durante los calurosos meses de verano a un ritmo mucho mayor que durante las épocas más frías, y es durante estos calurosos meses de verano cuando es más probable que las personas participen en actividades relacionadas con el agua, como nadar. El aumento de las muertes por ahogamiento simplemente se debe a una mayor exposición a las actividades acuáticas, no al helado. La conclusión expresada es falsa.Ejemplo 4Un estudio hipotético muestra una relación entre los puntajes de ansiedad ante los exámenes y los puntajes de timidez, con un valor estadístico r (fuerza de la correlación) de +.59.Por lo tanto, se puede concluir simplemente que la timidez, en alguna parte, influye causalmente en la ansiedad ante los exámenes.
Sin embargo, como se encuentra en muchos estudios psicológicos, se descubre otra variable, una "puntuación de autoconciencia", que tiene una correlación más aguda (+.73) con la timidez. Esto sugiere un posible problema de "tercera variable", sin embargo, cuando se encuentran tres medidas tan estrechamente relacionadas, sugiere además que cada una puede tener tendencias bidireccionales (ver "variable bidireccional", arriba), siendo un grupo de valores correlacionados que se influyen entre sí. hasta cierto punto. Por lo tanto, la simple conclusión anterior puede ser falsa.Ejemplo 5Desde la década de 1950, tanto el nivel de CO 2 atmosférico como los niveles de obesidad han aumentado considerablemente.Por lo tanto, el CO 2 atmosférico causa obesidad.
Las poblaciones más ricas tienden a comer más alimentos ya producir más CO 2.Ejemplo 6El colesterol HDL ("bueno") se correlaciona negativamente con la incidencia de infarto de miocardio.Por lo tanto, tomar medicamentos para elevar el HDL disminuye la posibilidad de sufrir un ataque al corazón.
Investigaciones posteriores han puesto en duda esta conclusión. En cambio, puede ser que otros factores subyacentes, como los genes, la dieta y el ejercicio, afecten tanto los niveles de HDL como la probabilidad de sufrir un ataque al corazón; es posible que los medicamentos puedan afectar el factor directamente medible, los niveles de HDL, sin afectar la posibilidad de un ataque al corazón.
Causalidad bidireccional: A causa B y B causa A
La causalidad no es necesariamente unidireccional; en una relación depredador-presa, el número de depredadores afecta el número de presas, pero el número de presas, es decir, el suministro de alimentos, también afecta el número de depredadores. Otro ejemplo bien conocido es que los ciclistas tienen un Índice de Masa Corporal más bajo que las personas que no andan en bicicleta. Esto a menudo se explica asumiendo que el ciclismo aumenta los niveles de actividad física y, por lo tanto, disminuye el IMC. Debido a que los resultados de los estudios prospectivos en personas que aumentan el uso de la bicicleta muestran un efecto menor sobre el IMC que los estudios transversales, también puede haber cierta causalidad inversa (es decir, las personas con un IMC más bajo tienen más probabilidades de andar en bicicleta).
La relación entre A y B es coincidente.
Las dos variables no están relacionadas en absoluto, sino que se correlacionan por casualidad. Cuantas más cosas se examinan, más probable es que dos variables no relacionadas parezcan estarlo. Por ejemplo:
- El resultado del último partido en casa de los Washington Commanders antes de la elección presidencial predijo el resultado de todas las elecciones presidenciales desde 1936 hasta 2000 inclusive, a pesar de que los resultados de los partidos de fútbol no tenían nada que ver con el resultado de la elección popular. Esta racha finalmente se rompió en 2004 (o 2012 usando una formulación alternativa de la regla original).
- La ley Mierscheid, que correlaciona la participación del Partido Socialdemócrata de Alemania en el voto popular con el tamaño de la producción de acero bruto en Alemania Occidental.
- Alternancia de líderes rusos calvos y peludos: un líder estatal calvo (o obviamente calvo) de Rusia ha sucedido a uno no calvo ("peludo"), y viceversa, durante casi 200 años.
- El código de la Biblia, palabras hebreas que predicen eventos históricos supuestamente ocultos dentro de la Torá: la gran cantidad de combinaciones de letras hace que las apariciones de cualquier palabra en un texto lo suficientemente extenso sean estadísticamente insignificantes.
Uso de la correlación como evidencia científica
Gran parte de la evidencia científica se basa en una correlación de variables: se observa que ocurren juntas. Los científicos tienen cuidado de señalar que correlación no significa necesariamente causalidad. La suposición de que A causa B simplemente porque A se correlaciona con B a menudo no se acepta como una forma legítima de argumento.
Sin embargo, a veces las personas cometen la falacia opuesta: descartar la correlación por completo. Esto descartaría una gran cantidad de evidencia científica importante. Dado que puede ser difícil o éticamente imposible realizar estudios doble ciego controlados, la evidencia correlacional desde varios ángulos diferentes puede ser útil para la predicción a pesar de no proporcionar evidencia de causalidad.. Por ejemplo, los trabajadores sociales podrían estar interesados en saber cómo se relaciona el abuso infantil con el rendimiento académico. Aunque no sería ético realizar un experimento en el que los niños sean asignados al azar para recibir o no abuso, los investigadores pueden observar los grupos existentes utilizando un diseño correlacional no experimental. Si de hecho existe una correlación negativa entre el abuso y el rendimiento académico, los investigadores podrían potencialmente usar este conocimiento de una correlación estadística para hacer predicciones sobre los niños fuera del estudio que experimentan abuso, aunque el estudio no pudo proporcionar evidencia causal de que el abuso disminuya el rendimiento académico.La combinación de metodologías disponibles limitadas con la falacia de correlación de descarte se ha utilizado en ocasiones para contrarrestar un hallazgo científico. Por ejemplo, la industria tabacalera se ha basado históricamente en el rechazo de la evidencia correlacional para rechazar un vínculo entre el tabaco y el cáncer de pulmón, como lo hizo el biólogo y estadístico Ronald Fisher, con frecuencia en su favor.
La correlación es un tipo valioso de evidencia científica en campos como la medicina, la psicología y la sociología. Primero se debe confirmar que las correlaciones son reales, luego se debe explorar sistemáticamente cada posible relación causal. Al final, la correlación por sí sola no puede usarse como evidencia de una relación de causa y efecto entre un tratamiento y un beneficio, un factor de riesgo y una enfermedad, o un factor social o económico y varios resultados. Es uno de los tipos de evidencia de los que más se abusa, porque es fácil e incluso tentador llegar a conclusiones prematuras basadas en la apariencia preliminar de una correlación.
Contenido relacionado
Factoide
Verdad a medias
Lenguaje de especificación