Falacia de la frecuencia base

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar

La falacia de la tasa base, también llamada negligencia de la tasa base o sesgo de la tasa base, es un tipo de falacia en la que las personas tienden a ignorar la tasa base (es decir, la prevalencia general) a favor de la información individualizadora (es decir, la información que pertenece solo a un tema específico). caso). El descuido de la tasa base es una forma específica del descuido de extensión más general.

Paradoja del falso positivo

Un ejemplo de la falacia de la tasa base es la paradoja del falso positivo. Esta paradoja describe situaciones en las que hay más resultados falsos positivos que verdaderos positivos. Por ejemplo, si una cámara de reconocimiento facial puede identificar a los delincuentes buscados con un 99 % de precisión, pero analiza a 10 000 personas por día, la alta precisión se ve superada por la cantidad de pruebas, y la lista de delincuentes del programa probablemente tendrá muchos más falsos positivos que verdaderos. La probabilidad de un resultado positivo de la prueba está determinada no solo por la precisión de la prueba sino también por las características de la población muestreada. Cuando la prevalencia, la proporción de personas que tienen una determinada afección, es inferior a la tasa de falsos positivos de la prueba, incluso las pruebas que tienen un riesgo muy bajo de dar un falso positivoen un caso individual dará más falsos que verdaderos positivos en general. La paradoja sorprende a la mayoría de la gente.

Es especialmente contraintuitivo cuando se interpreta un resultado positivo en una prueba en una población de baja prevalencia después de haber tratado con resultados positivos extraídos de una población de alta prevalencia. Si la tasa de falsos positivos de la prueba es más alta que la proporción de la nueva población con la afección, entonces un administrador de la prueba cuya experiencia se haya extraído de las pruebas en una población de alta prevalencia puede concluir a partir de la experiencia que un resultado positivo de la prueba generalmente indica una sujeto positivo, cuando en realidad es mucho más probable que haya ocurrido un falso positivo.

Ejemplos

Ejemplo 1: Enfermedad

Población de alta incidencia

Númerode personasInfectadono infectadoTotal
Pruebapositiva400(verdadero positivo)30(falso positivo)430
Pruebanegativa0(falso negativo)570(verdadero negativo)570
Total4006001000

Imagine realizar una prueba de enfermedades infecciosas en una población A de 1000 personas, en la que el 40% está infectado. La prueba tiene una tasa de falsos positivos del 5% (0,05) y ninguna tasa de falsos negativos. El resultado esperado de las 1000 pruebas en la población A sería:Infectado y la prueba indica enfermedad (verdadero positivo)1000 ×40/100= 400 personas recibirían un verdadero positivoNo infectado y la prueba indica enfermedad (falso positivo)1000 ×100 – 40/100× 0,05 = 30 personas recibirían un falso positivoLas 570 pruebas restantes son correctamente negativas.

Entonces, en la población A, una persona que recibe una prueba positiva podría tener más del 93% de confianza (400/30 + 400) que indica correctamente infección.

Población de baja incidencia

Númerode personasInfectadono infectadoTotal
Pruebapositiva20(verdadero positivo)49(falso positivo)69
Pruebanegativa0(falso negativo)931(verdadero negativo)931
Total209801000

Ahora considere la misma prueba aplicada a la población B, en la que solo el 2% está infectado. El resultado esperado de 1000 pruebas en la población B sería:Infectado y la prueba indica enfermedad (verdadero positivo)1000 ×2/100= 20 personas recibirían un verdadero positivoNo infectado y la prueba indica enfermedad (falso positivo)1000 ×100 – 2/100× 0,05 = 49 personas recibirían un falso positivoLas 931 (= 1000 - (49 + 20)) pruebas restantes son correctamente negativas.

En la población B, solo 20 de las 69 personas en total con un resultado positivo en la prueba están realmente infectadas. Entonces, la probabilidad de estar realmente infectado después de que le digan que está infectado es solo del 29% (20/20 + 49) para una prueba que, por lo demás, parece tener una "precisión del 95 %".

Un probador con experiencia en el grupo A podría encontrar una paradoja que en el grupo B, un resultado que normalmente había indicado correctamente una infección ahora suele ser un falso positivo. La confusión de la probabilidad posterior de infección con la probabilidad previa de recibir un falso positivo es un error natural después de recibir un resultado de prueba que amenaza la salud.

Ejemplo 2: conductores ebrios

Un grupo de policías tiene alcoholímetros que muestran una falsa embriaguez en el 5% de los casos en los que el conductor está sobrio. Sin embargo, los alcoholímetros nunca fallan en detectar a una persona verdaderamente borracha. Uno de cada mil conductores conduce ebrio. Supongamos que los agentes de policía detienen a un conductor al azar para administrarle una prueba de alcoholemia. Indica que el conductor está borracho. Suponemos que no sabes nada más sobre ellos. ¿Qué tan alta es la probabilidad de que realmente estén borrachos?

Muchos responderían hasta un 95 %, pero la probabilidad correcta es de aproximadamente un 2 %.

Una explicación para esto es la siguiente: en promedio, por cada 1000 controladores probados,

  • 1 conductor está ebrio, y es 100% seguro que para ese conductor hay un resultado de prueba positivo verdadero, por lo que hay 1 resultado de prueba positivo verdadero
  • 999 conductores no están ebrios, y entre esos conductores hay un 5% de resultados falsos positivos en las pruebas, por lo que hay 49,95 resultados falsos positivos en las pruebas

Por lo tanto, la probabilidad de que uno de los conductores entre los 1 + 49.95 = 50.95 resultados positivos de la prueba realmente esté borracho es { estilo de visualización 1/50,95  aproximadamente 0,019627}.

Sin embargo, la validez de este resultado depende de la validez de la suposición inicial de que el oficial de policía detuvo al conductor realmente al azar, y no debido a una mala conducción. Si esa u otra razón no arbitraria para detener al conductor estuvo presente, entonces el cálculo también incluye la probabilidad de que un conductor ebrio conduzca de manera competente y un conductor no ebrio conduzca de manera (in)competente.

Más formalmente, se puede establecer la misma probabilidad de aproximadamente 0,02 utilizando el teorema de Bayes. El objetivo es encontrar la probabilidad de que el conductor esté ebrio dado que el alcoholímetro indica que está ebrio, lo que se puede representar como{displaystyle p(mathrm {borracho} mid D)}

donde D significa que el alcoholímetro indica que el conductor está ebrio. El teorema de Bayes nos dice que{displaystyle p(mathrm {borracha} mid D)={frac {p(Dmid mathrm {borracha}),p(mathrm {borracha})}{p(D)}}.}

Nos dijeron lo siguiente en el primer párrafo:{displaystyle p(mathrm {borracho})=0.001,}{displaystyle p(mathrm {sobrio})=0.999,}{displaystyle p(Dmid mathrm {borracho})=1.00,}y{displaystyle p(Dmid mathrm {sobrio})=0.05.}

Como puede ver en la fórmula, se necesita p (D) para el teorema de Bayes, que se puede calcular a partir de los valores anteriores utilizando la ley de probabilidad total:{displaystyle p(D)=p(Dmid mathrm {borracho}),p(mathrm {borracho})+p(Dmid mathrm {sobrio}),p(mathrm {sobrio})}

lo que da{displaystyle p(D)=(1,00times 0,001)+(0,05times 0,999)=0,05095.}

Reemplazando estos números en el teorema de Bayes, se encuentra que{displaystyle p(mathrm {borracho} mid D)={frac {1,00times 0,001}{0,05095}}=0,019627.}

Ejemplo 3: Identificación del terrorista

En una ciudad de 1 millón de habitantes que haya 100 terroristas y 999.900 no terroristas. Para simplificar el ejemplo, se supone que todas las personas presentes en la ciudad son habitantes. Así, la tasa de probabilidad base de que un habitante de la ciudad seleccionado al azar sea terrorista es 0.0001, y la tasa de probabilidad base de que ese mismo habitante no sea terrorista es 0.9999. En un intento por atrapar a los terroristas, la ciudad instala un sistema de alarma con una cámara de vigilancia y un software de reconocimiento facial automático.

El software tiene dos tasas de falla del 1%:

  • La tasa de falsos negativos: si la cámara escanea a un terrorista, una campana sonará el 99 % de las veces y no lo hará el 1 % de las veces.
  • La tasa de falsos positivos: si la cámara escanea a un no terrorista, una campana no sonará el 99% del tiempo, pero sonará el 1% del tiempo.

Supongamos ahora que un habitante activa la alarma. ¿Cuál es la probabilidad de que la persona sea un terrorista? En otras palabras, ¿cuál es P(T | B), la probabilidad de que un terrorista haya sido detectado al sonar la campana? Alguien que hiciera la 'falacia de la tasa base' inferiría que hay un 99% de probabilidad de que la persona detectada sea un terrorista. Aunque la inferencia parece tener sentido, en realidad es un mal razonamiento, y un cálculo a continuación mostrará que la probabilidad de un terrorista es en realidad cerca del 1%, no cerca del 99%.

La falacia surge de confundir la naturaleza de dos tasas de falla diferentes. El 'número de no terroristas por 100 terroristas' y el 'número de no terroristas por 100 campanas' son cantidades no relacionadas. Uno no necesariamente es igual al otro, y ni siquiera tienen que ser casi iguales. Para mostrar esto, considere lo que sucede si se instala un sistema de alarma idéntico en una segunda ciudad sin terroristas. Al igual que en la primera ciudad, la alarma suena para 1 de cada 100 habitantes no terroristas detectados, pero a diferencia de la primera ciudad, la alarma nunca suena para un terrorista. Por lo tanto, el 100% de todas las ocasiones en que suena la alarma son para no terroristas, pero ni siquiera se puede calcular una tasa de falsos negativos. El 'número de no terroristas por 100 campanas' en esa ciudad es 100, pero P(T | B) = 0%.

Imagina que toda la población de la primera ciudad de un millón de personas pasa frente a la cámara. Alrededor de 99 de los 100 terroristas activarán la alarma, y ​​también lo harán alrededor de 9.999 de los 999.900 no terroristas. Por tanto, unas 10.098 personas dispararán la alarma, de las cuales unas 99 serán terroristas. Por lo tanto, la probabilidad de que una persona que active la alarma sea realmente un terrorista es de solo 99 entre 10 098, que es menos del 1 %, y muy, muy por debajo de nuestra suposición inicial del 99 %.

La falacia de la tasa base es tan engañosa en este ejemplo porque hay muchos más no terroristas que terroristas, y el número de falsos positivos (no terroristas escaneados como terroristas) es mucho mayor que los verdaderos positivos (terroristas escaneados como terroristas).

Hallazgos en psicología

En experimentos, se ha encontrado que las personas prefieren información individualizada sobre información general cuando la primera está disponible.

En algunos experimentos, se pidió a los estudiantes que estimaran los promedios de calificaciones (GPA, por sus siglas en inglés) de estudiantes hipotéticos. Cuando se les daban estadísticas relevantes sobre la distribución del GPA, los estudiantes tendían a ignorarlas si se les daba información descriptiva sobre el estudiante en particular, incluso si la nueva información descriptiva era obviamente de poca o ninguna relevancia para el desempeño escolar. Este hallazgo se ha utilizado para argumentar que las entrevistas son una parte innecesaria del proceso de admisión a la universidad porque los entrevistadores no pueden elegir candidatos exitosos mejor que las estadísticas básicas.

Los psicólogos Daniel Kahneman y Amos Tversky intentaron explicar este hallazgo en términos de una regla simple o "heurística" llamada representatividad. Argumentaron que muchos juicios relacionados con la probabilidad, o con la causa y el efecto, se basan en cuán representativa es una cosa de otra, o de una categoría. Kahneman considera que el descuido de la tasa base es una forma específica de descuido de la extensión. Richard Nisbett ha argumentado que algunos sesgos de atribución, como el error de atribución fundamental, son instancias de la falacia de la tasa base: las personas no usan la "información de consenso" (la "tasa base") sobre cómo se comportaron otros en situaciones similares y, en cambio, prefieren atribuciones disposicionales más simples..

Existe un debate considerable en psicología sobre las condiciones bajo las cuales las personas aprecian o no la información de tasa base. Los investigadores del programa de heurística y sesgos han hecho hincapié en los hallazgos empíricos que muestran que las personas tienden a ignorar las tasas base y hacen inferencias que violan ciertas normas del razonamiento probabilístico, como el teorema de Bayes. La conclusión extraída de esta línea de investigación fue que el pensamiento probabilístico humano es fundamentalmente defectuoso y propenso a errores. Otros investigadores han enfatizado el vínculo entre los procesos cognitivos y los formatos de información, argumentando que tales conclusiones generalmente no están garantizadas.

Considere nuevamente el Ejemplo 2 de arriba. La inferencia requerida es estimar la probabilidad (posterior) de que un conductor (elegido al azar) esté ebrio, dado que la prueba del alcoholímetro es positiva. Formalmente, esta probabilidad se puede calcular usando el teorema de Bayes, como se muestra arriba. Sin embargo, existen diferentes formas de presentar la información relevante. Considere la siguiente variante formalmente equivalente del problema: 1 de cada 1000 conductores conduce ebrio. Los alcoholímetros nunca fallan en detectar a una persona verdaderamente borracha. Para 50 de los 999 conductores que no están borrachos, el alcoholímetro muestra falsamente la embriaguez. Supongamos que los policías detienen a un conductor al azar y lo obligan a tomar una prueba de alcoholemia. Indica que están borrachos. Suponemos que no sabes nada más sobre ellos. ¿Qué tan alta es la probabilidad de que realmente estén borrachos?

En este caso, la información numérica relevante — p (borracho), p (D | borracho), p (D | sobrio)—se presenta en términos de frecuencias naturales con respecto a una cierta clase de referencia (ver problema de clase de referencia). Los estudios empíricos muestran que las inferencias de las personas se corresponden más estrechamente con la regla de Bayes cuando la información se presenta de esta manera, lo que ayuda a superar el descuido de la tasa base en profanos y expertos. En consecuencia, organizaciones como la Colaboración Cochrane recomiendan utilizar este tipo de formato para comunicar estadísticas de salud.Enseñar a las personas a traducir este tipo de problemas de razonamiento bayesiano a formatos de frecuencia natural es más efectivo que simplemente enseñarles a introducir probabilidades (o porcentajes) en el teorema de Bayes. También se ha demostrado que las representaciones gráficas de frecuencias naturales (p. ej., conjuntos de iconos) ayudan a las personas a hacer mejores inferencias.

¿Por qué son útiles los formatos de frecuencia natural? Una razón importante es que este formato de información facilita la inferencia requerida porque simplifica los cálculos necesarios. Esto se puede ver cuando se usa una forma alternativa de calcular la probabilidad requerida p (borracho | D):{displaystyle p(mathrm {borracho} mid D)={frac {N(mathrm {borracho} cap D)}{N(D)}}={frac {1}{51}}= 0.0196}

donde N (borracho ∩ D) denota el número de conductores que están ebrios y obtienen un resultado positivo en el alcoholímetro, y N (D) denota el número total de casos con un resultado positivo en el alcoholímetro. La equivalencia de esta ecuación con la anterior se deriva de los axiomas de la teoría de la probabilidad, según los cuales N (borracho ∩ D) = N × p (D | borracho) × p(ebrio). Es importante destacar que, aunque esta ecuación es formalmente equivalente a la regla de Bayes, no es psicológicamente equivalente. El uso de frecuencias naturales simplifica la inferencia porque la operación matemática requerida se puede realizar en números naturales, en lugar de fracciones normalizadas (es decir, probabilidades), porque hace que el alto número de falsos positivos sea más transparente y porque las frecuencias naturales exhiben un "conjunto anidado". estructura".

No todos los formatos de frecuencia facilitan el razonamiento bayesiano. Las frecuencias naturales se refieren a la información de frecuencia que resulta del muestreo natural, que conserva la información de tasa base (por ejemplo, el número de conductores ebrios cuando se toma una muestra aleatoria de conductores). Esto es diferente del muestreo sistemático, en el que las tasas base se fijan a priori (por ejemplo, en experimentos científicos). En este último caso no es posible inferir la probabilidad posterior p (borrachos | prueba positiva) al comparar el número de conductores que están ebrios y dan positivo en la prueba con el número total de personas que obtienen un resultado positivo en el alcoholímetro, porque la información de la tasa base no se conserva y debe volver a introducirse explícitamente utilizando el teorema de Bayes.

Contenido relacionado

Punto sin retorno

Argumentum ad antiquitatem

La apelación a la tradición es una afirmación en la que una tesis se considera correcta sobre la base de la correlación con la tradición pasada o...

Significados de probabilidad

La palabra probabilidad se ha utilizado de diversas formas desde que se aplicó por primera vez al estudio matemático de los juegos de azar. ¿La...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save