Tasa de falsos positivos

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
En estadística, al realizar comparaciones múltiples, la tasa de falsos positivos (también conocida como fall-out o tasa de falsas alarmas) es la probabilidad de rechazar falsamente la hipótesis nula para una prueba específica. La tasa de falsos positivos se calcula como el cociente entre el número de eventos negativos categorizados erróneamente como positivos (falsos positivos) y el número total de eventos negativos reales (independientemente de la clasificación).La tasa de falsos positivos (o "tasa de falsas alarmas") suele referirse a la expectativa de la tasa de falsos positivos.

Definición

La falsa tasa positiva (falsa tasa de alarma) es

Donde es el número de falsos positivos, es el número de verdaderos negativos y es el número total de negativos de la verdad terrestre.

El nivel de significancia utilizado para probar cada hipótesis se establece en función de la forma de inferencia (inferencia simultánea vs. inferencia selectiva) y sus criterios de apoyo (por ejemplo, FWER o FDR), predeterminados por el investigador.

Al realizar múltiples comparaciones en un marco estadístico como el anterior, el falsa relación positiva (también conocido como falsa tasa de alarma, en oposición falsa alarma ratio - FAR) generalmente se refiere a la probabilidad de rechazar falsamente la hipótesis nula para una prueba particular. Usando la terminología sugerida aquí, es simplemente .

Desde V es una variable aleatoria y es una constante (), el falso positivo ratio es también una variable aleatoria, que oscila entre 0–1.
El tasa positiva falsa (o "falsa tasa de alarma") generalmente se refiere a expectativa de la falsa relación positiva, expresada por .

Vale la pena notar que las dos definiciones ("falsa relación positiva" / "falsa tasa positiva") son algo intercambiables. Por ejemplo, en el artículo citado sirve como el falso "trato" positivo en lugar de como su "ratio".

Clasificación de múltiples pruebas de hipótesis

La siguiente tabla define los posibles resultados al probar múltiples hipótesis nulas. Supongamos que tenemos un número m de hipótesis nulas, denotadas por: H1, H2,..., Hm. Mediante una prueba estadística, rechazamos la hipótesis nula si la prueba se declara significativa. No rechazamos la hipótesis nula si la prueba no es significativa. Al sumar cada tipo de resultado sobre todos los Hi, obtenemos las siguientes variables aleatorias:

La hipótesis nula es verdadera (H0) La hipótesis alternativa es verdadera (H)A) Total
La prueba se declara significativa VSR
El examen se declara no significativo UT
Total m
  • m es el número total de hipótesis probadas
  • es el número de verdaderas hipótesis nulas, un parámetro desconocido
  • es el número de verdaderas hipótesis alternativas
  • V es el número de falsos positivos (error del tipo I) (también llamado "descubrimientos falsos")
  • S es el número de verdaderos positivos (también llamados "verdaderos descubrimientos")
  • T es el número de falsos negativos (error tipo II)
  • U es el número de verdaderos negativos
  • es el número de hipótesis nulas rechazadas (también llamadas "descubrimientos", ya sea verdadero o falso)

In m pruebas de hipótesis de las cuales son verdaderas hipótesis nulas, R es una variable aleatoria observable, y S, T, U, y V son variables aleatorias inservibles.

Comparación con otras tasas de error

Si bien la tasa de falsos positivos es matemáticamente igual a la tasa de error tipo I, se considera un término independiente por las siguientes razones:
  • La tasa de error tipo I se asocia a menudo con el a-priori el nivel de significación del investigador: el nivel de significación representa una tasa de error aceptable considerando que todas las hipótesis nulas son verdaderas (la hipótesis "null global"). Por lo tanto, la elección de un nivel de significación puede ser algo arbitraria (es decir, la fijación del 10% (0.1), 5% (0.05), 1% (0.01), etc.)
A diferencia de eso, la falsa tasa positiva se asocia con una post-prior resultado, que es el número esperado de falsos positivos dividido por el número total de hipótesis bajo el real combinación de hipótesis nulas verdaderas y no verdaderas (desgarrando la hipótesis "null global"). Puesto que la tasa positiva falsa es un parámetro que no es controlado por el investigador, no se puede identificar con el nivel de significación.
  • Además, la tasa positiva falsa se utiliza generalmente en relación con un dispositivo de prueba médica o diagnóstico (es decir, "la tasa positiva falsa de un determinado dispositivo de diagnóstico es 1%"), mientras que el error tipo I es un término asociado con pruebas estadísticas, donde el significado de la palabra "positivo" no es tan claro (es decir, "el error tipo I de una prueba es 1%").

La tasa positiva falsa tampoco debe confundirse con la tasa de error familiar, que se define como . A medida que crece el número de pruebas, la tasa de error familiar generalmente converge a 1 mientras que la tasa positiva falsa permanece fija.

Por último, es importante señalar la profunda diferencia entre el falso índice positivo y el falso índice de descubrimiento: mientras que el primero se define como , el segundo se define como .

Véase también

  • Falsos positivos y falsos negativos
  • Tasa de cobertura falsa
  • Falsa tasa de descubrimiento
  • Sensibilidad y especificidad
  • Matriz de confusión
  • Cuadro de expertos

Referencias

  1. ^ a b "Forecast Verification methods Across Time and Space Scales". WWRP/WGNE Joint Working Group on Forecast Verification Research. Archivado desde el original el 27 de diciembre de 2024. Retrieved 8 de enero 2025.
  2. ^ Burke, Donald; Brundage, John; Redfield, Robert (1988). "Measurement of the False Positive Rate in a Screening Program for Human Immunodeficiency Virus Infections". El New England Journal of Medicine. 319 (15): 961 –964. doi:10.1056/NEJM198810133191501. PMID 3419477.
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save