Corrección de Yates para la continuidad

Compartir Imprimir Citar

En estadística, la corrección de continuidad de Yates (o la prueba de chi-cuadrado de Yates) se utiliza en ciertas situaciones cuando se prueba la independencia en una tabla de contingencia. Esto me pertenece en corregir el error introducido al suponer que las probabilidades discretas de las frecuencias de la tabla se pueden aproximar mediante una distribución continua (chi-cuadrado). En algunos casos, la corrección de Yates puede ajustarse demasiado, por lo que su uso actual es limitado.

Corrección por error de aproximación

Usar la distribución de chi-cuadrado para interpretar la estadística de chi-cuadrado de Pearson requiere asumir que la probabilidad discreta de las frecuencias binomiales observadas en la tabla se puede aproximar mediante la distribución continua de chi-cuadrado. Esta suposición no es del todo correcta e introduce algún error.

Para reducir el error de aproximación, Frank Yates, un estadístico inglés, sugirió una corrección por continuidad que ajusta la fórmula de la prueba chi-cuadrado de Pearson restando 0,5 de la diferencia entre cada valor observado y su valor esperado. en una tabla de contingencia de 2 × 2. Esto reduce el valor de chi-cuadrado obtenido y por lo tanto aumenta su valor de p.

El efecto de la corrección de Yates es evitar la sobrestimación de la importancia estadística de los datos pequeños. Esta fórmula se utiliza principalmente cuando al menos una celda de la tabla tiene un recuento esperado inferior a 5. Desafortunadamente, la corrección de Yates puede tender a corregir en exceso. Esto puede dar como resultado un resultado demasiado conservador que no rechaza la hipótesis nula cuando debería (un error de tipo II). Por lo tanto, se sugiere que la corrección de Yates es innecesaria incluso con tamaños de muestra bastante pequeños, como:

sum _{{i=1}}^{N}O_{i}=20,

La siguiente es la versión corregida de Yates de las estadísticas chi-cuadrado de Pearson:

chi _{{text{Yates}}}^{2}=sum _{{i=1}}^{{N}}{(|O_{i}-E_{i}|-0.5)^{2} over E_{i}}

donde:

O_i = frecuencia observada

E_i = una frecuencia esperada (teórica), afirmada por la hipótesis nula

N = número de eventos distintos

Mesa 2×2

Como atajo, para una tabla de 2 × 2 con las siguientes entradas:

	S	F
A	a	b	a+ b
B	c	d	c+d
	a+c	b+d	N

{displaystyle chi _{text{Yates}}^{2}={frac {N(|ad-bc|-N/2)^{2}}{(a+b)(c+d)(a+c)(b+d)}}.}

En algunos casos, esto es mejor.

chi _{{text{Yates}}}^{2}={frac {N(max(0,|ad-bc|-N/2))^{2}}{N_{S}N_{F}N_{A}N_{B}}}.

Corrección de Yates para la continuidad

Corrección por error de aproximación

Mesa 2×2

Distribución exponencial

Método empírico de Bayes

Prueba de kuiper