Prueba de chi-cuadrado
Una prueba de chi-cuadrado (también chi-cuadrado o χ2 test) es una prueba de hipótesis estadística utilizada en el análisis de tablas de contingencia cuando los tamaños de muestra son grandes. En términos más simples, esta prueba se usa principalmente para examinar si dos variables categóricas (dos dimensiones de la tabla de contingencia) son independientes para influir en la estadística de prueba (valores dentro de la tabla). La prueba es válida cuando el estadístico de prueba es chi-cuadrado distribuido bajo la hipótesis nula, específicamente la prueba chi-cuadrado de Pearson y variantes de la misma. La prueba chi-cuadrado de Pearson se utiliza para determinar si existe una diferencia estadísticamente significativa entre las frecuencias esperadas y las frecuencias observadas en una o más categorías de una tabla de contingencia. Para tablas de contingencia con tamaños de muestra más pequeños, se utiliza en su lugar una prueba exacta de Fisher.
En las aplicaciones estándar de esta prueba, las observaciones se clasifican en clases mutuamente excluyentes. Si la hipótesis nula de que no hay diferencias entre las clases de la población es verdadera, la estadística de prueba calculada a partir de las observaciones sigue una distribución de frecuencia χ2. El propósito de la prueba es evaluar la probabilidad de que las frecuencias observadas supongan que la hipótesis nula es verdadera.
Las estadísticas de prueba que siguen una distribución χ2 ocurren cuando las observaciones son independientes. También hay pruebas de χ2 para probar la hipótesis nula de independencia de un par de variables aleatorias basadas en las observaciones de los pares.
Pruebas de chi-cuadrado a menudo se refiere a pruebas para las cuales la distribución de la estadística de prueba se aproxima a la distribución χ2 asintóticamente, lo que significa que la distribución muestral (si la hipótesis nula es verdadera) del estadístico de prueba se aproxima cada vez más a una distribución chi-cuadrado a medida que aumenta el tamaño de la muestra.
Historia
En el siglo XIX, los métodos analíticos estadísticos se aplicaban principalmente en el análisis de datos biológicos y era costumbre que los investigadores supusieran que las observaciones seguían una distribución normal, como Sir George Airy y Mansfield Merriman, cuyos trabajos fueron criticados por Karl Pearson en su artículo de 1900.
A finales del siglo XIX, Pearson notó la existencia de una asimetría significativa en algunas observaciones biológicas. Para modelar las observaciones independientemente de si son normales o sesgadas, Pearson, en una serie de artículos publicados entre 1893 y 1916, ideó la distribución de Pearson, una familia de distribuciones de probabilidad continuas, que incluye la distribución normal y muchas distribuciones sesgadas, y propuso un método de análisis estadístico que consiste en utilizar la distribución de Pearson para modelar la observación y realizar una prueba de bondad de ajuste para determinar qué tan bien se ajusta realmente el modelo a las observaciones.
Prueba chi-cuadrado de Pearson
En 1900, Pearson publicó un artículo sobre la prueba χ2, que se considera una de las bases de las estadísticas modernas. En este artículo, Pearson investigó una prueba de bondad de ajuste.
Suponga que n observaciones en una muestra aleatoria de una población se clasifican en k clases mutuamente excluyentes con sus respectivos números observados xi (para i = 1,2,…,k), y una hipótesis nula da la probabilidad pi que una observación cae en el iésima clase. Entonces tenemos los números esperados mi = npi para todos los i, donde
- .. i=1kpi=1.. i=1kmi=n.. i=1kpi=n{displaystyle {begin{aligned} ¿Por qué? - ¿Qué? ¿Por qué?
Pearson propuso que, bajo la circunstancia de que la hipótesis nula sea correcta, como n → ∞ la distribución límite de la cantidad dada a continuación es la Distribución χ2.
- X2=.. i=1k()xi− − mi)2mi=.. i=1kxi2mi− − n{displaystyle X^{2}=sum ¿Por qué? ¿Por qué? {fn} {fn} {fn}}}
Pearson se ocupó primero del caso en el que los números esperados mi son suficientemente grandes números en todas las celdas, asumiendo que cada observación xi puede tomarse como distribuida normalmente y llegar al resultado que, en el límite a medida que n se vuelve grande, X2 sigue a χ2 con k − 1 grados de libertad.
Sin embargo, Pearson consideró a continuación el caso en el que los números esperados dependían de los parámetros que debían estimarse a partir de la muestra y sugirió que, con la notación de mi siendo los verdaderos números esperados y m′i siendo los números esperados estimados, la diferencia
- X2− − X.2=.. i=1kxi2mi− − .. i=1kxi2mi.{displaystyle X^{2}-{X'} {2}=sum ¿Por qué? {x_{i}{2} {m_{i}} ¿Por qué? {fnK}} {fn}} {fn}}} {fnK}}}} {cH}}}}} {fn}}}}} {fn}}}}}} {fn}} {fn}}}}}}}}}}}}} {cH}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {c}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} {c}}}}}}}}}}}}}}}}}}}}}}} {c}}}}}}}} {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}
normalmente será positivo y lo suficientemente pequeño como para omitirlo. En una conclusión, Pearson argumentó que si consideramos X′2 como también distribuido como distribución χ2 con k − 1 grados de libertad, el error en esta aproximación no afectaría las decisiones prácticas. Esta conclusión causó cierta controversia en las aplicaciones prácticas y no se resolvió durante 20 años hasta los artículos de Fisher de 1922 y 1924.
Otros ejemplos de pruebas de chi-cuadrado
Una estadística de prueba que sigue exactamente una distribución de chi-cuadrado es la prueba de que la varianza de una población normalmente distribuida tiene un valor dado basado en una varianza de muestra. Tales pruebas son poco comunes en la práctica porque la verdadera varianza de la población generalmente se desconoce. Sin embargo, existen varias pruebas estadísticas en las que la distribución chi-cuadrado es aproximadamente válida:
Prueba exacta de Fisher
Para ver una prueba exacta utilizada en lugar de la prueba de independencia de chi-cuadrado 2 × 2, consulte la prueba exacta de Fisher.
Prueba binomial
Para ver una prueba exacta utilizada en lugar de la prueba de bondad de ajuste de chi-cuadrado 2 × 1, consulte la prueba binomial.
Otras pruebas de chi-cuadrado
- Cochran-Mantel-Haenszel prueba de chi-squared.
- La prueba de McNemar, utilizada en ciertos 2 × 2 tablas con pareado
- Prueba de aditividad de Tukey
- La prueba portmanteau en análisis de series temporales, pruebas para la presencia de autocorrelación
- Pruebas de ratio de probabilidad en el modelado estadístico general, para probar si hay evidencia de la necesidad de pasar de un modelo simple a otro más complicado (donde el modelo simple está anidado dentro del complicado).
Corrección de continuidad de Yates
Usar la distribución de chi-cuadrado para interpretar la estadística de chi-cuadrado de Pearson requiere asumir que la probabilidad discreta de las frecuencias binomiales observadas en la tabla se puede aproximar mediante la distribución continua de chi-cuadrado. Esta suposición no es del todo correcta e introduce algún error.
Para reducir el error de aproximación, Frank Yates sugirió una corrección por continuidad que ajusta la fórmula de la prueba chi-cuadrado de Pearson restando 0,5 de la diferencia absoluta entre cada valor observado y su valor esperado en un 2 × 2 tabla de contingencia. Esto reduce el valor de chi-cuadrado obtenido y por lo tanto aumenta su valor de p.
Prueba de chi-cuadrado para la varianza en una población normal
Si se toma una muestra de tamaño n de una población que tiene una distribución normal, entonces hay un resultado (ver distribución de la varianza de la muestra) que permite contrastar si la varianza de la población tiene un valor predeterminado. Por ejemplo, un proceso de fabricación podría haber estado en condiciones estables durante un período prolongado, lo que permitiría determinar un valor para la varianza esencialmente sin error. Supongamos que se está probando una variante del proceso, lo que da lugar a una pequeña muestra de n elementos del producto cuya variación se va a probar. La estadística de prueba T en este caso podría configurarse para que sea la suma de cuadrados sobre la media de la muestra, dividida por el valor nominal de la varianza (es decir, el valor a probar como tenencia). Entonces T tiene una distribución chi-cuadrado con n − 1 grados de libertad. Por ejemplo, si el tamaño de la muestra es 21, la región de aceptación para T con un nivel de significancia del 5 % está entre 9,59 y 34,17.
Ejemplo de prueba de chi-cuadrado para datos categóricos
Supongamos que hay una ciudad de 1.000.000 de habitantes con cuatro barrios: A, B, C y D. Se toma una muestra aleatoria de 650 residentes de la ciudad y se registra su ocupación como "cuello blanco", "cuello azul" o "no cuello". La hipótesis nula es que el barrio de residencia de cada persona es independiente de la clasificación ocupacional de la persona. Los datos se tabulan como:
A B C D Total Collar blanco 90 60 104 95 349 Collar azul 30 50 51 20 151 Sin collar 30 40 45 35 150 Total 150 150 200 150 650
Tomemos la muestra que vive en el vecindario A, 150, para estimar qué proporción del total de 1,000,000 vive en el vecindario A. De manera similar, tomamos 349/650 para estimar qué proporción de los 1.000.000 son trabajadores administrativos. Por el supuesto de independencia bajo la hipótesis deberíamos "esperar" el número de trabajadores administrativos en el vecindario A que se
- 150× × 349650.. 80.54{displaystyle 150times {frac {349}approx 80.54}
Entonces en esa "celda" de la mesa, tenemos
- ()observado− − previstos)2previstos=()90− − 80.54)280.54.. 1.11{displaystyle {frac {left {text{observed}-{text{expected}right)}{2}}{text{expected}}}}={frac {left(90-80.54right)}{80.54}}}}approx 1.11}}
La suma de estas cantidades sobre todas las células es la estadística de prueba; en este caso, .. 24.57{displaystyle approx 24.57}. Bajo la hipótesis nula, esta suma tiene aproximadamente una distribución de chi-squared cuyo número de grados de libertad es
- ()Número de filas− − 1)()Número de columnas− − 1)=()3− − 1)()4− − 1)=6{displaystyle ({text{number of rows}}-1)({text{number of columns}-1)=(3-1)(4-1)=6}
Si la estadística de prueba es increíblemente grande de acuerdo con esa distribución de chi-cuadrado, entonces se rechaza la hipótesis nula de independencia.
Un tema relacionado es una prueba de homogeneidad. Suponga que en lugar de dar a cada residente de cada uno de los cuatro vecindarios la misma oportunidad de inclusión en la muestra, decidimos de antemano cuántos residentes de cada vecindario incluir. Entonces, cada residente tiene la misma posibilidad de ser elegido que todos los residentes del mismo barrio, pero los residentes de diferentes barrios tendrían diferentes probabilidades de ser elegidos si los cuatro tamaños de muestra no son proporcionales a las poblaciones de los cuatro barrios. En tal caso, estaríamos probando la "homogeneidad" en lugar de "independencia". La pregunta es si las proporciones de trabajadores de cuello azul, de cuello blanco y sin cuello en los cuatro barrios son las mismas. Sin embargo, la prueba se realiza de la misma manera.
Aplicaciones
En el criptoanálisis, la prueba de chi-cuadrado se usa para comparar la distribución del texto sin formato y (posiblemente) el texto cifrado descifrado. El valor más bajo de la prueba significa que el descifrado fue exitoso con alta probabilidad. Este método se puede generalizar para resolver problemas criptográficos modernos.
En bioinformática, la prueba de chi-cuadrado se usa para comparar la distribución de ciertas propiedades de genes (p. ej., contenido genómico, tasa de mutación, agrupación de redes de interacción, etc.) que pertenecen a diferentes categorías (p. ej., genes de enfermedades, genes esenciales, genes en un determinado cromosoma, etc.).
Contenido relacionado
Huesos de napier
Cristian huygens
Dimensión