Prueba Z

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Examen estadístico

Una prueba Z es cualquier prueba estadística para la cual la distribución de la estadística de prueba bajo la hipótesis nula se puede aproximar mediante una distribución normal. Las pruebas Z comprueban la media de una distribución. Para cada nivel de significación en el intervalo de confianza, la prueba Z tiene un único valor crítico (por ejemplo, 1,96 para 5 % de dos colas), lo que la hace más conveniente que la prueba t de Student. prueba cuyos valores críticos están definidos por el tamaño de la muestra (a través de los grados de libertad correspondientes). Tanto la prueba Z como la prueba t de Student tienen similitudes en el sentido de que ambas ayudan a determinar la importancia de un conjunto de datos. Sin embargo, la prueba z rara vez se usa en la práctica porque la desviación de la población es difícil de determinar.

Aplicabilidad

Debido al teorema del límite central, muchas estadísticas de prueba tienen una distribución aproximadamente normal para muestras grandes. Por lo tanto, muchas pruebas estadísticas se pueden realizar convenientemente como pruebas Z aproximadas si el tamaño de la muestra es grande o se conoce la varianza de la población. Si se desconoce la varianza de la población (y, por lo tanto, debe estimarse a partir de la muestra misma) y el tamaño de la muestra no es grande (n < 30), la t-test puede ser más apropiado (en algunos casos, n < 50, como se describe a continuación).

Procedimiento

Cómo realizar una prueba Z cuando T es una estadística que tiene una distribución aproximadamente normal bajo la hipótesis nula es la siguiente:

Primero, estime el valor esperado μ de T bajo la hipótesis nula y obtenga una estimación s de la desviación estándar de T.

En segundo lugar, determine las propiedades de T: una cola o dos colas.

Para hipótesis nula H0: μ≥μ0 vs hipótesis alternativa H1: μ<μ0 es inferior/de cola izquierda (una cola).

Para hipótesis nula H0: μ≤μ0 vs hipótesis alternativa H1: μ>μ0 es de cola superior/derecha (una cola).

Para hipótesis nula H0: μ=μ0 vs hipótesis alternativa H1: μ≠μ0 tiene dos colas.

Tercero, calcule la puntuación estándar:

Z=()X̄ ̄ − − μ μ 0)σ σ ,{displaystyle Z={bar {}-mu}{sigma}}}}}}
ZZZ

Uso en pruebas de ubicación

  1. El término "Z-test" se utiliza a menudo para referirse específicamente a la prueba de localización de un solo muestreo que compara la media de un conjunto de mediciones a una constante dada cuando se conoce la varianza de la muestra. Por ejemplo, si los datos observados X1,... Xn (i) independent, (ii) have a common mean μ, and (iii) have a common variation σ2, entonces el promedio de la muestra X tiene media μ y varianza σ σ 2n{displaystyle {frac {sigma }{n}} {fn}} {fn}}.
  2. La hipótesis nula es que el valor medio de X es un número dado μ0. Podemos usar Xcomo un test-estadístico, rechazando la hipótesis nula si Xμ0 es grande.
  3. Para calcular la estadística estandarizada Z=()X̄ ̄ − − μ μ 0)s{displaystyle Z={frac {bar {X}-mu}{}}} {}}} {f}}} {f}}}}}, necesitamos saber o tener un valor aproximado para σ2, desde el cual podemos calcular s2=σ σ 2n{displaystyle S^{2}={frac {sigma ^{2} {n}}} {s}} {s}}}} {s}}}}}} {sigma }} {}}}}}}}} {}}} {sigma. En algunas aplicaciones, σ2 es conocido, pero esto es raro.
  4. Si el tamaño de la muestra es moderado o grande, podemos sustituir la variación de la muestra para σ2, dar un plug-in Prueba. La prueba resultante no será exacta Z- Prueba ya que la incertidumbre en la varianza de la muestra no se contabiliza—cuando sea, será una buena aproximación a menos que el tamaño de la muestra sea pequeño.
  5. Una prueba t se puede utilizar para contabilizar la incertidumbre en la varianza de la muestra cuando los datos son exactamente normales.
  6. Diferencia entre la prueba Z y la prueba t: La prueba Z se utiliza cuando el tamaño de la muestra es grande (n confianza50), o la varianza de población se conoce. t-test se utiliza cuando el tamaño de la muestra es pequeño (n observado50) y la varianza de población es desconocida.
  7. No existe una constante universal en la que el tamaño de la muestra se considera generalmente lo suficientemente grande como para justificar el uso de la prueba de plug-in. Reglas típicas del pulgar: el tamaño de la muestra debe ser 50 observaciones o más.
  8. Para grandes tamaños de muestra, el t- procedimiento de prueba da casi idéntico p- los valores como Z- procedimiento de prueba.
  9. Otras pruebas de ubicación que se pueden realizar como Z- Las pruebas son la prueba de localización de dos muestras y la prueba de diferencia emparejada.

Condiciones

Para que la prueba Z sea aplicable, se deben cumplir ciertas condiciones.

  • Los parámetros de Nuisance deben ser conocidos, o estimados con alta precisión (un ejemplo de un parámetro de molestia sería la desviación estándar en una prueba de ubicación de un muestreo). Z- Las pruebas se centran en un solo parámetro, y tratan a todos los demás parámetros desconocidos como ser fijos en sus verdaderos valores. En la práctica, debido a la teorema de Slutsky, "plugging in" estimaciones consistentes de los parámetros de molestia pueden justificarse. Sin embargo, si el tamaño de la muestra no es lo suficientemente grande para que estas estimaciones sean razonablemente precisas, Z- La prueba no puede funcionar bien.
  • La estadística de prueba debe seguir una distribución normal. En general, se hace un llamamiento al teorema del límite central para justificar suponiendo que una estadística de prueba varía normalmente. Hay una gran cantidad de investigación estadística sobre la cuestión de cuándo una estadística de prueba varía aproximadamente normalmente. Si la variación de la estadística de prueba es fuertemente no normal, a Z- La prueba no debe usarse.

Si se conectan estimaciones de parámetros molestos como se mencionó anteriormente, es importante usar estimaciones apropiadas para la forma en que se muestrearon los datos. En el caso especial de las pruebas Z para el problema de ubicación de una o dos muestras, la desviación estándar de la muestra habitual solo es adecuada si los datos se recopilaron como una muestra independiente.

En algunas situaciones, es posible diseñar una prueba que tenga en cuenta adecuadamente la variación en las estimaciones de complemento de los parámetros molestos. En el caso de problemas de ubicación de una y dos muestras, una prueba t hace esto.

Ejemplo

Suponga que en una región geográfica particular, la media y la desviación estándar de las puntuaciones en una prueba de lectura son 100 puntos y 12 puntos, respectivamente. Nuestro interés está en los puntajes de 55 estudiantes en una escuela en particular que recibieron un puntaje promedio de 96. Podemos preguntarnos si este puntaje promedio es significativamente más bajo que el promedio regional, es decir, ¿los estudiantes de esta escuela son comparables con un puntaje aleatorio simple? muestra de 55 estudiantes de la región en su conjunto, o sus puntajes son sorprendentemente bajos?

Primero calcule el error estándar de la media:

SE=σ σ n=1255=127.42=1.62{displaystyle mathrm {SE} ={frac {sigma {fnK}= {fnMicroc {12}}= {fnMicroc {12}}= {7.42}=1.62}

Donde σ σ {displaystyle {sigma}} es la desviación estándar de población.

A continuación, calcule la puntuación z, que es la distancia desde la media de la muestra hasta la media de la población en unidades del error estándar:

z=M− − μ μ SE=96− − 1001.62=− − 2.47{displaystyle z={frac {mu}{mathrm {}={frac {96-100}{1.62}}=-2.47}

En este ejemplo, tratamos la media y la varianza de la población como conocidas, lo que sería apropiado si se evaluara a todos los estudiantes de la región. Cuando se desconocen los parámetros de la población, se debe realizar una prueba t de Student.

La puntuación media de la clase es 96, que es −2,47 unidades de error estándar de la media poblacional de 100. Al buscar la puntuación z en una tabla de probabilidad acumulada de distribución normal estándar, encontramos que la probabilidad de observar un valor normal estándar por debajo de −2,47 es aproximadamente 0,5 − 0,4932 = 0,0068. Este es el valor p unilateral para la hipótesis nula de que los 55 estudiantes son comparables a una muestra aleatoria simple de la población de todos los examinados. El valor de p de dos lados es aproximadamente 0,014 (el doble del valor de p de un lado).

Otra forma de expresar las cosas es que, con una probabilidad de 1 − 0,014 = 0,986, una muestra aleatoria simple de 55 estudiantes tendría una puntuación media en el examen dentro de las 4 unidades de la media de la población. También podríamos decir que con un 98,6% de confianza rechazamos la hipótesis nula de que los 55 examinados son comparables a una muestra aleatoria simple de la población de examinados.

La prueba Z nos dice que los 55 estudiantes de interés tienen una puntuación media inusualmente baja en comparación con la mayoría de las muestras aleatorias simples de tamaño similar de la población de examinados. Una deficiencia de este análisis es que no considera si el tamaño del efecto de 4 puntos es significativo. Si en lugar de un salón de clases, consideráramos una subregión que contiene 900 estudiantes cuyo puntaje promedio fue 99, se observaría casi el mismo puntaje z y valor p. Esto muestra que si el tamaño de la muestra es lo suficientemente grande, las diferencias muy pequeñas del valor nulo pueden ser estadísticamente significativas. Consulte la prueba de hipótesis estadística para obtener más información sobre este tema.

Pruebas Z que no sean pruebas de ubicación

Las pruebas de ubicación son las más conocidas Z- Pruebas. Otra clase de Z- Las pruebas surgen en la estimación de probabilidad máxima de los parámetros en un modelo estadístico paramétrico. Las estimaciones de probabilidad máxima son aproximadamente normales en determinadas condiciones, y su varianza asintomática se puede calcular en términos de la información de Fisher. La estimación de probabilidad máxima dividida por su error estándar se puede utilizar como una estadística de prueba para la hipótesis nula de que el valor demográfico del parámetro equivale a cero. Más generalmente, si Silencio Silencio ^ ^ {displaystyle {hat {theta } es la estimación de probabilidad máxima de un parámetro θ, y θ0 es el valor de θ bajo la hipótesis nula,

Silencio Silencio ^ ^ − − Silencio Silencio 0SE()Silencio Silencio ^ ^ ){fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f}f}fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {fnMicrosoft {f}fn ♪♪ ¿Qué?

puede usarse como una estadística de prueba Z.

Al utilizar una prueba Z para estimaciones de máxima verosimilitud, es importante tener en cuenta que la aproximación normal puede ser deficiente si el tamaño de la muestra no es lo suficientemente grande. Aunque no existe una regla simple y universal que indique qué tan grande debe ser el tamaño de la muestra para usar una prueba Z, la simulación puede dar una buena idea de si una prueba Z es apropiado en una situación dada.

Las pruebas

Z se emplean siempre que se pueda argumentar que una estadística de prueba sigue una distribución normal bajo la hipótesis nula de interés. Muchas estadísticas de prueba no paramétricas, como las estadísticas U, son aproximadamente normales para tamaños de muestra lo suficientemente grandes y, por lo tanto, a menudo se realizan como pruebas Z.

Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save