Tamaño de la muestra

Compartir Imprimir Citar

Determinación del tamaño de la muestra es el acto de elegir el número de observaciones o réplicas para incluir en una muestra estadística. El tamaño de la muestra es una característica importante de cualquier estudio empírico en el que el objetivo sea hacer inferencias sobre una población a partir de una muestra. En la práctica, el tamaño de la muestra que se utiliza en un estudio generalmente se determina en función del costo, el tiempo o la conveniencia de recopilar los datos, y la necesidad de que ofrezca suficiente poder estadístico. En estudios complicados puede haber varios tamaños de muestra diferentes: por ejemplo, en una encuesta estratificada habría diferentes tamaños para cada estrato. En un censo, se buscan datos para toda una población, por lo tanto, el tamaño de muestra previsto es igual a la población. En el diseño experimental, donde un estudio se puede dividir en diferentes grupos de tratamiento, puede haber diferentes tamaños de muestra para cada grupo.

Los tamaños de muestra se pueden elegir de varias maneras:

Introducción

Los tamaños de muestra más grandes generalmente conducen a una mayor precisión al estimar parámetros desconocidos. Por ejemplo, si deseamos conocer la proporción de cierta especie de pez que está infectada con un patógeno, generalmente tendríamos una estimación más precisa de esta proporción si muestreáramos y examináramos 200 peces en lugar de 100. Varios hechos fundamentales de la estadística matemática describen este fenómeno, incluida la ley de los grandes números y el teorema del límite central.

En algunas situaciones, el aumento de precisión para tamaños de muestra más grandes es mínimo o incluso inexistente. Esto puede deberse a la presencia de errores sistemáticos o una fuerte dependencia en los datos, o si los datos siguen una distribución de colas pesadas.

Los tamaños de muestra pueden evaluarse por la calidad de las estimaciones resultantes. Por ejemplo, si se está estimando una proporción, es posible que desee que el intervalo de confianza del 95% tenga menos de 0,06 unidades de ancho. Alternativamente, el tamaño de la muestra puede evaluarse en función del poder de una prueba de hipótesis. Por ejemplo, si estamos comparando el apoyo a un determinado candidato político entre las mujeres con el apoyo a ese candidato entre los hombres, es posible que deseemos tener un poder del 80% para detectar una diferencia en los niveles de apoyo de 0,04 unidades.

Estimacion

Estimación de una proporción

Una situación relativamente simple es la estimación de una proporción. Por ejemplo, podemos desear estimar la proporción de residentes en una comunidad que tienen al menos 65 años.

El estimador de una proporción es que p = X/n, donde X es el número de observaciones 'positivas' (por ejemplo, el número de personas de las n personas muestreadas que tienen al menos 65 años). Cuando las observaciones son independientes, este estimador tiene una distribución binomial (a escala) (y también es la media muestral de los datos de una distribución de Bernoulli). La varianza máxima de esta distribución es 0,25, lo que ocurre cuando el parámetro verdadero es p = 0,5. En la práctica, dado que se desconoce p, la varianza máxima se usa a menudo para las evaluaciones del tamaño de la muestra. Si se conoce una estimación razonable de p, se { estilo de visualización p (1-p)}puede usar la cantidad en lugar de 0,25.

Para n suficientemente grande, la distribución de { sombrero {p}}se aproximará mucho a una distribución normal. Usando esto y el método de Wald para la distribución binomial, se obtiene un intervalo de confianza de la forma{displaystyle left({widehat {p}}-Z{sqrt {frac {0.25}{n}}},quad {widehat {p}}+Z{sqrt {frac {0.25} {n}}}derecho)},donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95 %).

Si deseamos tener un intervalo de confianza que tenga un ancho total de W unidades (W/2 en cada lado de la media de la muestra), resolveríamos{displaystyle Z{sqrt {frac {0.25}{n}}}=W/2}

para n, dando el tamaño de la muestra

{displaystyle n={frac {Z^{2}}{W^{2}}}}, en el caso de utilizar.5 como la estimación más conservadora de la proporción. (Nota: W/2 = margen de error).

En la siguiente figura se puede observar cómo cambian los tamaños de muestra para proporciones binomiales dados diferentes niveles de confianza y márgenes de error.

De lo contrario, la fórmula sería {displaystyle Z{sqrt {frac {p(1-p)}{n}}}=W/2}, lo que da como resultado {displaystyle n={frac{4Z^{2}p(1-p)}{W^{2}}}}.

Por ejemplo, si estamos interesados ​​en estimar la proporción de la población de EE. UU. que apoya a un candidato presidencial en particular, y queremos que el ancho del intervalo de confianza del 95 % sea como máximo de 2 puntos porcentuales (0,02), entonces necesitaríamos un tamaño de muestra de (1,96)/(0,02) = 9604. Es razonable utilizar la estimación de 0,5 para p en este caso porque las carreras presidenciales suelen estar cerca de 50/50 y también es prudente utilizar una estimación conservadora. El margen de error en este caso es de 1 punto porcentual (la mitad de 0,02).

Lo anterior se simplifica comúnmente...{displaystyle left({widehat {p}}-1,96{sqrt {frac {0,25}{n}}},{widehat {p}}+1,96{sqrt {frac {0,25}{n }}}derecho)}

formará un intervalo de confianza del 95% para la verdadera proporción. Si este intervalo no debe tener más de W unidades de ancho, la ecuación{displaystyle 4{sqrt {frac{0.25}{n}}}=W}

se puede resolver para n, dando n = 4/ W = 1/ B donde B es el límite de error en la estimación, es decir, la estimación generalmente se da dentro de ± B. Entonces, para B = 10% se requiere n = 100, para B = 5% se necesita n = 400, para B = 3% el requisito se aproxima a n = 1000, mientras que para B = 1% un tamaño de muestra de n = 10000 es requerido. Estos números se citan a menudo en informes de noticias de encuestas de opinión y otras encuestas por muestreo. Sin embargo, recuerde siempre que los resultados informados pueden no ser el valor exacto, ya que es preferible redondear los números hacia arriba. Sabiendo que el valor de n es el número mínimo de puntos muestrales necesarios para adquirir el resultado deseado, el número de encuestados debe estar por encima del mínimo.

Estimación de una media

Una proporción es un caso especial de una media. Al estimar la media de la población utilizando una muestra independiente e idénticamente distribuida (iid) de tamaño n, donde cada valor de datos tiene una varianza σ, el error estándar de la media de la muestra es:{ estilo de visualización { frac { sigma} { sqrt {n}}}.}

Esta expresión describe cuantitativamente cómo la estimación se vuelve más precisa a medida que aumenta el tamaño de la muestra. El uso del teorema del límite central para justificar la aproximación de la media muestral con una distribución normal produce un intervalo de confianza de la forma{displaystyle left({bar {x}}-{frac {Zsigma }{sqrt {n}}},quad {bar {x}}+{frac {Zsigma }{ sqrt {n}}}right)},donde Z es una puntuación Z estándar para el nivel de confianza deseado (1,96 para un intervalo de confianza del 95 %).

Si deseamos tener un intervalo de confianza que tenga un ancho total de W unidades (W/2 en cada lado de la media de la muestra), resolveríamos{displaystyle {frac{Zsigma }{sqrt {n}}}=W/2}

para n, dando el tamaño de la muestra

{displaystyle n={frac{4Z^{2}sigma^{2}}{W^{2}}}}. (Nota: W/2 = margen de error).

Por ejemplo, si estamos interesados ​​en estimar la cantidad en la que un fármaco reduce la presión arterial de un sujeto con un intervalo de confianza del 95% de seis unidades de ancho, y sabemos que la desviación estándar de la presión arterial en la población es 15, entonces la el tamaño de muestra requerido es {displaystyle {frac {4times 1,96^{2}times 15^{2}}{6^{2}}}=96,04}, que se redondearía a 97, porque el valor obtenido es el tamaño de muestra mínimo, y los tamaños de muestra deben ser números enteros y deben estar en o por encima del mínimo calculado.

Tamaños de muestra necesarios para las pruebas de hipótesis

Un problema común al que se enfrentan los estadísticos es calcular el tamaño de muestra necesario para obtener una determinada potencia para una prueba, dada una tasa de error de tipo I predeterminada α. De la siguiente manera, esto se puede estimar mediante tablas predeterminadas para ciertos valores, mediante la ecuación de recursos de Mead o, de manera más general, mediante la función de distribución acumulativa:

Mesas

Energíad de Cohen
0.20.50.8
0.2584146
0.501933213
0,6024640dieciséis
0.703105020
0.803936426
0.905268534
0,9565110542
0.9992014858

La tabla que se muestra a la derecha se puede usar en una prueba t de dos muestras para estimar los tamaños de muestra de un grupo experimental y un grupo de control que son del mismo tamaño, es decir, el número total de individuos en el ensayo es el doble. del número dado, y el nivel de significancia deseado es 0.05. Los parámetros utilizados son:

Ecuación de recursos de Mead

La ecuación de recursos de Mead se usa a menudo para estimar tamaños de muestra de animales de laboratorio, así como en muchos otros experimentos de laboratorio. Puede que no sea tan preciso como usar otros métodos para estimar el tamaño de la muestra, pero da una idea de cuál es el tamaño de la muestra apropiado cuando se desconocen o son muy difíciles de estimar parámetros como las desviaciones estándar esperadas o las diferencias esperadas en los valores entre los grupos.

Todos los parámetros de la ecuación son, de hecho, los grados de libertad del número de sus conceptos y, por lo tanto, sus números se restan en 1 antes de insertarlos en la ecuación.

la ecuacion es:mi = norte - segundo - T,

donde:

Por ejemplo, si se planifica un estudio con animales de laboratorio con cuatro grupos de tratamiento (T = 3), con ocho animales por grupo, lo que hace un total de 32 animales (N = 31), sin ninguna estratificación adicional (B = 0), entonces E sería igual a 28, que está por encima del límite de 20, lo que indica que el tamaño de la muestra puede ser demasiado grande, y seis animales por grupo podrían ser más apropiados.

Función de distribución acumulativa

Sean X i, i = 1, 2,..., n observaciones independientes tomadas de una distribución normal con media desconocida μ y varianza conocida σ. Considere dos hipótesis, una hipótesis nula:H_0:mu=0

y una hipótesis alternativa:H_a:mu=mu^*

para alguna 'diferencia significativa más pequeña' μ > 0. Este es el valor más pequeño para el que nos preocupamos por observar una diferencia. Ahora, si deseamos (1) rechazar H 0 con una probabilidad de al menos 1 − β cuando H a es verdadera (es decir, una potencia de 1 − β), y (2) rechazar H 0 con probabilidad α cuando H 0 es cierto, entonces necesitamos lo siguiente:

Si z α es el punto porcentual α superior de la distribución normal estándar, entoncesz_{alpha }sigma /{sqrt {n}}mid H_{0})=alpha }">

y entonces'Rechazar H 0 si nuestro promedio muestral ({ barra {x}}) es mayor que z_{alpha}sigma/sqrt{n}'

es una regla de decisión que satisface (2). (Esta es una prueba de 1 cola).

Ahora deseamos que esto suceda con una probabilidad de al menos 1 − β cuando H a es verdadera. En este caso, nuestro promedio muestral provendrá de una distribución Normal con media μ. Por lo tanto, requerimosz_{alpha }sigma /{sqrt {n}}mid H_{a})geq 1-beta }">

A través de una manipulación cuidadosa, se puede demostrar (ver Poder estadístico#Ejemplo) que sucede cuando{displaystyle ngeq left({frac {z_{alpha }+Phi ^{-1}(1-beta)}{mu ^{*}/sigma }}right)^{ 2}}

donde Fies la función de distribución acumulada normal.

Tamaño de muestra estratificado

Con técnicas de muestreo más complicadas, como el muestreo estratificado, la muestra a menudo se puede dividir en submuestras. Por lo general, si hay H submuestras de este tipo (de H estratos diferentes), cada una de ellas tendrá un tamaño de muestra n h, h = 1, 2,..., H. Estos n h deben ajustarse a la regla de que n 1 + n 2 +... + n H = n (es decir, que el tamaño total de la muestra viene dado por la suma de los tamaños de las submuestras). Selección de estos n hóptimamente se puede hacer de varias maneras, utilizando (por ejemplo) la asignación óptima de Neymar.

Hay muchas razones para usar el muestreo estratificado: para disminuir las varianzas de las estimaciones de la muestra, para usar métodos parcialmente no aleatorios o para estudiar los estratos individualmente. Un método útil, en parte no aleatorio, sería muestrear individuos donde sea fácilmente accesible, pero, donde no, muestrear grupos para ahorrar costos de viaje.

En general, para los estratos H, una media muestral ponderada esbar x_w = sum_{h=1}^H W_h bar x_h,

con{displaystyle operatorname {Var} ({bar {x}}_{w})=sum _{h=1}^{H}W_{h}^{2}operatorname {Var} ({ barra {x}}_{h}).}

Los pesos, W_hfrecuentemente, pero no siempre, representan las proporciones de los elementos de población en los estratos, y W_h=N_h/N. Para un tamaño de muestra fijo, es decir { estilo de visualización n =  suma n_ {h}},{displaystyle operatorname {Var} ({bar {x}}_{w})=sum _{h=1}^{H}W_{h}^{2}operatorname {Var} ({ barra {x}}_{h})left({frac {1}{n_{h}}}-{frac {1}{N_{h}}}right),}

que puede hacerse un mínimo si la frecuencia de muestreo dentro de cada estrato se hace proporcional a la desviación estándar dentro de cada estrato: n_h/N_h=k S_h, donde {displaystyle S_{h}={sqrt {operatorname {Var} ({bar {x}}_{h})}}}y kes una constante tal que sum{n_h} = norte.

Se alcanza una "asignación óptima" cuando las tasas de muestreo dentro de los estratos se hacen directamente proporcionales a las desviaciones estándar dentro de los estratos e inversamente proporcionales a la raíz cuadrada del costo de muestreo por elemento dentro de los estratos C_h:frac{n_h}{N_h} = frac{K S_h}{sqrt{C_h}},

donde kes una constante tal que sum{n_h} = norte, o, más generalmente, cuandon_h = frac{K' W_h S_h}{sqrt{C_h}}.

Investigación cualitativa

La determinación del tamaño de la muestra en los estudios cualitativos tiene un enfoque diferente. Generalmente es un juicio subjetivo, tomado a medida que avanza la investigación. Un enfoque es continuar incluyendo más participantes o material hasta que se alcance la saturación. El número necesario para alcanzar la saturación se ha investigado empíricamente.

Hay escasez de orientación confiable sobre la estimación de tamaños de muestra antes de comenzar la investigación, con una variedad de sugerencias dadas. Se ha sugerido para el análisis temático una herramienta similar a un cálculo de poder cuantitativo, basado en la distribución binomial negativa.