Población estadística

Compartir Imprimir Citar
Población y muestra
Población y muestra

En estadística, una población es un conjunto de elementos o eventos similares que son de interés para alguna pregunta o experimento. Una población estadística puede ser un grupo de objetos existentes (por ejemplo, el conjunto de todas las estrellas dentro de la galaxia de la Vía Láctea) o un grupo hipotético y potencialmente infinito de objetos concebido como una generalización de la experiencia (por ejemplo, el conjunto de todas las manos posibles en un juego de póker). Un objetivo común del análisis estadístico es producir información sobre alguna población elegida.

En la inferencia estadística, se elige un subconjunto de la población (una muestra estadística ) para representar a la población en un análisis estadístico. Además, la muestra estadística debe ser imparcial y modelar con precisión la población (cada unidad de la población tiene la misma oportunidad de selección). La relación entre el tamaño de esta muestra estadística y el tamaño de la población se denomina fracción de muestreo . Entonces es posible estimar los parámetros de la población usando las estadísticas muestrales apropiadas.

Significado

La población y la muestra son ambos conjuntos, cuyos elementos pertenecen tanto al uno como al otro
La población y la muestra son ambos conjuntos, cuyos elementos pertenecen tanto al uno como al otro

La media poblacional, o valor esperado de la población, es una medida de la tendencia central de una distribución de probabilidad o de una variable aleatoria caracterizada por esa distribución. En una distribución de probabilidad discreta de una variable aleatoria X , la media es igual a la suma de todos los valores posibles ponderada por la probabilidad de ese valor; es decir, se calcula tomando el producto de cada posible valor x de X y su probabilidad p (x ), y luego sumando todos estos productos, dando {\ estilo de visualización \ mu = \ suma xp (x)....}. Una fórmula análoga se aplica al caso de una distribución de probabilidad continua. No todas las distribuciones de probabilidad tienen una media definida (consulte la distribución de Cauchy para ver un ejemplo). Además, la media puede ser infinita para algunas distribuciones.

Para una población finita, la media poblacional de una propiedad es igual a la media aritmética de la propiedad dada, considerando a todos los miembros de la población. Por ejemplo, la altura media de la población es igual a la suma de las alturas de cada individuo, dividida por el número total de individuos. La media muestral puede diferir de la media poblacional, especialmente para muestras pequeñas. La ley de los grandes números establece que cuanto mayor sea el tamaño de la muestra, más probable es que la media de la muestra se acerque a la media de la población.

Subpoblación

La muestra es una subpoblación de la población estadística objetivo
La muestra es una subpoblación de la población estadística objetivo

Un subconjunto de una población que comparte una o más propiedades adicionales se denomina subpoblación . Por ejemplo, si la población es toda egipcia, una subpoblación son todos los hombres egipcios; si la población son todas las farmacias del mundo, una subpoblación son todas las farmacias de Egipto. Por el contrario, una muestra es un subconjunto de una población que no se elige para compartir ninguna propiedad adicional.

Las estadísticas descriptivas pueden arrojar resultados diferentes para diferentes subpoblaciones. Por ejemplo, un medicamento en particular puede tener diferentes efectos en diferentes subpoblaciones, y estos efectos pueden oscurecerse o descartarse si dichas subpoblaciones especiales no se identifican y examinan de forma aislada.

De manera similar, a menudo se pueden estimar los parámetros con mayor precisión si se separan las subpoblaciones: la distribución de alturas entre las personas se modela mejor considerando a hombres y mujeres como subpoblaciones separadas, por ejemplo.

Las poblaciones que consisten en subpoblaciones se pueden modelar mediante modelos mixtos, que combinan las distribuciones dentro de las subpoblaciones en una distribución de población general. Incluso si las subpoblaciones están bien modeladas por modelos simples dados, la población general puede no ajustarse bien a un modelo simple dado; un ajuste deficiente puede ser evidencia de la existencia de subpoblaciones. Por ejemplo, dadas dos subpoblaciones iguales, ambas distribuidas normalmente, si tienen la misma desviación estándar pero medias diferentes, la distribución general exhibirá una curtosis baja en relación con una única distribución normal: las medias de las subpoblaciones recaen sobre los hombros de la distribución normal. distribución general. Si están suficientemente separados, estos forman una distribución bimodal; de lo contrario, simplemente tiene un pico ancho. Más, exhibirá una sobredispersión relativa a una sola distribución normal con la variación dada. Alternativamente, dadas dos subpoblaciones con la misma media pero con diferentes desviaciones estándar, la población general exhibirá una curtosis alta, con un pico más agudo y colas más pesadas (y, en consecuencia, hombros menos profundos) que una sola distribución.