População estatística

ImprimirCitar

Nas estatísticas, uma população é um conjunto de itens ou eventos semelhantes que são de interesse para alguma questão ou experimento. Uma população estatística pode ser um grupo de objetos existentes (por exemplo, o conjunto de todas as estrelas da Via Láctea) ou um grupo hipotético e potencialmente infinito de objetos concebido como uma generalização da experiência (por exemplo, o conjunto de todas as mãos possíveis em um jogo de pôquer). Um objetivo comum da análise estatística é produzir informações sobre alguma população escolhida.

Na inferência estatística, um subconjunto da população (uma amostra estatística) é escolhido para representar a população em uma análise estatística. Além disso, a amostra estatística deve ser imparcial e modelar a população com precisão (cada unidade da população tem chances iguais de seleção). A razão entre o tamanho desta amostra estatística e o tamanho da população é chamada de fração de amostragem. É então possível estimar os parâmetros populacionais usando as estatísticas amostrais apropriadas.

Média

O população média, ou valor esperado da população, é uma medida da tendência central de uma distribuição de probabilidade ou de uma variável aleatória caracterizada por essa distribuição. Em uma distribuição de probabilidade discreta de uma variável aleatória X, a média é igual à soma sobre cada valor possível ponderado pela probabilidade desse valor; isto é, é calculado tomando o produto de cada valor possível x de X e sua probabilidade p(x), e, em seguida, adicionar todos estes produtos juntos, dando . Uma fórmula análoga aplica-se ao caso de uma distribuição contínua de probabilidade. Nem toda distribuição de probabilidade tem uma média definida (veja a distribuição Cauchy por exemplo). Além disso, a média pode ser infinita para algumas distribuições.

Para uma população finita, a média populacional de uma propriedade é igual à média aritmética da propriedade dada, considerando todos os membros da população. Por exemplo, a altura média da população é igual à soma das alturas de cada indivíduo – dividida pelo número total de indivíduos. A média amostral pode diferir da média populacional, especialmente para amostras pequenas. A lei dos grandes números afirma que quanto maior o tamanho da amostra, maior a probabilidade de a média amostral estar próxima da média populacional.

Subpopulação

Um subconjunto de uma população que compartilha uma ou mais propriedades adicionais é chamado de subpopulação. Por exemplo, se a população é composta por todos os egípcios, uma subpopulação é composta por todos os homens egípcios; se a população é composta por todas as farmácias do mundo, uma subpopulação é composta por todas as farmácias do Egito. Por outro lado, uma amostra é um subconjunto de uma população que não é escolhida para partilhar qualquer propriedade adicional.

As estatísticas descritivas podem produzir resultados diferentes para diferentes subpopulações. Por exemplo, um determinado medicamento pode ter efeitos diferentes em diferentes subpopulações, e estes efeitos podem ser obscurecidos ou ignorados se essas subpopulações especiais não forem identificadas e examinadas isoladamente.

Da mesma forma, muitas vezes é possível estimar os parâmetros com mais precisão se separarmos as subpopulações: a distribuição de alturas entre as pessoas é melhor modelada considerando homens e mulheres como subpopulações separadas, por exemplo.

As populações que consistem em subpopulações podem ser modeladas por modelos de mistura, que combinam as distribuições dentro das subpopulações numa distribuição populacional global. Mesmo que as subpopulações sejam bem modeladas por determinados modelos simples, a população global pode ser mal ajustada por um determinado modelo simples – um mau ajuste pode ser evidência da existência de subpopulações. Por exemplo, dadas duas subpopulações iguais, ambas normalmente distribuídas, se tiverem o mesmo desvio padrão, mas médias diferentes, a distribuição global apresentará baixa curtose em relação a uma única distribuição normal – as médias das subpopulações recaem sobre os ombros do distribuição geral. Se suficientemente separados, estes formam uma distribuição bimodal; caso contrário, simplesmente terá um pico amplo. Além disso, exibirá superdispersão em relação a uma única distribuição normal com a variação dada. Alternativamente, dadas duas subpopulações com a mesma média, mas desvios padrão diferentes, a população geral apresentará uma curtose elevada, com um pico mais acentuado e caudas mais pesadas (e ombros correspondentemente mais rasos) do que uma distribuição única.

Contenido relacionado

Greg Egan

Greg Egan é um escritor australiano de ficção científica e matemático amador, mais conhecido por suas obras de ficção científica pesada. Egan ganhou...

Aritmética de ponto flutuante

Na computação, aritmética de ponto flutuante é uma aritmética que representa números reais aproximadamente, usando um inteiro com uma precisão fixa...

Autocorrelação

Autocorrelação, às vezes conhecida como correlação serial no caso de tempo discreto, é a correlação de um sinal com uma cópia atrasada de si mesmo em...
Más resultados...
Tamaño del texto:
Copiar