Suposição estatística
A estatística, como todas as disciplinas matemáticas, não infere conclusões válidas do nada. Inferir conclusões interessantes sobre populações estatísticas reais quase sempre requer algumas suposições básicas. Essas suposições devem ser feitas com cuidado, porque suposições incorretas podem gerar conclusões extremamente imprecisas.
Aqui estão alguns exemplos de suposições estatísticas:
- Independência de observações um do outro (esta suposição é um erro especialmente comum).
- Independência do erro observacional de possíveis efeitos de confusão.
- Normalidade exata ou aproximada de observações (ou erros).
- Linearidade de respostas graduadas a estímulos quantitativos, por exemplo, em regressão linear.
Classes de suposições
Existem duas abordagens para inferência estatística: inferência baseada em modelo e inferência baseada em design. Ambas as abordagens dependem de algum modelo estatístico para representar o processo de geração de dados. Na abordagem baseada em modelos, o modelo é inicialmente desconhecido e um dos objetivos é selecionar um modelo apropriado para inferência. Na abordagem baseada em design, o modelo é considerado conhecido e um dos objetivos é garantir que os dados da amostra sejam selecionados aleatoriamente o suficiente para inferência.
As suposições estatísticas podem ser divididas em duas classes, dependendo da abordagem de inferência usada.
- Suposições baseadas em modelos. Estes incluem os seguintes três tipos:
- Suposições distributivas. Quando um modelo estatístico envolve termos relativos a erros aleatórios, as suposições podem ser feitas sobre a distribuição de probabilidade desses erros. Em alguns casos, a suposição distribucional se relaciona com as próprias observações.
- Suposições estruturais. As relações estatísticas entre variáveis são muitas vezes modeladas pelo igualamento de uma variável a uma função de outra (ou várias outras), mais um erro aleatório. Os modelos geralmente envolvem fazer uma suposição estrutural sobre a forma da relação funcional, por exemplo, como na regressão linear. Isso pode ser generalizado para modelos envolvendo relações entre variáveis latentes não observadas subjacentes.
- Suposições de variação cruzada. Estes pressupostos envolvem as distribuições de probabilidade conjunta das próprias observações ou dos erros aleatórios em um modelo. Modelos simples podem incluir a suposição de que observações ou erros são estatisticamente independentes.
- Suposições baseadas em design. Estes relacionam-se com a forma como as observações foram reunidas, e muitas vezes envolvem uma suposição de randomização durante a amostragem.
A abordagem baseada em modelos é a mais comumente usada em inferência estatística; a abordagem baseada no design é usada principalmente com amostragem de inquéritos. Com a abordagem baseada em modelo, todas as suposições são efetivamente codificadas no modelo.
Verificando suposições
Dado que a validade de qualquer conclusão tirada de uma inferência estatística depende da validade dos pressupostos feitos, é claramente importante que esses pressupostos sejam revistos em algum momento. Alguns casos – por exemplo, quando faltam dados – podem exigir que os investigadores julguem se uma suposição é razoável. Os investigadores podem expandir isto um pouco para considerar que efeito um afastamento dos pressupostos pode produzir. Onde dados mais extensos estão disponíveis, vários tipos de procedimentos para validação de modelos estatísticos estão disponíveis – por exemplo, para validação do modelo de regressão.
Contenido relacionado
Autocorrelação
Desvio padrão
População estatística