Intervalos de confiança são uma parte essencial das estatísticas inferenciais. Podemos usar alguma probabilidade e informações de um distribuição de probabilidade estimar um parâmetro populacional com o uso de uma amostra. A declaração de um intervalo de confiança é feito de tal maneira que é facilmente mal compreendido. Analisaremos a interpretação correta dos intervalos de confiança e investigaremos quatro erros cometidos com relação a essa área de estatística.
O que é um intervalo de confiança?
Um intervalo de confiança pode ser expresso como um intervalo de valores ou da seguinte forma:
Estimativa ± Margem de erro
Um intervalo de confiança é geralmente indicado com um nível de confiança.Níveis de confiança comuns são 90%, 95% e 99%.
Veremos um exemplo em que queremos usar uma média amostral para inferir a média de uma população. Suponha que isso resulte em um intervalo de confiança de 25 a 30. Se dizemos que estamos 95% confiantes de que a população desconhecida significar está contido nesse intervalo, então estamos realmente dizendo que encontramos o intervalo usando um método que é capaz de fornecer resultados corretos em 95% das vezes. A longo prazo, nosso método não terá êxito 5% do tempo. Em outras palavras, falharemos em capturar a média verdadeira da população apenas uma em cada 20 vezes.
Erro # 1
Vamos agora examinar uma série de erros diferentes que podem ser cometidos ao lidar com intervalos de confiança. Uma afirmação incorreta que geralmente é feita sobre um intervalo de confiança em um nível de confiança de 95% é que existe uma chance de 95% de que o intervalo de confiança contenha a verdadeira média da população.
A razão pela qual isso é um erro é realmente bastante sutil. A idéia principal referente a um intervalo de confiança é que a probabilidade usada entra em cena com o método usado para determinar o intervalo de confiança é que ele se refere ao método que é usava.
Erro # 2
Um segundo erro é interpretar um intervalo de confiança de 95% como dizendo que 95% de todos os valores de dados na população se enquadram nesse intervalo. Novamente, 95% fala com o método do teste.
Para ver por que a afirmação acima está incorreta, poderíamos considerar uma população normal com um desvio padrão de 1 e uma média de 5. Uma amostra que tinha dois pontos de dados, cada um com valores 6, tem uma média da amostra 6. Um intervalo de confiança de 95% para a média da população seria de 4,6 a 7,4. Isso claramente não se sobrepõe a 95% da distribuição normal, portanto, não conterá 95% da população.
Erro # 3
Um terceiro erro é dizer que um intervalo de confiança de 95% implica que 95% de todas as médias possíveis da amostra estejam dentro do intervalo do intervalo. Reconsidere o exemplo da última seção. Qualquer amostra do tamanho dois, composta apenas por valores inferiores a 4,6, teria uma média inferior a 4,6. Assim, essas médias amostrais ficariam fora desse intervalo de confiança específico. As amostras que correspondem a essa descrição representam mais de 5% do valor total. Portanto, é um erro dizer que esse intervalo de confiança captura 95% de todas as médias da amostra.
Erro # 4
Um quarto erro ao lidar com intervalos de confiança é pensar que eles são a única fonte de erro. Embora exista uma margem de erro associada a um intervalo de confiança, há outros locais em que os erros podem se infiltrar em uma análise estatística. Alguns exemplos desses tipos de erros podem ser de um desenho incorreto do experimento, viés na amostragem ou incapacidade de obter dados de um determinado subconjunto da população.