A variação da população fornece uma indicação de como distribuir um conjunto de dados. Infelizmente, normalmente é impossível saber exatamente qual é esse parâmetro populacional. Para compensar nossa falta de conhecimento, usamos um tópico de estatística inferencial chamado intervalos de confiança. Veremos um exemplo de como calcular um intervalo de confiança para uma variação populacional.
Fórmula de intervalo de confiança
A fórmula para (1 - α) intervalo de confiança sobre a variação populacional. É dada pela seguinte cadeia de desigualdades:
[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / UMA.
Aqui n é o tamanho da amostra s2 é a variação da amostra. O número UMA é o ponto da distribuição qui-quadrado com n -1 graus de liberdade nos quais exatamente α / 2 da área sob a curva está à esquerda de UMA. De maneira semelhante, o número B é o ponto da mesma distribuição qui-quadrado com exatamente α / 2 da área sob a curva à direita de B.
Preliminares
Começamos com um conjunto de dados com 10 valores. Esse conjunto de valores de dados foi obtido por uma amostra aleatória simples:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Alguma análise exploratória de dados seria necessária para mostrar que não há discrepâncias. Ao construir um plotagem de caule e folha vemos que esses dados provavelmente são de uma distribuição aproximadamente distribuída normalmente. Isso significa que podemos prosseguir na busca de um intervalo de confiança de 95% para a variação da população.
Variação da amostra
Precisamos estimar a variação da população com a variação da amostra, denotada por s2. Então, começamos calculando esta estatística. Basicamente, estamos calculando a média soma dos desvios quadrados da média. No entanto, em vez de dividir essa soma por n nós dividimos por n - 1.
Achamos que a média da amostra é 104,2. Usando isso, temos a soma dos desvios ao quadrado da média dada por:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
Dividimos essa soma por 10 - 1 = 9 para obter uma variação amostral de 277.
Distribuição Qui-Quadrado
Agora, passamos à nossa distribuição de qui-quadrado. Como temos 10 valores de dados, temos 9 graus de liberdade. Como queremos os 95% médios da nossa distribuição, precisamos de 2,5% em cada uma das duas caudas. Consultamos uma tabela ou software qui-quadrado e verificamos que os valores da tabela 2.7004 e 19.023 abrangem 95% da área da distribuição. Esses números são UMA e B, respectivamente.
Agora temos tudo o que precisamos e estamos prontos para montar nosso intervalo de confiança. A fórmula para o terminal esquerdo é [(n - 1)s2] / B. Isso significa que nosso terminal esquerdo é:
(9 x 277) /19.023 = 133
O terminal correto é encontrado substituindo B com UMA:
(9 x 277) / 2,7004 = 923
Portanto, estamos 95% confiantes de que a variação populacional está entre 133 e 923.
Desvio Padrão da População
Obviamente, como o desvio padrão é a raiz quadrada da variância, esse método pode ser usado para construir um intervalo de confiança para o desvio padrão da população. Tudo o que precisamos fazer é criar raízes quadradas nos pontos finais. O resultado seria um intervalo de confiança de 95% para o desvio padrão.