Às vezes, nas estatísticas, é útil ver exemplos elaborados de problemas. Esses exemplos podem nos ajudar a descobrir problemas semelhantes. Neste artigo, percorreremos o processo de realização de estatísticas inferenciais para obter um resultado referente a duas médias populacionais. Não apenas veremos como conduzir uma teste de hipótese sobre a diferença de duas médias populacionais, também construiremos um intervalo de confiança por essa diferença. Os métodos que usamos às vezes são chamados de teste t de duas amostras e intervalo de confiança t de duas amostras.
A Declaração do Problema
Suponha que desejamos testar a aptidão matemática de crianças do ensino fundamental. Uma pergunta que podemos ter é se os níveis mais altos têm notas médias mais altas nos testes.
Uma amostra aleatória simples de 27 alunos da terceira série recebe um teste de matemática, suas respostas são pontuadas e os resultados são encontrados com uma pontuação média de 75 pontos com um desvio padrão da amostra de 3 pontos.
Uma amostra aleatória simples de 20 alunos da quinta série recebe o mesmo teste de matemática e suas respostas são pontuadas. A pontuação média para os alunos da quinta série é de 84 pontos, com um desvio padrão da amostra de 5 pontos.
Diante desse cenário, fazemos as seguintes perguntas:
- Os dados da amostra nos fornecem evidências de que a pontuação média da população de todos os alunos da quinta série excede a pontuação média da população de todos os alunos da terceira série?
- Qual é um intervalo de confiança de 95% para a diferença nas pontuações médias dos testes entre as populações dos alunos da terceira e da quinta série?
Condições e Procedimentos
Nós devemos selecionar qual procedimento usar. Ao fazer isso, devemos garantir e verificar se as condições para este procedimento foram atendidas. Somos convidados a comparar duas médias populacionais. Uma coleção de métodos que podem ser usados para fazer isso são os procedimentos t de duas amostras.
Para usar esses procedimentos t para duas amostras, precisamos garantir que as seguintes condições sejam válidas:
- Temos duas amostras aleatórias simples das duas populações de interesse.
- Nossas amostras aleatórias simples não constituem mais de 5% da população.
- As duas amostras são independentes uma da outra e não há correspondência entre os sujeitos.
- A variável é normalmente distribuída.
- A média da população e o desvio padrão são desconhecidos para ambas as populações.
Vemos que a maioria dessas condições é atendida. Disseram-nos que possuímos amostras aleatórias simples. As populações que estamos estudando são grandes, pois há milhões de estudantes nessas séries.
A condição que não podemos assumir automaticamente é se as pontuações dos testes são normalmente distribuídas. Como temos um tamanho de amostra grande o suficiente, pela robustez de nossos procedimentos t, não precisamos necessariamente que a variável seja normalmente distribuída.
Como as condições são satisfeitas, realizamos alguns cálculos preliminares.
Erro padrão
O erro padrão é uma estimativa de um desvio padrão. Para esta estatística, adicionamos a variação da amostra e pegamos a raiz quadrada. Isso fornece a fórmula:
(s1 2 / n1 + s22 / n2)1/2
Usando os valores acima, vemos que o valor do erro padrão é
(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583
Graus de liberdade
Podemos usar a aproximação conservadora para nossos graus de liberdade. Isso pode subestimar o número de graus de liberdade, mas é muito mais fácil calcular do que usar a fórmula de Welch. Usamos o menor dos dois tamanhos de amostra e subtraímos um desse número.
Para o nosso exemplo, a menor das duas amostras é 20. Isso significa que o número de graus de liberdade é 20 - 1 = 19.
Teste de Hipóteses
Desejamos testar a hipótese de que os alunos da quinta série têm uma pontuação média maior que a pontuação média dos alunos da terceira série. Let μ1 ser a pontuação média da população de todos os alunos da quinta série. Da mesma forma, deixamos μ2 ser a pontuação média da população de todos os alunos da terceira série.
As hipóteses são as seguintes:
- H0: μ1 - μ2 = 0
- Huma: μ1 - μ2 > 0
A estatística do teste é a diferença entre as médias da amostra, que é então dividida pelo erro padrão. Como estamos usando desvios padrão amostrais para estimar o desvio padrão populacional, a estatística de teste da distribuição t.
O valor da estatística do teste é (84 - 75) / 1,2583. Isso é aproximadamente 7,15.
Agora, determinamos qual é o valor p para esse teste de hipótese. Examinamos o valor da estatística do teste e onde ela está localizada em uma distribuição t com 19 graus de liberdade. Para esta distribuição, temos 4,2 x 10-7 como nosso valor-p. (Uma maneira de determinar isso é usar a função T.DIST.RT no Excel.)
Como temos um valor p tão pequeno, rejeitamos a hipótese nula. A conclusão é que a pontuação média do teste para a quinta série é superior à pontuação média do teste para a terceira série.
Intervalo de confiança
Como estabelecemos que há uma diferença entre as pontuações médias, agora determinamos um intervalo de confiança para a diferença entre essas duas médias. Já temos muito do que precisamos. O intervalo de confiança para a diferença precisa ter uma estimativa e uma margem de erro.
A estimativa para a diferença de duas médias é simples de calcular. Simplesmente descobrimos a diferença da média da amostra. Essa diferença da média da amostra estima a diferença da média da população.
Para nossos dados, a diferença nas médias da amostra é 84 - 75 = 9.
A margem de erro é um pouco mais difícil de calcular. Para isso, precisamos multiplicar a estatística apropriada pelo erro padrão. A estatística de que precisamos é encontrada consultando uma tabela ou software estatístico.
Novamente, usando a aproximação conservadora, temos 19 graus de liberdade. Para um intervalo de confiança de 95%, vemos que t* = 2.09. Nós poderíamos usar o Função T.INV em Excel para calcular esse valor.
Agora reunimos tudo e constatamos que nossa margem de erro é de 2,09 x 1,2583, ou seja, aproximadamente 2,63. O intervalo de confiança é de 9 ± 2,63. O intervalo é de 6,37 a 11,63 pontos no teste escolhido pela quinta e terceira séries.