Exemplo de teste T de duas amostras e intervalo de confiança

Às vezes, nas estatísticas, é útil ver exemplos elaborados de problemas. Esses exemplos podem nos ajudar a descobrir problemas semelhantes. Neste artigo, percorreremos o processo de realização de estatísticas inferenciais para obter um resultado referente a duas médias populacionais. Não apenas veremos como conduzir uma teste de hipótese sobre a diferença de duas médias populacionais, também construiremos um intervalo de confiança por essa diferença. Os métodos que usamos às vezes são chamados de teste t de duas amostras e intervalo de confiança t de duas amostras.

A Declaração do Problema

Suponha que desejamos testar a aptidão matemática de crianças do ensino fundamental. Uma pergunta que podemos ter é se os níveis mais altos têm notas médias mais altas nos testes.

Uma amostra aleatória simples de 27 alunos da terceira série recebe um teste de matemática, suas respostas são pontuadas e os resultados são encontrados com uma pontuação média de 75 pontos com um desvio padrão da amostra de 3 pontos.

instagram viewer

Uma amostra aleatória simples de 20 alunos da quinta série recebe o mesmo teste de matemática e suas respostas são pontuadas. A pontuação média para os alunos da quinta série é de 84 pontos, com um desvio padrão da amostra de 5 pontos.

Diante desse cenário, fazemos as seguintes perguntas:

Os dados da amostra nos fornecem evidências de que a pontuação média da população de todos os alunos da quinta série excede a pontuação média da população de todos os alunos da terceira série?
Qual é um intervalo de confiança de 95% para a diferença nas pontuações médias dos testes entre as populações dos alunos da terceira e da quinta série?

Condições e Procedimentos

Nós devemos selecionar qual procedimento usar. Ao fazer isso, devemos garantir e verificar se as condições para este procedimento foram atendidas. Somos convidados a comparar duas médias populacionais. Uma coleção de métodos que podem ser usados para fazer isso são os procedimentos t de duas amostras.

Para usar esses procedimentos t para duas amostras, precisamos garantir que as seguintes condições sejam válidas:

Temos duas amostras aleatórias simples das duas populações de interesse.
Nossas amostras aleatórias simples não constituem mais de 5% da população.
As duas amostras são independentes uma da outra e não há correspondência entre os sujeitos.
A variável é normalmente distribuída.
A média da população e o desvio padrão são desconhecidos para ambas as populações.

Vemos que a maioria dessas condições é atendida. Disseram-nos que possuímos amostras aleatórias simples. As populações que estamos estudando são grandes, pois há milhões de estudantes nessas séries.

A condição que não podemos assumir automaticamente é se as pontuações dos testes são normalmente distribuídas. Como temos um tamanho de amostra grande o suficiente, pela robustez de nossos procedimentos t, não precisamos necessariamente que a variável seja normalmente distribuída.

Como as condições são satisfeitas, realizamos alguns cálculos preliminares.

Erro padrão

O erro padrão é uma estimativa de um desvio padrão. Para esta estatística, adicionamos a variação da amostra e pegamos a raiz quadrada. Isso fornece a fórmula:

(s₁² / n₁ + s₂² / n₂)^1/2

Usando os valores acima, vemos que o valor do erro padrão é

(3²/ 27+ 5²/ 20)^1/2 =(1 / 3 + 5 / 4 )^1/2 = 1.2583

Graus de liberdade

Podemos usar a aproximação conservadora para nossos graus de liberdade. Isso pode subestimar o número de graus de liberdade, mas é muito mais fácil calcular do que usar a fórmula de Welch. Usamos o menor dos dois tamanhos de amostra e subtraímos um desse número.

Para o nosso exemplo, a menor das duas amostras é 20. Isso significa que o número de graus de liberdade é 20 - 1 = 19.

Teste de Hipóteses

Desejamos testar a hipótese de que os alunos da quinta série têm uma pontuação média maior que a pontuação média dos alunos da terceira série. Let μ₁ ser a pontuação média da população de todos os alunos da quinta série. Da mesma forma, deixamos μ₂ ser a pontuação média da população de todos os alunos da terceira série.

As hipóteses são as seguintes:

H₀: μ₁ - μ₂ = 0
H_uma: μ₁ - μ₂ > 0

A estatística do teste é a diferença entre as médias da amostra, que é então dividida pelo erro padrão. Como estamos usando desvios padrão amostrais para estimar o desvio padrão populacional, a estatística de teste da distribuição t.

O valor da estatística do teste é (84 - 75) / 1,2583. Isso é aproximadamente 7,15.

Agora, determinamos qual é o valor p para esse teste de hipótese. Examinamos o valor da estatística do teste e onde ela está localizada em uma distribuição t com 19 graus de liberdade. Para esta distribuição, temos 4,2 x 10^-7 como nosso valor-p. (Uma maneira de determinar isso é usar a função T.DIST.RT no Excel.)

Como temos um valor p tão pequeno, rejeitamos a hipótese nula. A conclusão é que a pontuação média do teste para a quinta série é superior à pontuação média do teste para a terceira série.

Intervalo de confiança

Como estabelecemos que há uma diferença entre as pontuações médias, agora determinamos um intervalo de confiança para a diferença entre essas duas médias. Já temos muito do que precisamos. O intervalo de confiança para a diferença precisa ter uma estimativa e uma margem de erro.

A estimativa para a diferença de duas médias é simples de calcular. Simplesmente descobrimos a diferença da média da amostra. Essa diferença da média da amostra estima a diferença da média da população.

Para nossos dados, a diferença nas médias da amostra é 84 - 75 = 9.

A margem de erro é um pouco mais difícil de calcular. Para isso, precisamos multiplicar a estatística apropriada pelo erro padrão. A estatística de que precisamos é encontrada consultando uma tabela ou software estatístico.

Novamente, usando a aproximação conservadora, temos 19 graus de liberdade. Para um intervalo de confiança de 95%, vemos que t^* = 2.09. Nós poderíamos usar o Função T.INV em Excel para calcular esse valor.

Agora reunimos tudo e constatamos que nossa margem de erro é de 2,09 x 1,2583, ou seja, aproximadamente 2,63. O intervalo de confiança é de 9 ± 2,63. O intervalo é de 6,37 a 11,63 pontos no teste escolhido pela quinta e terceira séries.