Muitas vezes, quando estudamos um grupo, estamos realmente comparando duas populações. Dependendo do parâmetro Neste grupo em que estamos interessados e com as condições em que estamos lidando, existem várias técnicas disponíveis. Estatística inferência procedimentos que dizem respeito à comparação de duas populações geralmente não podem ser aplicados a três ou mais populações. Para estudar mais de duas populações ao mesmo tempo, precisamos de diferentes tipos de ferramentas estatísticas. Análise de variação, ou ANOVA, é uma técnica de interferência estatística que nos permite lidar com várias populações.
Comparação de Meios
Para ver quais problemas surgem e por que precisamos da ANOVA, consideraremos um exemplo. Suponha que estamos tentando determinar se o significar pesos de balas M&M verdes, vermelhas, azuis e laranja são diferentes entre si. Indicaremos os pesos médios para cada uma dessas populações, μ1, μ2, μ3 μ4 e respectivamente. Podemos usar o apropriado teste de hipótese várias vezes e teste C (4,2), ou seis diferentes hipóteses nulas:
- H0: μ1 = μ2 para verificar se o peso médio da população dos doces vermelhos é diferente do peso médio da população dos doces azuis.
- H0: μ2 = μ3 para verificar se o peso médio da população dos doces azuis é diferente do peso médio da população dos doces verdes.
- H0: μ3 = μ4 verificar se o peso médio da população de balas verdes é diferente do peso médio da população de balas laranja.
- H0: μ4 = μ1 para verificar se o peso médio da população dos doces de laranja é diferente do peso médio da população dos doces de laranja.
- H0: μ1 = μ3 para verificar se o peso médio da população de balas vermelhas é diferente do peso médio da população de balas verdes.
- H0: μ2 = μ4 para verificar se o peso médio da população de balas azuis é diferente do peso médio da população de balas laranja.
Existem muitos problemas com esse tipo de análise. Teremos seis p-valores. Mesmo que possamos testar cada um a 95% nível de confiança, nossa confiança no processo geral é menor do que isso porque as probabilidades se multiplicam: 0,95 x 0,95 x 0,95 x 0,95 x 0,95 x 0,95 é aproximadamente 0,74, ou um nível de confiança de 74%. Assim, a probabilidade de um erro do tipo I aumentou.
Em um nível mais fundamental, não podemos comparar esses quatro parâmetros como um todo comparando-os dois de cada vez. As médias dos M & Ms vermelho e azul podem ser significativas, com o peso médio do vermelho sendo relativamente maior que o peso médio do azul. No entanto, quando consideramos os pesos médios dos quatro tipos de doces, pode não haver uma diferença significativa.
Análise de variação
Para lidar com situações em que precisamos fazer múltiplas comparações, usamos ANOVA. Esse teste permite considerar os parâmetros de várias populações ao mesmo tempo, sem entrar em alguns dos problemas que nos confrontam realização de testes de hipóteses em dois parâmetros de cada vez.
Para realizar a ANOVA com o exemplo de M&M acima, testaríamos a hipótese nula H0:μ1 = μ2 = μ3= μ4. Isto indica que não há diferença entre os pesos médios dos M & Ms vermelhos, azuis e verdes. A hipótese alternativa é que existe alguma diferença entre os pesos médios dos M & Ms vermelhos, azuis, verdes e alaranjados. Essa hipótese é realmente uma combinação de várias afirmações Huma:
- O peso médio da população de balas vermelhas não é igual ao peso médio da população de balas azuis, OU
- O peso médio da população de balas azuis não é igual ao peso médio da população de balas verdes, OU
- O peso médio da população de doces verdes não é igual ao peso médio da população de doces alaranjados, OU
- O peso médio da população de balas verdes não é igual ao peso médio da população de balas vermelhas, OU
- O peso médio da população de balas azuis não é igual ao peso médio da população de balas laranja, OU
- O peso médio da população de balas azuis não é igual ao peso médio da população de balas vermelhas.
Nesse caso em particular, para obter nosso valor-p, utilizaríamos um distribuição de probabilidade Conhecido como Distribuição F. Os cálculos envolvendo o teste ANOVA F podem ser feitos manualmente, mas geralmente são calculados com software estatístico.
Comparações múltiplas
O que separa a ANOVA de outras técnicas estatísticas é que ela é usada para fazer comparações múltiplas. Isso é comum nas estatísticas, pois há muitas ocasiões em que queremos comparar mais do que apenas dois grupos. Normalmente, um teste geral sugere que há algum tipo de diferença entre os parâmetros que estamos estudando. Em seguida, seguimos esse teste com outras análises para decidir qual parâmetro difere.