o teste qui-quadrado de qualidade do ajuste é útil comparar um Modelo teórico aos dados observados. Este teste é um tipo do teste qui-quadrado mais geral. Como em qualquer tópico de matemática ou estatística, pode ser útil trabalhar com um exemplo para entender o que está acontecendo, através de um exemplo do teste de adequação do qui-quadrado.
Considere um pacote padrão de chocolate ao leite M & Ms. Existem seis cores diferentes: vermelho, laranja, amarelo, verde, azul e marrom. Suponha que tenhamos curiosidade sobre a distribuição dessas cores e pergunte: todas as seis cores ocorrem na mesma proporção? Esse é o tipo de pergunta que pode ser respondida com um teste de qualidade do ajuste.
Configuração
Começamos observando a configuração e por que o teste de qualidade do ajuste é apropriado. Nossa variável de cor é categórica. Existem seis níveis dessa variável, correspondentes às seis cores possíveis. Assumiremos que as M & Ms contadas serão uma amostra aleatória simples da população de todas as M & Ms.
Hipóteses nulas e alternativas
o hipóteses nulas e alternativas pois nosso teste de adequação reflete a suposição que estamos fazendo sobre a população. Como estamos testando se as cores ocorrem em proporções iguais, nossa hipótese nula será a de que todas as cores ocorram na mesma proporção. Mais formalmente, se p1 é a proporção da população de balas vermelhas, p2 é a proporção populacional de doces de laranja, e assim por diante, a hipótese nula é que p1 = p2 =... = p6 = 1/6.
A hipótese alternativa é que pelo menos uma das proporções da população não seja igual a 1/6.
Contagens reais e esperadas
As contagens reais são o número de balas para cada uma das seis cores. A contagem esperada refere-se ao que seria de esperar se a hipótese nula fosse verdadeira. Vamos deixar n seja o tamanho da nossa amostra. O número esperado de balas vermelhas é p1 n ou n/6. De fato, neste exemplo, o número esperado de balas para cada uma das seis cores é simplesmente n vezes pEuou n/6.
Estatística do Qui-quadrado para Qualidade do Ajuste
Vamos agora calcular uma estatística qui-quadrado para um exemplo específico. Suponha que tenhamos uma amostra aleatória simples de 600 balas M&M com a seguinte distribuição:
- 212 dos doces são azuis.
- 147 dos doces são laranja.
- 103 dos doces são verdes.
- 50 dos doces são vermelhos.
- 46 dos doces são amarelos.
- 42 dos doces são marrons.
Se a hipótese nula fosse verdadeira, as contagens esperadas para cada uma dessas cores seriam (1/6) x 600 = 100. Agora, usamos isso em nosso cálculo da estatística qui-quadrado.
Calculamos a contribuição para nossa estatística de cada uma das cores. Cada um tem o formato (Real - Esperado)2/Expected.:
- Para o azul, temos (212 - 100)2/100 = 125.44
- Para laranja, temos (147 - 100)2/100 = 22.09
- Para o verde, temos (103 - 100)2/100 = 0.09
- Para vermelho, temos (50 - 100)2/100 = 25
- Para amarelo, temos (46 - 100)2/100 = 29.16
- Para marrom, temos (42 - 100)2/100 = 33.64
Totalizamos todas essas contribuições e determinamos que nossa estatística do qui-quadrado é 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.
Graus de liberdade
O número de graus de liberdade para um teste de adequação é simplesmente um a menos que o número de níveis de nossa variável. Como havia seis cores, temos 6 - 1 = 5 graus de liberdade.
Tabela Qui-quadrado e Valor-P
A estatística qui-quadrado de 235,42 que calculamos corresponde a um local específico em uma distribuição qui-quadrado com cinco graus de liberdade. Agora precisamos de um valor p, determina a probabilidade de obter uma estatística de teste pelo menos tão extrema quanto 235,42, enquanto se assume que a hipótese nula é verdadeira.
O Excel da Microsoft pode ser usado para esse cálculo. Concluímos que nossa estatística de teste com cinco graus de liberdade tem um valor p de 7,29 x 10-49. Este é um valor p extremamente pequeno.
Regra de decisão
Tomamos a decisão de rejeitar a hipótese nula com base no tamanho do valor-p. Como temos um valor p muito minúsculo, rejeitamos a hipótese nula. Concluímos que M & Ms não são distribuídas igualmente entre as seis cores diferentes. Uma análise de acompanhamento pode ser usada para determinar um intervalo de confiança para a proporção populacional de uma cor específica.