Os testes de hipóteses ou de significância envolvem o cálculo de um número conhecido como valor-p. Este número é muito importante para a conclusão do nosso teste. Os valores de p estão relacionados à estatística do teste e nos fornecem uma medida de evidência contra a hipótese nula.
Hipóteses nulas e alternativas
Todos os testes de significância estatística começam com um nula e uma hipótese alternativa. A hipótese nula é a declaração sem efeito ou uma declaração do estado de coisas comumente aceito. A hipótese alternativa é o que estamos tentando provar. A suposição de trabalho em um teste de hipótese é que a hipótese nula é verdadeira.
Estatística de teste
Assumiremos que as condições foram atendidas para o teste específico em que estamos trabalhando. UMA amostra aleatória simples nos fornece dados de amostra. A partir desses dados, podemos calcular uma estatística de teste. As estatísticas de teste variam muito, dependendo de quais parâmetros nosso teste de hipótese diz respeito. Algumas estatísticas comuns de teste incluem:
- z - estatística para testes de hipótese relativos à média da população, quando sabemos o desvio padrão da população.
- t - estatística para testes de hipótese relativos à média da população, quando não sabemos o desvio padrão da população.
- t - estatística para testes de hipótese relativos à diferença de duas médias independentes da população, quando não sabemos o desvio padrão de nenhuma das duas populações.
- z - estatística para testes de hipótese relativos a uma proporção populacional.
- Qui-quadrado - estatística para testes de hipóteses referentes à diferença entre uma contagem esperada e a real para dados categóricos.
Cálculo de valores-P
As estatísticas de teste são úteis, mas pode ser mais útil atribuir um valor p a essas estatísticas. Um valor p é a probabilidade de que, se a hipótese nula fosse verdadeira, observaríamos uma estatística pelo menos tão extrema quanto a observada. Para calcular um valor p, usamos o software ou tabela estatística apropriada que corresponde à nossa estatística de teste.
Por exemplo, usaríamos um distribuição normal padrão ao calcular um z Estatística de teste. Valores de z com valores absolutos grandes (como aqueles acima de 2,5) não são muito comuns e dariam um pequeno valor de p. Valores de z mais próximas de zero são mais comuns e dariam valores p muito maiores.
Interpretação do valor P
Como observamos, um valor-p é uma probabilidade. Isso significa que é um número real de 0 e 1. Enquanto uma estatística de teste é uma maneira de medir o quão extrema é uma estatística para uma amostra específica, os valores de p são outra maneira de medir isso.
Quando obtemos uma amostra estatística dada, a pergunta que devemos sempre fazer é: “Essa amostra é do jeito que é por acaso sozinho com uma hipótese nula verdadeira ou a hipótese nula é falsa? " Se nosso valor-p for pequeno, isso pode significar um de dois coisas:
- A hipótese nula é verdadeira, mas tivemos muita sorte em obter nossa amostra observada.
- Nossa amostra é a que se deve ao fato de a hipótese nula ser falsa.
Em geral, quanto menor o valor-p, mais evidências temos contra nossa hipótese nula.
Quão pequeno é o suficiente?
Quão pequeno é o valor de p que precisamos para rejeitar a hipótese nula? A resposta para isso é: "Depende". Uma regra prática comum é que o valor p deve ser menor ou igual a 0,05, mas não há nada universal nesse valor.
Normalmente, antes de realizar um teste de hipótese, escolhemos um valor limite. Se tivermos qualquer valor p menor ou igual a esse limite, rejeitamos a hipótese nula. Caso contrário, falhamos em rejeitar a hipótese nula. Esse limite é chamado de nível de significância de nosso teste de hipótese e é indicado pela letra grega alfa. Não há valor de alfa que sempre define significância estatística.