Neste artigo, seguiremos as etapas necessárias para executar uma teste de hipótese, ou teste de significância, para a diferença de duas proporções populacionais. Isso nos permite comparar duas proporções desconhecidas e inferir se elas não são iguais entre si ou se uma é maior que a outra.
Visão geral e antecedentes do teste de hipóteses
Antes de abordarmos as especificidades de nosso teste de hipóteses, examinaremos a estrutura dos testes de hipóteses. Num teste de significância, tentamos mostrar que uma afirmação relativa ao valor de uma população parâmetro (ou às vezes a natureza da própria população) provavelmente é verdadeira.
Reunimos evidências para essa afirmação conduzindo um amostra estatística. Calculamos uma estatística desta amostra. O valor dessa estatística é o que usamos para determinar a verdade da afirmação original. Esse processo contém incerteza, porém somos capazes de quantificar essa incerteza
O processo geral para um teste de hipótese é apresentado na lista abaixo:
- Certifique-se de que as condições necessárias para o nosso teste sejam atendidas.
- Indique claramente o hipóteses nulas e alternativas. A hipótese alternativa pode envolver um teste unilateral ou bilateral. Também devemos determinar o nível de significância, que será indicado pela letra grega alfa.
- Calcule a estatística de teste. O tipo de estatística que usamos depende do teste específico que estamos realizando. O cálculo se baseia em nossa amostra estatística.
- Calcule o valor p. A estatística do teste pode ser convertida em um valor-p. Um valor-p é a probabilidade do acaso produzir o valor de nossa estatística de teste sob o pressuposto de que a hipótese nula é verdadeira. A regra geral é que quanto menor o valor-p, maior a evidência contra a hipótese nula.
- Chegar a uma conclusão. Finalmente, usamos o valor de alfa que já foi selecionado como um valor limite. A regra de decisão é que, se o valor de p for menor ou igual a alfa, rejeitamos a hipótese nula. Caso contrário, nós falha em rejeitar a hipótese nula.
Agora que vimos a estrutura para um teste de hipótese, veremos as especificidades de um teste de hipótese para a diferença de duas proporções populacionais.
As condições
Um teste de hipótese para a diferença de duas proporções populacionais requer que as seguintes condições sejam atendidas:
- Temos dois amostras aleatórias simples de grandes populações. Aqui "grande" significa que a população é pelo menos 20 vezes maior que o tamanho da amostra. Os tamanhos das amostras serão indicados por n1 e n2.
- Os indivíduos em nossas amostras foram escolhidos independentemente um do outro. As próprias populações também devem ser independentes.
- Existem pelo menos 10 sucessos e 10 falhas em ambas as amostras.
Enquanto essas condições forem satisfeitas, podemos continuar com nosso teste de hipótese.
Hipóteses nulas e alternativas
Agora precisamos considerar as hipóteses para o nosso teste de significância. A hipótese nula é nossa afirmação sem efeito. Nesse tipo particular de teste de hipótese, nossa hipótese nula é a de que não há diferença entre as duas proporções populacionais. Podemos escrever isso como H0: p1 = p2.
A hipótese alternativa é uma das três possibilidades, dependendo das especificidades do que estamos testando:
- Huma: p1 é melhor que p2. Este é um teste unilateral ou unilateral.
- Huma: p1 é menos do que p2. Este também é um teste unilateral.
- Huma: p1 não é igual a p2. Este é um bicaudal ou teste frente e verso.
Como sempre, para ser cauteloso, devemos usar a hipótese alternativa de dois lados se não tivermos uma direção em mente antes de obtermos nossa amostra. A razão para fazer isso é que é mais difícil rejeitar a hipótese nula com um teste bilateral.
As três hipóteses podem ser reescritas, indicando como p1 - p2 está relacionado ao valor zero. Para ser mais específico, a hipótese nula se tornaria H0:p1 - p2 = 0. As possíveis hipóteses alternativas seriam escritas como:
- Huma: p1 - p2 > 0 é equivalente à instrução "p1 é melhor que p2."
- Huma: p1 - p2 <0 é equivalente à declaração "p1 é menos do que p2."
- Huma: p1 - p2 ≠ 0 é equivalente à declaração "p1 não é igual a p2."
Essa formulação equivalente, na verdade, mostra um pouco mais do que está acontecendo nos bastidores. O que estamos fazendo neste teste de hipótese é transformar os dois parâmetros p1 e p2 no único parâmetro p1 - p2. Em seguida, testamos esse novo parâmetro em relação ao valor zero.
A estatística de teste
A fórmula para a estatística de teste é dada na imagem acima. A seguir, é apresentada uma explicação de cada um dos termos:
- A amostra da primeira população tem tamanho n1. O número de sucessos desta amostra (que não é visto diretamente na fórmula acima) é k1.
- A amostra da segunda população tem tamanho n2. O número de sucessos desta amostra é k2.
- As proporções da amostra são p1-chapéu = k1 / n1 e P2-hat = k2 / n2 .
- Em seguida, combinamos ou agrupamos os sucessos de ambas as amostras e obtemos: p-hat = (k1 + k2) / (n1 + n2).
Como sempre, tenha cuidado com a ordem das operações ao calcular. Tudo abaixo do radical deve ser calculado antes de obter a raiz quadrada.
O valor P
O próximo passo é calcular o valor p que corresponde à nossa estatística de teste. Usamos uma distribuição normal padrão para nossa estatística e consultamos uma tabela de valores ou usamos software estatístico.
Os detalhes do nosso cálculo do valor-p dependem da hipótese alternativa que estamos usando:
- Para Huma: p1 - p2 > 0, calculamos a proporção da distribuição normal que é maior que Z.
- Para Huma: p1 - p2 <0, calculamos a proporção da distribuição normal menor que Z.
- Para Huma: p1 - p2 ≠ 0, calculamos a proporção da distribuição normal que é maior que |Z|, o valor absoluto de Z. Depois disso, para explicar o fato de termos um teste bicaudal, dobramos a proporção.
Regra de decisão
Agora tomamos uma decisão sobre rejeitar a hipótese nula (e, assim, aceitar a alternativa) ou deixar de rejeitar a hipótese nula. Tomamos essa decisão comparando nosso valor-p com o nível de significância alfa.
- Se o valor-p for menor ou igual a alfa, rejeitamos a hipótese nula. Isso significa que temos um resultado estatisticamente significativo e que vamos aceitar a hipótese alternativa.
- Se o valor-p for maior que alfa, falhamos em rejeitar a hipótese nula. Isso não prova que a hipótese nula é verdadeira. Em vez disso, significa que não obtivemos evidências suficientes convincentes para rejeitar a hipótese nula.
Nota especial
o intervalo de confiança para a diferença de duas proporções populacionais não reúne os sucessos, enquanto o teste de hipótese sim. A razão para isso é que nossa hipótese nula assume que p1 - p2 = 0. O intervalo de confiança não assume isso. Alguns estatísticos não agrupam os sucessos desse teste de hipótese e, em vez disso, usam uma versão ligeiramente modificada da estatística de teste acima.