Teste de hipótese para comparar duas proporções

Neste artigo, seguiremos as etapas necessárias para executar uma teste de hipótese, ou teste de significância, para a diferença de duas proporções populacionais. Isso nos permite comparar duas proporções desconhecidas e inferir se elas não são iguais entre si ou se uma é maior que a outra.

Visão geral e antecedentes do teste de hipóteses

Antes de abordarmos as especificidades de nosso teste de hipóteses, examinaremos a estrutura dos testes de hipóteses. Num teste de significância, tentamos mostrar que uma afirmação relativa ao valor de uma população parâmetro (ou às vezes a natureza da própria população) provavelmente é verdadeira.

Reunimos evidências para essa afirmação conduzindo um amostra estatística. Calculamos uma estatística desta amostra. O valor dessa estatística é o que usamos para determinar a verdade da afirmação original. Esse processo contém incerteza, porém somos capazes de quantificar essa incerteza

O processo geral para um teste de hipótese é apresentado na lista abaixo:

instagram viewer
  1. Certifique-se de que as condições necessárias para o nosso teste sejam atendidas.
  2. Indique claramente o hipóteses nulas e alternativas. A hipótese alternativa pode envolver um teste unilateral ou bilateral. Também devemos determinar o nível de significância, que será indicado pela letra grega alfa.
  3. Calcule a estatística de teste. O tipo de estatística que usamos depende do teste específico que estamos realizando. O cálculo se baseia em nossa amostra estatística.
  4. Calcule o valor p. A estatística do teste pode ser convertida em um valor-p. Um valor-p é a probabilidade do acaso produzir o valor de nossa estatística de teste sob o pressuposto de que a hipótese nula é verdadeira. A regra geral é que quanto menor o valor-p, maior a evidência contra a hipótese nula.
  5. Chegar a uma conclusão. Finalmente, usamos o valor de alfa que já foi selecionado como um valor limite. A regra de decisão é que, se o valor de p for menor ou igual a alfa, rejeitamos a hipótese nula. Caso contrário, nós falha em rejeitar a hipótese nula.

Agora que vimos a estrutura para um teste de hipótese, veremos as especificidades de um teste de hipótese para a diferença de duas proporções populacionais.

As condições

Um teste de hipótese para a diferença de duas proporções populacionais requer que as seguintes condições sejam atendidas:

  • Temos dois amostras aleatórias simples de grandes populações. Aqui "grande" significa que a população é pelo menos 20 vezes maior que o tamanho da amostra. Os tamanhos das amostras serão indicados por n1 e n2.
  • Os indivíduos em nossas amostras foram escolhidos independentemente um do outro. As próprias populações também devem ser independentes.
  • Existem pelo menos 10 sucessos e 10 falhas em ambas as amostras.

Enquanto essas condições forem satisfeitas, podemos continuar com nosso teste de hipótese.

Hipóteses nulas e alternativas

Agora precisamos considerar as hipóteses para o nosso teste de significância. A hipótese nula é nossa afirmação sem efeito. Nesse tipo particular de teste de hipótese, nossa hipótese nula é a de que não há diferença entre as duas proporções populacionais. Podemos escrever isso como H0: p1 = p2.

A hipótese alternativa é uma das três possibilidades, dependendo das especificidades do que estamos testando:

  • Huma: p1 é melhor que p2. Este é um teste unilateral ou unilateral.
  • Huma: p1 é menos do que p2. Este também é um teste unilateral.
  • Huma: p1 não é igual a p2. Este é um bicaudal ou teste frente e verso.

Como sempre, para ser cauteloso, devemos usar a hipótese alternativa de dois lados se não tivermos uma direção em mente antes de obtermos nossa amostra. A razão para fazer isso é que é mais difícil rejeitar a hipótese nula com um teste bilateral.

As três hipóteses podem ser reescritas, indicando como p1 - p2 está relacionado ao valor zero. Para ser mais específico, a hipótese nula se tornaria H0:p1 - p2 = 0. As possíveis hipóteses alternativas seriam escritas como:

  • Huma: p1 - p2 > 0 é equivalente à instrução "p1 é melhor que p2."
  • Huma: p1 - p2 <0 é equivalente à declaração "p1 é menos do que p2."
  • Huma: p1 - p2 ≠ 0 é equivalente à declaração "p1 não é igual a p2."

Essa formulação equivalente, na verdade, mostra um pouco mais do que está acontecendo nos bastidores. O que estamos fazendo neste teste de hipótese é transformar os dois parâmetros p1 e p2 no único parâmetro p1 - p2. Em seguida, testamos esse novo parâmetro em relação ao valor zero.

A estatística de teste

A fórmula para a estatística de teste é dada na imagem acima. A seguir, é apresentada uma explicação de cada um dos termos:

  • A amostra da primeira população tem tamanho n1. O número de sucessos desta amostra (que não é visto diretamente na fórmula acima) é k1.
  • A amostra da segunda população tem tamanho n2. O número de sucessos desta amostra é k2.
  • As proporções da amostra são p1-chapéu = k1 / n1 e P2-hat = k2 / n2 .
  • Em seguida, combinamos ou agrupamos os sucessos de ambas as amostras e obtemos: p-hat = (k1 + k2) / (n1 + n2).

Como sempre, tenha cuidado com a ordem das operações ao calcular. Tudo abaixo do radical deve ser calculado antes de obter a raiz quadrada.

O valor P

O próximo passo é calcular o valor p que corresponde à nossa estatística de teste. Usamos uma distribuição normal padrão para nossa estatística e consultamos uma tabela de valores ou usamos software estatístico.

Os detalhes do nosso cálculo do valor-p dependem da hipótese alternativa que estamos usando:

  • Para Huma: p1 - p2 > 0, calculamos a proporção da distribuição normal que é maior que Z.
  • Para Huma: p1 - p2 <0, calculamos a proporção da distribuição normal menor que Z.
  • Para Huma: p1 - p2 ≠ 0, calculamos a proporção da distribuição normal que é maior que |Z|, o valor absoluto de Z. Depois disso, para explicar o fato de termos um teste bicaudal, dobramos a proporção.

Regra de decisão

Agora tomamos uma decisão sobre rejeitar a hipótese nula (e, assim, aceitar a alternativa) ou deixar de rejeitar a hipótese nula. Tomamos essa decisão comparando nosso valor-p com o nível de significância alfa.

  • Se o valor-p for menor ou igual a alfa, rejeitamos a hipótese nula. Isso significa que temos um resultado estatisticamente significativo e que vamos aceitar a hipótese alternativa.
  • Se o valor-p for maior que alfa, falhamos em rejeitar a hipótese nula. Isso não prova que a hipótese nula é verdadeira. Em vez disso, significa que não obtivemos evidências suficientes convincentes para rejeitar a hipótese nula.

Nota especial

o intervalo de confiança para a diferença de duas proporções populacionais não reúne os sucessos, enquanto o teste de hipótese sim. A razão para isso é que nossa hipótese nula assume que p1 - p2 = 0. O intervalo de confiança não assume isso. Alguns estatísticos não agrupam os sucessos desse teste de hipótese e, em vez disso, usam uma versão ligeiramente modificada da estatística de teste acima.

instagram story viewer