Uma pergunta que é sempre importante fazer em Estatisticas é: “O resultado observado é devido apenas ao acaso ou é estatisticamente significante? Uma classe de testes de hipóteses, chamados testes de permutação, permitem testar esta pergunta. A visão geral e as etapas desse teste são:
- Dividimos nossos sujeitos em um grupo controle e experimental. A hipótese nula é que não há diferença entre esses dois grupos.
- Aplique um tratamento ao grupo experimental.
- Meça a resposta ao tratamento
- Considere todas as configurações possíveis do grupo experimental e a resposta observada.
- Calcule um valor-p com base em nossa resposta observada em relação a todos os grupos experimentais em potencial.
Este é um esboço de uma permutação. Para elaborar esse esboço, dedicaremos tempo a analisar um exemplo elaborado de um teste de permutação desse tipo em detalhes.
Exemplo
Suponha que estamos estudando ratos. Em particular, estamos interessados na rapidez com que os ratos terminam um labirinto que nunca haviam encontrado antes. Desejamos fornecer evidências a favor de um tratamento experimental. O objetivo é demonstrar que os ratos do grupo de tratamento resolverão o labirinto mais rapidamente do que os ratos não tratados.
Começamos com nossos assuntos: seis ratos. Por conveniência, os ratos serão referidos pelas letras A, B, C, D, E, F. Três desses ratos devem ser selecionados aleatoriamente para o tratamento experimental, e os outros três são colocados em um grupo de controle no qual os indivíduos recebem um placebo.
Em seguida, escolheremos aleatoriamente a ordem na qual os ratos são selecionados para executar o labirinto. O tempo gasto terminando o labirinto para todos os ratos será anotado e uma média de cada grupo será calculada.
Suponha que nossa seleção aleatória tenha os ratos A, C e E no grupo experimental, com os outros ratos no placebo grupo de controle. Depois que o tratamento foi implementado, escolhemos aleatoriamente a ordem dos ratos para percorrer o labirinto.
Os tempos de execução para cada um dos ratos são:
- O mouse A corre a corrida em 10 segundos
- Mouse B corre a corrida em 12 segundos
- Mouse C corre a corrida em 9 segundos
- Mouse D corre a corrida em 11 segundos
- Mouse E corre a corrida em 11 segundos
- O mouse F corre a corrida em 13 segundos.
O tempo médio para completar o labirinto para os ratos no grupo experimental é de 10 segundos. O tempo médio para concluir o labirinto para aqueles no grupo de controle é de 12 segundos.
Poderíamos fazer algumas perguntas. O tratamento é realmente o motivo do tempo médio mais rápido? Ou tivemos sorte em nossa seleção de controle e grupo experimental? O tratamento pode não ter tido efeito e escolhemos aleatoriamente os ratos mais lentos para receber o placebo e os ratos mais rápidos para receber o tratamento. Um teste de permutação ajudará a responder a essas perguntas.
Hipóteses
As hipóteses para o nosso teste de permutação são:
- o hipótese nula é a declaração sem efeito. Para este teste específico, temos H0: Não há diferença entre os grupos de tratamento. O tempo médio para executar o labirinto para todos os ratos sem tratamento é o mesmo que o tempo médio para todos os ratos com o tratamento.
- A hipótese alternativa é o que estamos tentando estabelecer evidências a favor. Nesse caso, teríamos Huma: O tempo médio para todos os ratos com o tratamento será mais rápido que o tempo médio para todos os ratos sem o tratamento.
Permutações
Existem seis ratos e há três lugares no grupo experimental. Isso significa que o número de possíveis grupos experimentais é dado pelo número de combinações C (6,3) = 6! / (3! 3!) = 20. Os demais indivíduos fariam parte do grupo controle. Portanto, existem 20 maneiras diferentes de escolher indivíduos aleatoriamente em nossos dois grupos.
A atribuição de A, C e E ao grupo experimental foi realizada aleatoriamente. Como existem 20 dessas configurações, a específica com A, C e E no grupo experimental tem uma probabilidade de 1/20 = 5% da ocorrência.
Precisamos determinar todas as 20 configurações do grupo experimental dos indivíduos em nosso estudo.
- Grupo experimental: A B C e Grupo controle: D E F
- Grupo experimental: A B D e grupo Controle: C E F
- Grupo experimental: A B E e controle: C D F
- Grupo experimental: A B F e controle: C D E
- Grupo experimental: A C D e grupo Controle: B E F
- Grupo experimental: A C E e controle: B D F
- Grupo experimental: A C F e grupo Controle: B D E
- Grupo experimental: A D E e grupo controle: B C F
- Grupo experimental: A D F e grupo Controle: B C E
- Grupo experimental: A E F e controle: B C D
- Grupo experimental: B C D e grupo controle: A E F
- Grupo experimental: B C E e grupo controle: A D F
- Grupo experimental: B C F e grupo controle: A D E
- Grupo experimental: B D E e grupo controle: A C F
- Grupo experimental: B D F e grupo controle: A C E
- Grupo experimental: B E F e grupo controle: A C D
- Grupo experimental: C D E e grupo controle: A B F
- Grupo experimental: C D F e grupo controle: A B E
- Grupo experimental: C E F e grupo controle: A B D
- Grupo experimental: D E F e grupo controle: A B C
Em seguida, analisamos cada configuração de grupos experimentais e de controle. Calculamos a média para cada uma das 20 permutações na lista acima. Por exemplo, para o primeiro, A, B e C têm tempos de 10, 12 e 9, respectivamente. A média desses três números é 10,3333. Também nesta primeira permutação, D, E e F têm tempos de 11, 11 e 13, respectivamente. Isso tem uma média de 11,6666.
Depois de calcular o média de cada grupo, calculamos a diferença entre essas médias. Cada um dos seguintes corresponde à diferença entre os grupos experimental e controle listados acima.
- Placebo - Tratamento = 1,333333333 segundos
- Placebo - Tratamento = 0 segundos
- Placebo - Tratamento = 0 segundos
- Placebo - Tratamento = -1,333333333 segundos
- Placebo - Tratamento = 2 segundos
- Placebo - Tratamento = 2 segundos
- Placebo - Tratamento = 0,6666666667 segundos
- Placebo - Tratamento = 0,6666666667 segundos
- Placebo - Tratamento = -0,666666667 segundos
- Placebo - Tratamento = -0,666666667 segundos
- Placebo - Tratamento = 0,6666666667 segundos
- Placebo - Tratamento = 0,6666666667 segundos
- Placebo - Tratamento = -0,666666667 segundos
- Placebo - Tratamento = -0,666666667 segundos
- Placebo - Tratamento = -2 segundos
- Placebo - Tratamento = -2 segundos
- Placebo - Tratamento = 1,333333333 segundos
- Placebo - Tratamento = 0 segundos
- Placebo - Tratamento = 0 segundos
- Placebo - Tratamento = -1,333333333 segundos
Valor P
Agora, classificamos as diferenças entre as médias de cada grupo que observamos acima. Também tabulamos a porcentagem de nossas 20 configurações diferentes, representadas por cada diferença de médias. Por exemplo, quatro dos 20 não tiveram diferença entre as médias dos grupos controle e tratamento. Isso representa 20% das 20 configurações mencionadas acima.
- -2 para 10%
- -1,33 para 10%
- -0,667 para 20%
- 0 para 20%
- 0,667 para 20%
- 1,33 para 10%
- 2 para 10%.
Aqui, comparamos esta listagem com o resultado observado. Nossa seleção aleatória de camundongos para os grupos de tratamento e controle resultou em uma diferença média de 2 segundos. Também vemos que essa diferença corresponde a 10% de todas as amostras possíveis. O resultado é que, para este estudo, temos um valor p de 10%.