O teste de execução para seqüências aleatórias

Dado um sequência de dados, uma pergunta que podemos nos perguntar é se a sequência ocorreu por fenômenos do acaso ou se os dados não são aleatórios. A aleatoriedade é difícil de identificar, pois é muito difícil simplesmente olhar para os dados e determinar se eles foram ou não produzidos apenas por acaso. Um método que pode ser usado para ajudar a determinar se uma sequência realmente ocorreu por acaso é chamado de teste de execução.

O teste de corrida é um teste de significância ou teste de hipótese. O procedimento para este teste é baseado em uma execução, ou uma sequência, de dados que possuem uma característica específica. Para entender como o teste de corridas funciona, precisamos primeiro examinar o conceito de corrida.

Sequências de dados

Começaremos examinando um exemplo de execuções. Considere a seguinte sequência de dígitos aleatórios:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Uma maneira de classificar esses dígitos é dividi-los em duas categorias, pares (inclusive os dígitos 0, 2, 4, 6 e 8) ou ímpares (incluindo os dígitos 1, 3, 5, 7 e 9). Examinaremos a sequência de dígitos aleatórios e denotaremos os números pares como E e os números ímpares como O:

instagram viewer

E E O E E O O E O E E E E E O E E O O

As execuções são mais fáceis de ver se reescrevemos isso para que todos os SO estejam juntos e todos os Es estejam juntos:

EE O EE OO E O EEEEE O EE OO

Contamos o número de blocos de números pares ou ímpares e vemos que há um total de dez execuções para os dados. Quatro pistas têm comprimento um, cinco têm comprimento dois e uma tem comprimento cinco

Condições

Com qualquer teste de significância, é importante saber quais condições são necessárias para realizar o teste. Para o teste de execuções, poderemos classificar cada valor de dados da amostra em uma de duas categorias. Contaremos o número total de execuções em relação ao número de valores de dados que se enquadram em cada categoria.

O teste será um teste frente e verso. A razão para isso é que poucas execuções significam que provavelmente não há variação suficiente e o número de execuções que ocorreriam em um processo aleatório. Muitas execuções resultam quando um processo alterna entre as categorias com muita frequência para ser descrito por acaso.

Hipóteses e valores-P

Todo teste de significância tem um nula e uma hipótese alternativa. Para o teste de execuções, a hipótese nula é que a sequência é uma sequência aleatória. A hipótese alternativa é que a sequência dos dados da amostra não seja aleatória.

O software estatístico pode calcular o valor p que corresponde a uma estatística de teste específica. Existem também tabelas que fornecem números críticos em um determinado Nível de significância para o número total de execuções.

Executa o exemplo de teste

Vamos trabalhar com o exemplo a seguir para ver como o teste de execução funciona. Suponha que, para uma tarefa, o aluno seja convidado a jogar uma moeda 16 vezes e anote a ordem das caras e coroas que apareceram. Se acabarmos com este conjunto de dados:

H T H H H T T H T T H T H H

Podemos perguntar se o aluno realmente fez sua lição de casa, ou ele trapaceou e escreveu uma série de H e T que parecem aleatórias? O teste de execução pode nos ajudar. As premissas são atendidas para o teste de execuções, pois os dados podem ser classificados em dois grupos, como cabeça ou cauda. Continuamos contando o número de execuções. Reagrupando, vemos o seguinte:

H T HHH TT H TT H T H T HH

Existem dez execuções para nossos dados, com sete caudas e nove cabeças.

A hipótese nula é que os dados são aleatórios. A alternativa é que não é aleatório. Para um nível de significância alfa igual a 0,05, vemos consultando a tabela apropriada que rejeitamos a hipótese nula quando o número de execuções é menor que 4 ou maior que 16. Como existem dez execuções em nossos dados, nós falha em rejeitar a hipótese nula H0.

Aproximação normal

O teste de execução é uma ferramenta útil para determinar se é provável que uma sequência seja aleatória ou não. Para um grande conjunto de dados, às vezes é possível usar uma aproximação normal. Essa aproximação normal exige que usemos o número de elementos em cada categoria e calculemos a média e o desvio padrão do valor apropriado. distribuição normal.

instagram story viewer