Exemplo de Bootstrapping nas estatísticas

Bootstrapping é uma técnica estatística poderosa. É especialmente útil quando o amostra o tamanho com o qual estamos trabalhando é pequeno. Em circunstâncias usuais, amostras com tamanho inferior a 40 não podem ser tratadas assumindo uma distribuição normal ou um distribuição t. As técnicas de bootstrap funcionam muito bem com amostras com menos de 40 elementos. A razão para isto é que o bootstrapping envolve reamostragem. Esses tipos de técnicas não assumem nada sobre o distribuição dos nossos dados.

O bootstrapping se tornou mais popular à medida que os recursos de computação se tornaram mais facilmente disponíveis. Isso ocorre para que o bootstrapping seja prático, um computador deve ser usado. Veremos como isso funciona no exemplo a seguir de inicialização.

Começamos com uma amostra estatística de uma população sobre a qual não sabemos nada. Nosso objetivo será um intervalo de confiança de 90% sobre a média da amostra. Embora outras técnicas estatísticas usadas para determinar intervalos de confiança

instagram viewer
suponha que sabemos o desvio médio ou padrão de nossa população, o bootstrapping não requer nada além da amostra.

Para fins do nosso exemplo, assumiremos que a amostra é 1, 2, 4, 4, 10.

Agora, fazemos uma nova amostra com a substituição de nossa amostra para formar o que é conhecido como amostra de autoinicialização. Cada amostra de bootstrap terá um tamanho de cinco, assim como nossa amostra original. Como estamos selecionando aleatoriamente e substituindo cada valor, as amostras de inicialização podem ser diferentes da amostra original e uma da outra.

Para exemplos nos quais encontraríamos no mundo real, faríamos isso reamostrando centenas, senão milhares de vezes. A seguir, veremos um exemplo de 20 exemplos de inicialização:

Como estamos usando o bootstrapping para calcular um intervalo de confiança para a média da população, agora calculamos as médias de cada uma de nossas amostras de bootstrap. Esses meios, organizados em ordem crescente, são: 2, 2.4, 2.6, 2.6, 2.8, 3, 3, 3.2, 3.4, 3.6, 3.8, 4, 4, 4.2, 4.6, 5.2, 6, 6, 6.6, 7.6.

Agora obtemos da nossa lista de amostra de bootstrap um intervalo de confiança. Como queremos um intervalo de confiança de 90%, usamos os percentis 95 e 5 como pontos finais dos intervalos. A razão para isso é que dividimos 100% - 90% = 10% ao meio, para que tenhamos os 90% do meio de todas as médias da amostra de autoinicialização.

instagram story viewer