O desvio padrão e o alcance são ambos medidas da propagação de um conjunto de dados. Cada número nos diz, à sua maneira, como os dados estão espaçados, pois são uma medida de variação. Embora não exista uma relação explícita entre o faixa e desvio padrão, existe um regra de ouro isso pode ser útil para relacionar essas duas estatísticas. Às vezes, esse relacionamento é chamado de regra de intervalo para desvio padrão.
A regra do intervalo indica que o desvio padrão de uma amostra é aproximadamente igual a um quarto do intervalo dos dados. Em outras palavrass = (Máximo - Mínimo) / 4. Esta é uma fórmula muito simples de usar e deve ser usada apenas como uma solução muito grosseira. estimativa do desvio padrão.
Um exemplo
Para ver um exemplo de como a regra de intervalo funciona, veremos o exemplo a seguir. Suponha que comecemos com os valores de 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Esses valores têm um significar de 17 e um desvio padrão de cerca de 4,1. Se, em vez disso, primeiro calcularmos o intervalo de nossos dados como 25 - 12 = 13 e, em seguida, divida esse número por quatro, temos nossa estimativa do desvio padrão como 13/4 = 3,25. Esse número é relativamente próximo do verdadeiro desvio padrão e bom para uma estimativa aproximada.
Por que isso funciona?
Pode parecer que a regra de alcance é um pouco estranha. Por que isso funciona? Não parece completamente arbitrário dividir o intervalo por quatro? Por que não dividiríamos por um número diferente? Na verdade, existe alguma justificativa matemática nos bastidores.
Lembre-se das propriedades do curva de sino e as probabilidades de um distribuição normal padrão. Um recurso tem a ver com a quantidade de dados que cai dentro de um certo número de desvios padrão:
- Aproximadamente 68% dos dados estão dentro de um desvio padrão (maior ou menor) da média.
- Aproximadamente 95% dos dados estão dentro de dois desvios padrão (mais altos ou mais baixos) da média.
- Aproximadamente 99% está dentro de três desvios padrão (mais alto ou mais baixo) da média.
O número que usaremos tem a ver com 95%. Podemos dizer que 95% de dois desvios padrão abaixo da média para dois desvios padrão acima da média, temos 95% de nossos dados. Assim, quase toda a nossa distribuição normal se estenderia por um segmento de linha com um total de quatro desvios-padrão.
Nem todos os dados são normalmente distribuídos e em forma de curva de sino. Mas a maioria dos dados é bem comportada o suficiente para que dois desvios-padrão da média capturem quase todos os dados. Estimamos e dizemos que quatro desvios-padrão são aproximadamente do tamanho do intervalo e, portanto, o intervalo dividido por quatro é uma aproximação aproximada do desvio-padrão.
Usos para a regra de intervalo
A regra do intervalo é útil em várias configurações. Primeiro, é uma estimativa muito rápida do desvio padrão. O desvio padrão exige que primeiro localizemos a média e subtraímos essa média de cada ponto de dados, quadrado as diferenças, adicione-as, divida-as por um a menos que o número de pontos de dados e, em seguida, (finalmente) pegue o quadrado raiz. Por outro lado, a regra do intervalo requer apenas uma subtração e uma divisão.
Outros lugares em que a regra de alcance é útil é quando temos informações incompletas. Fórmulas como a que determina o tamanho da amostra requerem três informações: a desejada margem de erro, a nível de confiança e o desvio padrão da população que estamos investigando. Muitas vezes é impossível saber o que a população desvio padrão é. Com a regra do intervalo, podemos estimar esta estatística e, em seguida, saber o quão grande devemos aumentar nossa amostra.