O intervalo de conjuntos de dados estatísticos

Em estatística e matemática, o intervalo é a diferença entre os valores máximo e mínimo de um conjunto de dados e serve como um dos dois recursos importantes de um conjunto de dados. A fórmula para um intervalo é o valor máximo menos o valor mínimo no conjunto de dados, que fornece aos estatísticos uma melhor compreensão de quão variado é o conjunto de dados.

Duas características importantes de um conjunto de dados incluem o centro dos dados e a propagação dos dados, e o centro pode sermedido de várias maneiras: os mais populares são os médios, mediana, mode e midrange, mas de maneira semelhante, existem diferentes maneiras de calcular como o conjunto de dados está espalhado e a medida mais fácil e grosseira de spread é chamada de intervalo.

O cálculo do intervalo é muito direto. Tudo o que precisamos fazer é encontrar a diferença entre o maior valor de dados em nosso conjunto e o menor valor de dados. De forma sucinta, temos a seguinte fórmula: Faixa = Valor máximo - Valor mínimo. Por exemplo, o conjunto de dados 4,6,10, 15, 18 tem um máximo de 18, um mínimo de 4 e um intervalo de

instagram viewer
18-4 = 14.

O intervalo é uma medida muito grosseira da disseminação de dados, porque é extremamente sensível a valores discrepantes e, como resultado, existem certas limitações à utilidade de um verdadeiro intervalo de um conjunto de dados para estatísticos, porque um único valor de dados pode afetar significativamente o valor do alcance.

Por exemplo, considere o conjunto de dados 1, 2, 3, 4, 6, 7, 7, 8. O valor máximo é 8, o mínimo é 1 e o intervalo é 7. Em seguida, considere o mesmo conjunto de dados, apenas com o valor 100 incluído. O alcance agora se torna 100-1 = 99 em que a adição de um único ponto de dados extra afetou bastante o valor do intervalo. O desvio padrão é outra medida de spread menos suscetível a discrepâncias, mas a desvantagem é que o cálculo do desvio padrão é muito mais complicado.

O intervalo também não nos diz nada sobre os recursos internos do nosso conjunto de dados. Por exemplo, consideramos o conjunto de dados 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 em que o intervalo desse conjunto de dados é 10-1 = 9. Se compararmos isso com o conjunto de dados de 1, 1, 1, 2, 9, 9, 9, 10. Aqui o intervalo é, mais uma vez, nove, no entanto, para este segundo conjunto e, diferentemente do primeiro, os dados são agrupados em torno do mínimo e do máximo. Outras estatísticas, como o primeiro e o terceiro quartil, precisariam ser usadas para detectar parte dessa estrutura interna.

O intervalo é uma boa maneira de obter uma compreensão muito básica de como os números distribuídos no conjunto de dados realmente são, pois é fácil calcular, pois requer apenas uma operação aritmética básica, mas também existem algumas outras aplicações do intervalo de um conjunto de dados em Estatisticas.

O intervalo também pode ser usado para estimar outra medida de spread, o desvio padrão. Em vez de seguir uma fórmula bastante complicada para encontrar o desvio padrão, podemos usar o que é chamado de regra de intervalo. O intervalo é fundamental neste cálculo.

O intervalo também ocorre em um boxplotou caixa e bigode. Os valores máximo e mínimo são representados graficamente no final dos bigodes do gráfico e o comprimento total dos bigodes e da caixa é igual ao intervalo.