Uma Introdução à Faixa Interquartil

O intervalo interquartil (IQR) é a diferença entre o primeiro quartil e o terceiro quartil. A fórmula para isso é:

IQR = Q3 - Q1

Existem muitas medidas da variabilidade de um conjunto de dados. Tanto o alcance e desvio padrão diga-nos como os dados estão espalhados. O problema com essas estatísticas descritivas é que elas são bastante sensíveis aos valores discrepantes. Uma medida da dispersão de um conjunto de dados mais resistente à presença de valores discrepantes é o intervalo interquartil.

Definição da Faixa Interquartil

Como visto acima, o intervalo interquartil é construído com base no cálculo de outras estatísticas. Antes de determinar a faixa interquartil, precisamos primeiro conhecer os valores do primeiro e do terceiro quartil. (Obviamente, o primeiro e o terceiro quartis dependem do valor da mediana).

Depois de determinarmos os valores do primeiro e terceiro quartis, é fácil calcular o intervalo interquartil. Tudo o que precisamos fazer é subtrair o primeiro quartil do terceiro quartil. Isso explica o uso do termo intervalo interquartil para esta estatística.

instagram viewer

Exemplo

Para ver um exemplo do cálculo de um intervalo interquartil, consideraremos o conjunto de dados: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. o resumo de cinco números para este conjunto de dados é:

  • Mínimo de 2
  • Primeiro quartil de 3,5
  • Mediana de 6
  • Terceiro quartil de 8
  • Máximo de 9

Assim, vemos que o intervalo interquartil é 8 - 3,5 = 4,5.

O significado da faixa interquartil

O intervalo nos fornece uma medida de como está espalhada a totalidade de nosso conjunto de dados. O intervalo interquartil, que nos diz a que distância o primeiro e terceiro quartil indica como estão espalhados os 50% do meio de nosso conjunto de dados.

Resistência a Outliers

A principal vantagem de usar o intervalo interquartil em vez do intervalo para a medição da propagação de um conjunto de dados é que o intervalo interquartil não é sensível a valores discrepantes. Para ver isso, veremos um exemplo.

Do conjunto de dados acima, temos um intervalo interquartil de 3,5, um intervalo de 9 - 2 = 7 e um desvio padrão de 2,34. Se substituirmos o valor mais alto de 9 por um valor extremo extremo de 100, o desvio padrão será 27,37 e o intervalo será 98. Embora tenhamos mudanças drásticas desses valores, o primeiro e o terceiro quartis não são afetados e, portanto, o intervalo interquartil não muda.

Uso da Faixa Interquartil

Além de ser uma medida menos sensível da propagação de um conjunto de dados, o intervalo interquartil tem outro uso importante. Devido à sua resistência a outliers, o intervalo interquartil é útil para identificar quando um valor é outlier.

o regra de intervalo interquartil é o que nos informa se temos uma discrepância leve ou forte. Para procurar um outlier, devemos olhar abaixo do primeiro quartil ou acima do terceiro quartil. Até onde devemos ir depende do valor do intervalo interquartil.

instagram story viewer