Há uma variedade de estatísticas descritivas. Números como a média, medianamodo assimetriacurtose, desvio padrão, primeiro quartil e terceiro quartil, para citar alguns, cada um deles diz algo sobre nossos dados. Em vez de olhar para estes estatísticas descritivas individualmente, às vezes combiná-los ajuda a fornecer uma imagem completa. Com esse objetivo em mente, o resumo de cinco números é uma maneira conveniente de combinar cinco estatísticas descritivas.
Quais Cinco Números?
É claro que deve haver cinco números em nosso resumo, mas quais cinco? Os números escolhidos são para nos ajudar a conhecer o centro de nossos dados, bem como a distribuição dos pontos de dados. Com isso em mente, o resumo de cinco números consiste no seguinte:
- O mínimo - este é o menor valor em nosso conjunto de dados.
- O primeiro quartil - esse número é indicado Q1 e 25% dos nossos dados ficam abaixo do primeiro quartil.
- A mediana - este é o ponto intermediário dos dados. 50% de todos os dados ficam abaixo da mediana.
- O terceiro quartil - esse número é indicado Q3 e 75% dos nossos dados ficam abaixo do terceiro quartil.
- O máximo - este é o maior valor em nosso conjunto de dados.
A média e o desvio padrão também podem ser usados juntos para transmitir o centro e a disseminação de um conjunto de dados. No entanto, essas duas estatísticas são suscetíveis a discrepâncias. A mediana, primeiro quartil e terceiro quartil não são tão fortemente influenciados por discrepantes.
Um exemplo
Dado o seguinte conjunto de dados, reportaremos o resumo de cinco números:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Há um total de vinte pontos no conjunto de dados. A mediana é, portanto, a média dos décimos e décimos primeiros valores de dados ou:
(7 + 8)/2 = 7.5.
A mediana da metade inferior dos dados é o primeiro quartil. A metade inferior é:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Assim calculamosQ1= (4 + 6)/2 = 5.
A mediana da metade superior do conjunto de dados original é o terceiro quartil. Precisamos encontrar a mediana de:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Assim calculamosQ3= (15 + 15)/2 = 15.
Reunimos todos os resultados acima juntos e informamos que o resumo de cinco números para o conjunto de dados acima é 1, 5, 7,5, 12, 20.
Representação gráfica
Cinco resumos numéricos podem ser comparados entre si. Veremos que dois conjuntos com médias semelhantes e desvios padrão podem ter resumos de cinco números muito diferentes. Para comparar facilmente dois resumos de cinco números, podemos usar um boxplotou gráfico de caixa e bigodes.