Os boxplots recebem esse nome pelo que eles se parecem. Eles são chamados de parcelas de caixas e bigodes. Esses tipos de gráficos são usados para exibir o intervalo, medianae quartis. Quando eles são concluídos, uma caixa contém o primeiro e terceiro quartis. Os bigodes se estendem da caixa para os valores mínimo e máximo dos dados.
As páginas a seguir mostrarão como fazer um boxplot para um conjunto de dados com no mínimo 20, primeiro quartil 25, mediana 32, terceiro quartil 35 e máximo 43.
Desenhe cinco linhas verticais acima da linha numérica, uma para cada um dos valores mínimos, primeiro quartil, mediana, terceiro quartil e máximo. Normalmente, as linhas para o mínimo e o máximo são mais curtas que as linhas para os quartis e mediana.
Para nossos dados, o mínimo é 20, o primeiro quartil é 25, a mediana é 32, o terceiro quartil é 35 e o máximo é 43. As linhas correspondentes a esses valores são desenhadas acima.
Em seguida, desenhamos uma caixa e usamos algumas das linhas para nos guiar. O primeiro quartil é o lado esquerdo da nossa caixa. O terceiro quartil é o lado direito da nossa caixa. A mediana cai em qualquer lugar dentro da caixa.
Pela definição do primeiro e terceiro quartis, metade de todos os valores dos dados estão contidos na caixa.
Agora vemos como um gráfico de caixa e bigode recebe a segunda parte de seu nome. Os bigodes são atraídos para demonstrar o alcance dos dados. Desenhe uma linha horizontal a partir da linha do mínimo ao lado esquerdo da caixa no primeiro quartil. Este é um dos nossos bigodes. Desenhe uma segunda linha horizontal do lado direito da caixa no terceiro quartil até a linha que representa o máximo dos dados. Este é o nosso segundo bigode.
Nosso gráfico de caixa e bigode, ou boxplot, agora está completo. De relance, podemos determinar o intervalo dos valores dos dados e o grau em que tudo está agrupado. O próximo passo mostra como podemos comparar e contrastar dois boxplots.
Os gráficos de caixa e bigode exibem o resumo de cinco números de um conjunto de dados. Assim, dois conjuntos de dados diferentes podem ser comparados examinando-se seus gráficos de caixas. Acima, um segundo gráfico de caixa foi desenhado acima do que construímos.
Existem alguns recursos que merecem menção. A primeira é que as medianas dos dois conjuntos de dados são idênticas. A linha vertical dentro de ambas as caixas está no mesmo lugar na linha numérica. A segunda coisa a observar sobre os dois gráficos de caixa e bigode é que o gráfico superior não está tão espalhado no gráfico inferior. A caixa superior é menor e os bigodes não se estendem tão longe.
Desenhar dois gráficos de caixa acima da mesma linha numérica supõe que os dados por trás de cada um merecem ser comparados. Não faria sentido comparar um boxplot de alturas de alunos da terceira série com pesos de cães em um abrigo local. Embora ambos contenham dados na proporção nível de medição, não há motivo para comparar os dados.
Por outro lado, faria sentido comparar gráficos de caixas das alturas da terceira série se um gráfico representaram os dados dos meninos em uma escola, e o outro gráfico representou os dados das meninas em a escola.