O que é assimetria nas estatísticas?

Algumas distribuições de dados, como o curva de sino ou distribuição normal, são simétricos. Isso significa que a direita e a esquerda da distribuição são imagens espelhadas perfeitas uma da outra. Nem toda distribuição de dados é simétrica. Conjuntos de dados que não são simétricos são considerados assimétricos. A medida de quão assimétrica pode ser uma distribuição é chamada assimetria.

A média, mediana e modo são todos medidas do centro de um conjunto de dados. A assimetria dos dados pode ser determinada pela forma como essas quantidades se relacionam.

Inclinado para a direita

Os dados inclinados para a direita têm uma cauda longa que se estende para a direita. Uma maneira alternativa de falar sobre um conjunto de dados inclinado para a direita é dizer que ele é inclinado positivamente. Nesta situação, a média e a mediana são ambos maiores que o modo. Como regra geral, na maioria das vezes para os dados inclinados para a direita, a média será maior que a mediana. Em resumo, para um conjunto de dados inclinado para a direita:

instagram viewer
  • Sempre: média maior que o modo
  • Sempre: mediana maior que o modo
  • Na maioria das vezes: média maior que a mediana

Inclinado para a esquerda

A situação se reverte quando lidamos com dados inclinados para a esquerda. Os dados inclinados para a esquerda têm uma cauda longa que se estende para a esquerda. Uma maneira alternativa de falar sobre um conjunto de dados inclinado para a esquerda é dizer que ele está inclinado negativamente. Nessa situação, a média e a mediana são ambas inferiores ao modo. Como regra geral, na maioria das vezes para os dados inclinados para a esquerda, a média será menor que a mediana. Em resumo, para um conjunto de dados inclinado para a esquerda:

  • Sempre: significa menos que o modo
  • Sempre: mediana menor que o modo
  • Na maioria das vezes: média menor que a mediana

Medidas de assimetria

Uma coisa é analisar dois conjuntos de dados e determinar se um é simétrico enquanto o outro é assimétrico. Outra é analisar dois conjuntos de dados assimétricos e dizer que um é mais distorcido que o outro. Pode ser muito subjetivo determinar qual é mais distorcido simplesmente olhando para o gráfico da distribuição. É por isso que existem maneiras de calcular numericamente a medida da assimetria.

Uma medida da assimetria, chamada primeiro coeficiente de assimetria de Pearson, é subtrair a média do modo e depois dividir essa diferença pelo desvio padrão dos dados. A razão para dividir a diferença é que temos uma quantidade adimensional. Isso explica por que os dados inclinados para a direita têm uma inclinação positiva. Se o conjunto de dados estiver inclinado para a direita, a média será maior que o modo e, portanto, subtrair o modo da média fornecerá um número positivo. Um argumento semelhante explica por que os dados inclinados para a esquerda têm distorção negativa.

O segundo coeficiente de assimetria de Pearson também é usado para medir a assimetria de um conjunto de dados. Para essa quantidade, subtraímos o modo da mediana, multiplicamos esse número por três e depois dividimos pelo desvio padrão.

Aplicações de dados distorcidos

Dados distorcidos surgem naturalmente em várias situações. A renda é distorcida para a direita, porque apenas alguns indivíduos que ganham milhões de dólares podem afetar muito a média e não há renda negativa. Da mesma forma, os dados que envolvem a vida útil de um produto, como uma marca de lâmpada, são inclinados para a direita. Aqui, o menor que a vida pode ser é zero, e as lâmpadas de longa duração transmitirão uma distorção positiva aos dados.

instagram story viewer