Qual é a mediana nas estatísticas?

click fraud protection

É a exibição da meia-noite do mais recente filme de sucesso. As pessoas estão alinhadas do lado de fora do teatro, esperando para entrar. Suponha que você seja solicitado a encontrar o centro da linha. Como você faria isso?

Existem algumas maneiras diferentes de se fazer resolvendo esse problema. No final, você teria que descobrir quantas pessoas estavam na fila e pegar metade desse número. Se o número total for par, o centro da linha estará entre duas pessoas. Se o número total for ímpar, o centro seria uma única pessoa.

Você pode perguntar: "O que encontrar o centro de uma linha tem a ver com Estatisticas? "Essa idéia de encontrar o centro é exatamente o que é usado no cálculo da mediana de um conjunto de dados.

Qual é a mediana?

A mediana é uma das três principais formas de encontrar a média de Dados estatísticos. É mais difícil calcular do que o modo, mas não é tão trabalhoso quanto calcular a média. É o centro da mesma maneira que encontrar o centro de uma fila de pessoas. Depois de listar os valores dos dados em ordem crescente, a mediana é o valor dos dados com o mesmo número de valores acima e abaixo dele.

instagram viewer

Caso um: um número ímpar de valores

Onze baterias são testadas para ver quanto tempo duram. Suas vidas, em horas, são dadas por 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Qual é a duração média da vida? Como existe um número ímpar de valores de dados, isso corresponde a uma linha com um número ímpar de pessoas. O centro será o valor do meio.

Existem onze valores de dados, portanto o sexto está no centro. Portanto, a duração média da bateria é o sexto valor nesta lista, ou 105 horas. Observe que a mediana é um dos valores dos dados.

Caso dois: um número par de valores

Vinte gatos são pesados. Seus pesos, em libras, são dados por 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Qual é o peso médio dos felinos? Como existe um número par de valores de dados, isso corresponde à linha com um número par de pessoas. O centro está entre os dois valores médios.

Nesse caso, o centro está entre o décimo e o décimo primeiro valores de dados. Para encontrar a mediana, calculamos a média desses dois valores e obtemos (7 + 8) / 2 = 7,5. Aqui a mediana não é um dos valores dos dados.

Algum outro caso?

As duas únicas possibilidades são ter um número par ou ímpar de valores de dados. Portanto, os dois exemplos acima são as únicas maneiras possíveis de calcular a mediana. Ou a mediana será o valor médio ou a mediana será a média dos dois valores médios. Normalmente, os conjuntos de dados são muito maiores do que os que vimos acima, mas o processo de encontrar a mediana é o mesmo desses dois exemplos.

O efeito dos outliers

A média e o modo são altamente sensíveis aos valores discrepantes. O que isto significa é que a presença de um outlier afetará dramaticamente essas duas medidas do centro. Uma vantagem da mediana é que ela não é influenciada tanto por um erro externo.

Para ver isso, considere o conjunto de dados 3, 4, 5, 5, 6. A média é (3 + 4 + 5 + 5 + 6) / 5 = 4,6, e a mediana é 5. Agora mantenha o mesmo conjunto de dados, mas adicione o valor 100: 3, 4, 5, 5, 6, 100. Claramente 100 é um erro externo, pois é muito maior que todos os outros valores. A média do novo conjunto é agora (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. No entanto, o mediana do novo conjunto é 5. Apesar de

Aplicação da mediana

Devido ao que vimos acima, a mediana é a medida preferida da média quando os dados contêm valores discrepantes. Quando os rendimentos são reportados, uma abordagem típica é reportar a renda mediana. Isso é feito porque a renda média é distorcida por um pequeno número de pessoas com renda muito alta (pense Bill Gates e Oprah).

instagram story viewer