Desigualdade de probabilidade de Chebyshev

A desigualdade de Chebyshev diz que pelo menos 1-1 /K2 dados de uma amostra devem estar dentro K desvios-padrão da média (aqui K é positivo número real maior que um).

Qualquer conjunto de dados normalmente distribuído ou no formato de um curva de sino, possui vários recursos. Um deles lida com a disseminação dos dados em relação ao número de desvios padrão da média. Em uma distribuição normal, sabemos que 68% dos dados são um desvio padrão da média, 95% são dois desvios padrão da média e aproximadamente 99% está dentro de três desvios padrão da média.

Mas se o conjunto de dados não for distribuído na forma de uma curva de sino, uma quantidade diferente poderá estar dentro de um desvio padrão. A desigualdade de Chebyshev fornece uma maneira de saber em que fração de dados se enquadra K desvios-padrão da média para qualquer conjunto de dados.

Fatos sobre a desigualdade

Também podemos afirmar a desigualdade acima, substituindo a frase "dados de uma amostra" por distribuição de probabilidade. Isso ocorre porque a desigualdade de Chebyshev é resultado da probabilidade, que pode ser aplicada às estatísticas.

instagram viewer

É importante notar que essa desigualdade é um resultado que foi comprovado matematicamente. Não é como o relação empírica entre a média e o modo, ou o regra de ouro que conecta a faixa e o desvio padrão.

Ilustração da desigualdade

Para ilustrar a desigualdade, veremos alguns valores de K:

  • Para K = 2 temos 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Portanto, a desigualdade de Chebyshev diz que pelo menos 75% dos valores dos dados de qualquer distribuição devem estar dentro de dois desvios padrão da média.
  • Para K = 3 temos 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Portanto, a desigualdade de Chebyshev diz que pelo menos 89% dos valores dos dados de qualquer distribuição devem estar dentro de três desvios padrão da média.
  • Para K = 4 temos 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Portanto, a desigualdade de Chebyshev diz que pelo menos 93,75% dos valores dos dados de qualquer distribuição devem estar dentro de dois desvios padrão da média.

Exemplo

Suponha que tenhamos amostrado os pesos dos cães no abrigo de animais local e descobrimos que nossa amostra tem uma média de 20 libras com um desvio padrão de 3 libras. Com o uso da desigualdade de Chebyshev, sabemos que pelo menos 75% dos cães que amostramos possuem pesos que são dois desvios padrão da média. Duas vezes o desvio padrão nos dá 2 x 3 = 6. Subtraia e adicione isso da média de 20. Isso nos diz que 75% dos cães têm peso de 14 libras a 26 libras.

Uso da desigualdade

Se soubermos mais sobre a distribuição com a qual estamos trabalhando, geralmente podemos garantir que mais dados estão a um certo número de desvios padrão da média. Por exemplo, se sabemos que temos uma distribuição normal, 95% dos dados são dois desvios padrão da média. A desigualdade de Chebyshev diz que nessa situação sabemos que finalmente 75% dos dados são dois desvios padrão da média. Como podemos ver neste caso, pode ser muito mais do que esses 75%.

O valor da desigualdade é que ela nos fornece um cenário de "pior caso", no qual as únicas coisas que sabemos sobre nossos dados amostrais (ou distribuição de probabilidade) são a média e desvio padrão. Quando não sabemos mais nada sobre nossos dados, a desigualdade de Chebyshev fornece algumas informações adicionais sobre a distribuição do conjunto de dados.

História da Desigualdade

A desigualdade recebeu o nome do matemático russo Pafnuty Chebyshev, que declarou a desigualdade sem provas em 1874. Dez anos depois, a desigualdade foi comprovada por Markov em seu Ph. D. dissertação. Devido a variações de como representar o alfabeto russo em inglês, é Chebyshev também escrito como Tchebysheff.

instagram story viewer