o mediana de um conjunto de dados é o ponto intermediário em que exatamente metade dos valores dos dados é menor ou igual à mediana. De maneira semelhante, podemos pensar na mediana de um contínuodistribuição de probabilidade, mas, em vez de encontrar o valor do meio em um conjunto de dados, encontramos o meio da distribuição de uma maneira diferente.
A área total sob uma função de densidade de probabilidade é 1, representando 100% e, como resultado, metade disso pode ser representada por metade ou 50%. Uma das grandes idéias da estatística matemática é que a probabilidade é representada pela área sob a curva da função densidade, que é calculada por uma integral e, portanto, a mediana de uma distribuição contínua é o ponto a número real linha onde exatamente metade da área fica à esquerda.
Isso pode ser afirmado de forma mais sucinta pela seguinte integral incorreta. A mediana da variável aleatória contínua X com função de densidade f( x) é o valor M tal que:
0.5=∫m−∞f(x)dx
Mediana da Distribuição Exponencial
Agora calculamos a mediana da distribuição exponencial Exp (A). Uma variável aleatória com esta distribuição possui função de densidade f(x) = e-x/UMA/ A para x qualquer número real não negativo. A função também contém o constante matemática e, aproximadamente igual a 2,71828.
Como a função densidade de probabilidade é zero para qualquer valor negativo de x, tudo o que precisamos fazer é integrar o seguinte e resolver o M:
0,5 = ∫0M f (x) dx
Desde a integral ∫ e-x/UMA/De Anúnciosx = -e-x/UMA, o resultado é que
0,5 = -e-M / A + 1
Isso significa que 0,5 = e-M / A e depois de tomar o logaritmo natural de ambos os lados da equação, temos:
ln (1/2) = -M / A
Desde 1/2 = 2-1, pelas propriedades dos logaritmos que escrevemos:
- ln2 = -M / A
Multiplicar os dois lados por A nos dá o resultado de que a mediana M = A ln2.
Desigualdade Média-Média em Estatística
Uma consequência desse resultado deve ser mencionada: a média da distribuição exponencial Exp (A) é A e, como ln2 é menor que 1, segue-se que o produto Aln2 é menor que A. Isso significa que a mediana da distribuição exponencial é menor que a média.
Isso faz sentido se pensarmos no gráfico da função densidade de probabilidade. Devido à cauda longa, essa distribuição é inclinada para a direita. Muitas vezes, quando uma distribuição é inclinada para a direita, a média é para a direita da mediana.
O que isso significa em termos de análise estatística é que muitas vezes podemos prever que a média e a mediana não correlacionada, dada a probabilidade de os dados serem inclinados para a direita, o que pode ser expresso como a prova da desigualdade média-média conhecido como Desigualdade de Chebyshev.
Como exemplo, considere um conjunto de dados que postula que uma pessoa recebe um total de 30 visitantes em 10 horas, em que o tempo médio de espera de um visitante é de 20 minutos, embora o conjunto de dados possa mostrar que o tempo médio de espera estaria entre 20 e 30 minutos, se mais da metade desses visitantes aparecerem nos cinco primeiros horas.