Se você passa muito tempo lidando com Estatisticas, logo você se depara com a frase "distribuição de probabilidade". É aqui que realmente conseguimos ver o quanto as áreas de probabilidade e estatística se sobrepõem. Embora isso possa parecer algo técnico, a frase distribuição de probabilidade é realmente apenas uma maneira de falar sobre a organização de uma lista de probabilidades. Uma distribuição de probabilidade é uma função ou regra que atribui probabilidades a cada valor de uma variável aleatória. A distribuição pode, em alguns casos, ser listada. Em outros casos, é apresentado como um gráfico.
Exemplo
Suponha que nós rolar dois dados e depois registre a soma dos dados. São possíveis somas de dois a 12. Cada soma tem uma probabilidade particular de ocorrer. Podemos simplesmente listá-los da seguinte maneira:
- A soma de 2 tem uma probabilidade de 1/36
- A soma de 3 tem uma probabilidade de 2/36
- A soma de 4 tem uma probabilidade de 3/36
- A soma de 5 tem uma probabilidade de 4/36
- A soma de 6 tem uma probabilidade de 5/36
- A soma de 7 tem uma probabilidade de 6/36
- A soma de 8 tem uma probabilidade de 5/36
- A soma de 9 tem uma probabilidade de 4/36
- A soma de 10 tem uma probabilidade de 3/36
- A soma de 11 tem uma probabilidade de 2/36
- A soma de 12 tem uma probabilidade de 1/36
Esta lista é uma distribuição de probabilidade para o experimento de probabilidade de rolar dois dados. Também podemos considerar o exposto como uma distribuição de probabilidade do variável aleatória definido olhando a soma dos dois dados.
Gráfico
Uma distribuição de probabilidade pode ser representada graficamente, e às vezes isso ajuda a nos mostrar características da distribuição que não eram aparentes apenas pela leitura da lista de probabilidades. A variável aleatória é plotada ao longo do xe a probabilidade correspondente é plotada ao longo do y-eixo. Para uma variável aleatória discreta, teremos um histograma. Para uma variável aleatória contínua, teremos o interior de uma curva suave.
As regras de probabilidade ainda estão em vigor e se manifestam de algumas maneiras. Como as probabilidades são maiores ou iguais a zero, o gráfico de uma distribuição de probabilidades deve ter y-coordenadas não-negativas. Outra característica das probabilidades, a saber, qual é o máximo que pode ser a probabilidade de um evento, aparece de outra maneira.
Área = Probabilidade
O gráfico de uma distribuição de probabilidade é construído de tal maneira que as áreas representem probabilidades. Para uma distribuição de probabilidade discreta, estamos apenas calculando as áreas dos retângulos. No gráfico acima, as áreas das três barras correspondentes a quatro, cinco e seis correspondem à probabilidade de que a soma de nossos dados seja quatro, cinco ou seis. As áreas de todas as barras somam um total.
No distribuição normal padrão ou curva de sino, temos uma situação semelhante. A área sob a curva entre dois z valores corresponde à probabilidade de que nossa variável fique entre esses dois valores. Por exemplo, a área abaixo da curva do sino para -1 z.
Distribuições Importantes
Existem literalmente infinitamente muitas distribuições de probabilidade. A seguir, é apresentada uma lista de algumas das distribuições mais importantes:
- Distribuição binomial - Dá o número de sucessos para uma série de experimentos independentes com dois resultados
- Distribuição de qui-quadrado - Para determinar como as quantidades observadas se encaixam no modelo proposto
- Distribuição F - Usado no análise de variação (ANOVA)
- Distribuição normal - Chamou o curva de sino e é encontrado nas estatísticas.
- Distribuição t do aluno - Para uso com amostras pequenas de uma distribuição normal