Há muitos distribuições de probabilidade que são usados nas estatísticas. Por exemplo, a distribuição normal padrão ou curva de sino, é provavelmente o mais amplamente reconhecido. Distribuições normais são apenas um tipo de distribuição. Uma distribuição de probabilidade muito útil para o estudo de variações populacionais é chamada de distribuição F. Examinaremos várias das propriedades desse tipo de distribuição.
Propriedades básicas
A fórmula de densidade de probabilidade para a distribuição F é bastante complicada. Na prática, não precisamos nos preocupar com esta fórmula. No entanto, pode ser bastante útil conhecer alguns detalhes das propriedades relacionadas à distribuição F. Alguns dos recursos mais importantes dessa distribuição estão listados abaixo:
- A distribuição F é uma família de distribuições. Isso significa que há um número infinito de diferentes distribuições F. A distribuição F específica que usamos para um aplicativo depende do número de graus de liberdade que nossa amostra possui. Esse recurso da distribuição F é semelhante tanto ao t-distribuição e distribuição do qui-quadrado.
- A distribuição F é zero ou positiva, portanto, não há valores negativos para F. Esse recurso da distribuição F é semelhante à distribuição qui-quadrado.
- A distribuição F é enviesado para a direita. Portanto, essa distribuição de probabilidade é não simétrica. Esse recurso da distribuição F é semelhante à distribuição qui-quadrado.
Esses são alguns dos recursos mais importantes e facilmente identificados. Vamos olhar mais de perto os graus de liberdade.
Graus de liberdade
Um recurso compartilhado pelas distribuições qui-quadrado, distribuições t e distribuições F é que existe realmente uma família infinita de cada uma dessas distribuições. Uma distribuição específica é destacada pelo conhecimento do número de graus de liberdade. Para t distribuição, o número de graus de liberdade é um a menos que o tamanho da amostra. O número de graus de liberdade para uma distribuição F é determinado de maneira diferente da distribuição t ou mesmo qui-quadrado.
Veremos abaixo exatamente como surge uma distribuição F. Por enquanto, consideraremos apenas o suficiente para determinar o número de graus de liberdade. A distribuição F é derivada de uma razão envolvendo duas populações. Há uma amostra de cada uma dessas populações e, portanto, há graus de liberdade para ambas as amostras. De fato, subtraímos um de ambos os tamanhos de amostra para determinar nossos dois números de graus de liberdade.
As estatísticas dessas populações se combinam em uma fração para a estatística-F. Tanto o numerador quanto o denominador têm graus de liberdade. Em vez de combinar esses dois números em outro número, retemos os dois. Portanto, qualquer uso de uma tabela de distribuição F exige que procuremos dois graus diferentes de liberdade.
Usos da distribuição F
A distribuição F decorre de Estatística inferencial em relação às variações populacionais. Mais especificamente, usamos uma distribuição F quando estamos estudando a razão das variações de duas populações normalmente distribuídas.
A distribuição F não é usada apenas para construir intervalos de confiança e testar hipóteses sobre as variações populacionais. Esse tipo de distribuição também é usado em um fator análise de variância (ANOVA). A ANOVA está preocupada em comparar a variação entre vários grupos e a variação dentro de cada grupo. Para isso, utilizamos uma proporção de variações. Essa proporção de desvios tem a distribuição F. Uma fórmula um tanto complicada nos permite calcular uma estatística F como estatística de teste.