Como encontrar graus de liberdade nas estatísticas

Muitos problemas de inferência estatística exigem que encontremos o número de graus de liberdade. O número de graus de liberdade seleciona um único distribuição de probabilidade dentre infinitamente muitos. Esta etapa é um detalhe muitas vezes esquecido, mas crucial, tanto no cálculo deintervalos de confiança e o funcionamento de testes de hipóteses.

Não existe uma única fórmula geral para o número de graus de liberdade. No entanto, existem fórmulas específicas usadas para cada tipo de procedimento nas estatísticas inferenciais. Em outras palavras, a configuração em que estamos trabalhando determinará o número de graus de liberdade. A seguir, é apresentada uma lista parcial de alguns dos procedimentos de inferência mais comuns, juntamente com o número de graus de liberdade usados ​​em cada situação.

Distribuição Normal Padrão

Procedimentos envolvendo distribuição normal padrão são listadas quanto à integridade e para esclarecer alguns conceitos errôneos. Esses procedimentos não exigem que encontremos o número de graus de liberdade. A razão para isto é que existe uma distribuição normal padrão única. Esses tipos de procedimentos abrangem aqueles que envolvem uma média populacional quando o desvio padrão da população já é conhecido e também procedimentos relativos às proporções populacionais.

instagram viewer

Procedimentos T de uma amostra

Às vezes, a prática estatística exige que usemos a distribuição t de Student. Para esses procedimentos, como aqueles que lidam com uma média populacional com desvio padrão desconhecido da população, o número de graus de liberdade é um a menos que o tamanho da amostra. Portanto, se o tamanho da amostra for n, então há n - 1 grau de liberdade.

Procedimentos T com dados emparelhados

Muitas vezes faz sentido tratar dados como emparelhados. O emparelhamento é realizado normalmente devido a uma conexão entre o primeiro e o segundo valor em nosso par. Muitas vezes emparelhamos antes e depois das medições. Nossa amostra de dados emparelhados não é independente; no entanto, a diferença entre cada par é independente. Assim, se a amostra tiver um total de n pares de pontos de dados (para um total de 2n valores), então existem n - 1 grau de liberdade.

Procedimentos T para duas populações independentes

Para esses tipos de problemas, ainda estamos usando um distribuição t. Desta vez, há uma amostra de cada uma de nossas populações. Embora seja preferível que essas duas amostras sejam do mesmo tamanho, isso não é necessário para nossos procedimentos estatísticos. Assim, podemos ter duas amostras de tamanho n1 e n2. Existem duas maneiras de determinar o número de graus de liberdade. O método mais preciso é usar a fórmula de Welch, uma fórmula computacionalmente complicada que envolve os tamanhos e desvios padrão da amostra. Outra abordagem, chamada de aproximação conservadora, pode ser usada para estimar rapidamente os graus de liberdade. Este é simplesmente o menor dos dois números n1 - 1 e n2 - 1.

Qui-quadrado para a independência

Um uso do teste qui-quadrado é ver se duas variáveis ​​categóricas, cada uma com vários níveis, exibem independência. As informações sobre essas variáveis ​​são registradas em um mesa de mão dupla com r linhas e c colunas. O número de graus de liberdade é o produto (r - 1)(c - 1).

Qualidade do ajuste do qui-quadrado

A qualidade do ajuste do qui-quadrado começa com uma única variável categórica com um total de n níveis. Testamos a hipótese de que essa variável corresponde a um modelo predeterminado. O número de graus de liberdade é um a menos que o número de níveis. Em outras palavras, existem n - 1 grau de liberdade.

ANOVA de um fator

Um fator análise de variação (ANOVA) nos permite fazer comparações entre vários grupos, eliminando a necessidade de vários testes de hipótese em pares. Como o teste exige que medamos tanto a variação entre vários grupos quanto a variação dentro de cada grupo, terminamos com dois graus de liberdade. o Estatística F, que é usado para um fator ANOVA, é uma fração. O numerador e o denominador têm graus de liberdade. Deixei c ser o número de grupos e n é o número total de valores de dados. O número de graus de liberdade para o numerador é um a menos que o número de grupos, ou c - 1. O número de graus de liberdade para o denominador é o número total de valores de dados, menos o número de grupos ou n - c.

É claro que precisamos ter muito cuidado para saber com qual procedimento de inferência estamos trabalhando. Esse conhecimento nos informará sobre o número correto de graus de liberdade de uso.

instagram story viewer