Nas estatísticas, os graus de liberdade são usados para definir o número de quantidades independentes que podem ser atribuídas a uma distribuição estatística. Esse número normalmente se refere a um número inteiro positivo que indica a falta de restrições à capacidade de uma pessoa calcular fatores ausentes de problemas estatísticos.
Graus de liberdade atuam como variáveis no cálculo final de uma estatística e são usados para determinar o resultado de diferentes cenários em um sistema e em graus de liberdade matemáticos definem o número de dimensões em um domínio necessário para determinar a cheio vetor.
Para ilustrar o conceito de um grau de liberdade, examinaremos um cálculo básico referente à amostra média e, para encontrar a média de uma lista de dados, adicionamos todos os dados e dividimos pelo número total de valores.
Uma ilustração com uma amostra média
Por um momento, suponha que conhecemos o significar de um conjunto de dados é 25 e que os valores nesse conjunto são 20, 10, 50 e um número desconhecido. A fórmula para uma média amostral nos dá a equação
(20 + 10 + 50 + x) / 4 = 25, Onde x denota o desconhecido, usando algumas álgebra, é possível determinar que o número ausente, x, é igual a 20.Vamos alterar um pouco esse cenário. Novamente, supomos que sabemos que a média de um conjunto de dados é 25. No entanto, desta vez os valores no conjunto de dados são 20, 10 e dois valores desconhecidos. Essas incógnitas podem ser diferentes, então usamos duas variáveis diferentes, xe y para denotar isso. A equação resultante é (20 + 10 + x + y) / 4 = 25. Com alguma álgebra, obtemos y = 70- x. A fórmula é escrita neste formulário para mostrar que, quando escolhemos um valor para x, o valor para y é completamente determinado. Temos uma escolha a fazer, e isso mostra que há uma grau de liberdade.
Agora, veremos um tamanho de amostra de cem. Se sabemos que a média desses dados da amostra é 20, mas não sabemos os valores de nenhum dos dados, então existem 99 graus de liberdade. Todos os valores devem somar um total de 20 x 100 = 2000. Quando tivermos os valores de 99 elementos no conjunto de dados, o último será determinado.
Escore t do aluno e distribuição do qui-quadrado
Graus de liberdade desempenham um papel importante ao usar o Aluna ttabela -score. Na verdade, existem vários escore t distribuições. Diferenciamos essas distribuições pelo uso de graus de liberdade.
Aqui o distribuição de probabilidade que usamos depende do tamanho da nossa amostra. Se o nosso tamanho da amostra é n, então o número de graus de liberdade é n-1. Por exemplo, um tamanho de amostra de 22 exigiria que usássemos a linha do ttabela de pontos com 21 graus de liberdade.
O uso de um distribuição qui-quadrado requer também o uso de graus de liberdade. Aqui, de maneira idêntica à da escore t distribuição, o tamanho da amostra determina qual distribuição usar. Se o tamanho da amostra for n, então há n-1 graus de liberdade.
Desvio padrão e técnicas avançadas
Outro lugar onde os graus de liberdade aparecem é a fórmula do desvio padrão. Essa ocorrência não é tão clara, mas podemos ver se sabemos para onde olhar. Para encontre um desvio padrão estamos procurando o desvio "médio" da média. No entanto, depois de subtrair a média de cada valor de dados e calcular as diferenças, acabamos dividindo por n-1 ao invés de n como poderíamos esperar.
A presença do n-1 vem do número de graus de liberdade. Desde o n valores de dados e a média da amostra estão sendo usados na fórmula, existem n-1 graus de liberdade.
Técnicas estatísticas mais avançadas usam maneiras mais complicadas de contar os graus de liberdade. Ao calcular a estatística do teste para duas médias, com amostras independentes de n1 e n2 elementos, o número de graus de liberdade tem uma fórmula bastante complicada. Pode ser estimado usando o menor de n1-1 e n2-1
Outro exemplo de uma maneira diferente de contar os graus de liberdade vem com um F teste. Ao conduzir um F teste que temos k amostras de cada tamanho n—Os graus de liberdade no numerador são k-1 e no denominador é k(n-1).