Graus de liberdade pela independência na mesa de mão dupla

O número de graus de liberdade A independência de duas variáveis ​​categóricas é dada por uma fórmula simples: (r - 1)(c - 1). Aqui r é o número de linhas e c é o número de colunas no mesa de duas vias dos valores da variável categórica. Leia para aprender mais sobre este tópico e entender por que essa fórmula fornece o número correto.

fundo

Um passo no processo de muitos testes de hipóteses é a determinação do número de graus de liberdade. Esse número é importante porque, para distribuições de probabilidade que envolvem uma família de distribuições, como a distribuição qui-quadrado, o número de graus de liberdade identifica a distribuição exata da família que deveríamos usar em nossa hipótese teste.

Graus de liberdade representam o número de escolhas livres que podemos fazer em uma determinada situação. Um dos testes de hipótese que exige que determinemos os graus de liberdade é o qui-quadrado teste de independência para duas variáveis ​​categóricas.

Testes para tabelas independentes e bidirecionais

instagram viewer

O teste do qui-quadrado para independência exige que construamos uma tabela bidirecional, também conhecida como tabela de contingência. Este tipo de tabela possui r linhas e c colunas, representando o r níveis de uma variável categórica e os c níveis da outra variável categórica. Portanto, se não contarmos a linha e a coluna em que registramos totais, haverá um total de rc células na tabela de mão dupla.

O teste do qui-quadrado para independência nos permite testar a hipótese de que o categórico variáveis ​​são independentes uma da outra. Como mencionamos acima, o r linhas e c colunas na tabela nos fornecem (r - 1)(c - 1) graus de liberdade. Mas pode não estar imediatamente claro por que esse é o número correto de graus de liberdade.

O número de graus de liberdade

Para ver o porquê (r - 1)(c - 1) é o número correto, examinaremos essa situação com mais detalhes. Suponha que conhecemos os totais marginais para cada um dos níveis de nossas variáveis ​​categóricas. Em outras palavras, sabemos o total de cada linha e o total de cada coluna. Para a primeira linha, existem c colunas em nossa tabela, então existem c células. Uma vez que conhecemos os valores de todas, exceto uma dessas células, porque sabemos o total de todas as células, é um problema simples de álgebra determinar o valor da célula restante. Se estivéssemos preenchendo essas células da nossa tabela, poderíamos entrar c - 1 deles livremente, mas a célula restante é determinada pelo total da linha. Assim, existem c - 1 grau de liberdade para a primeira linha.

Continuamos dessa maneira para a próxima linha e há novamente c - 1 grau de liberdade. Esse processo continua até chegarmos à penúltima linha. Cada uma das linhas, exceto a última, contribui c - 1 grau de liberdade para o total. No momento em que temos tudo, exceto a última linha, porque sabemos a soma da coluna, podemos determinar todas as entradas da linha final. Isso nos dá r - 1 linha com c - 1 grau de liberdade em cada uma delas, totalizando (r - 1)(c - 1) graus de liberdade.

Exemplo

Vemos isso com o seguinte exemplo. Suponha que tenhamos uma tabela de duas vias com duas variáveis ​​categóricas. Uma variável possui três níveis e a outra possui dois. Além disso, suponha que sabemos os totais de linha e coluna para esta tabela:

Nível A Nível B Total
Nível 1 100
Nível 2 200
Nível 3 300
Total 200 400 600

A fórmula prevê que existem (3-1) (2-1) = 2 graus de liberdade. Vemos isso da seguinte maneira. Suponha que preenchemos a célula superior esquerda com o número 80. Isso determinará automaticamente toda a primeira linha de entradas:

Nível A Nível B Total
Nível 1 80 20 100
Nível 2 200
Nível 3 300
Total 200 400 600

Agora, se sabemos que a primeira entrada na segunda linha é 50, o restante da tabela é preenchido, porque sabemos o total de cada linha e coluna:

Nível A Nível B Total
Nível 1 80 20 100
Nível 2 50 150 200
Nível 3 70 230 300
Total 200 400 600

A mesa está totalmente preenchida, mas só tivemos duas opções gratuitas. Uma vez conhecidos esses valores, o restante da tabela foi completamente determinado.

Embora normalmente não precisemos saber por que existem tantos graus de liberdade, é bom saber que estamos realmente apenas aplicando o conceito de graus de liberdade a uma nova situação.

instagram story viewer