Inclinação da linha de regressão e coeficiente de correlação

Muitas vezes no estudo de Estatisticas é importante fazer conexões entre diferentes tópicos. Veremos um exemplo disso, no qual a inclinação da linha de regressão está diretamente relacionada à coeficiente de correlação. Como esses conceitos envolvem linhas retas, é natural fazer a pergunta: "Como estão o coeficiente de correlação e linha menos quadrada relacionado? "

Primeiro, examinaremos alguns antecedentes sobre esses dois tópicos.

Detalhes sobre a correlação

É importante lembrar os detalhes referentes ao coeficiente de correlação, indicado por r. Essa estatística é usada quando emparelhamos Dados quantitativos. De um gráfico de dispersão de dados emparelhados, podemos procurar tendências na distribuição geral de dados. Alguns dados emparelhados exibem um padrão linear ou linear. Mas, na prática, os dados nunca caem exatamente ao longo de uma linha reta.

Várias pessoas olhando para o mesmo gráfico de dispersão dos dados emparelhados discordariam quanto à proximidade de mostrar uma tendência linear geral. Afinal, nossos critérios para isso podem ser um pouco subjetivos. A escala que usamos também pode afetar nossa percepção dos dados. Por esses motivos e mais, precisamos de algum tipo de medida objetiva para saber quão perto nossos dados emparelhados estão de serem lineares. O coeficiente de correlação consegue isso para nós.

instagram viewer

Alguns fatos básicos sobre r incluir:

  • O valor de r varia entre qualquer número real de -1 a 1.
  • Valores de r perto de 0 implica que há pouca ou nenhuma relação linear entre os dados.
  • Valores de r perto de 1 implica que existe uma relação linear positiva entre os dados. Isso significa que, como x aumenta isso y também aumenta.
  • Valores de r perto de -1 implica que existe uma relação linear negativa entre os dados. Isso significa que, como x aumenta isso y diminui.

A inclinação da linha dos mínimos quadrados

Os dois últimos itens da lista acima apontam para a inclinação da linha de mínimos quadrados de melhor ajuste. Lembre-se de que a inclinação de uma linha é uma medida de quantas unidades sobe ou desce para cada unidade que movemos para a direita. Às vezes, isso é declarado como o aumento da linha dividida pela corrida ou a mudança no y valores divididos pela mudança de x valores.

Em geral, as retas têm inclinações positivas, negativas ou zero. Se examinarmos nossas linhas de regressão quadradas e comparar os valores correspondentes de r, notamos que toda vez que nossos dados têm um coeficiente de correlação negativo, a inclinação da linha de regressão é negativa. Da mesma forma, para cada vez que temos um coeficiente de correlação positivo, a inclinação da linha de regressão é positiva.

Deveria ser evidente a partir dessa observação que existe definitivamente uma conexão entre o sinal do coeficiente de correlação e a inclinação da linha dos mínimos quadrados. Resta explicar por que isso é verdade.

A fórmula para a inclinação

O motivo da conexão entre o valor de r e a inclinação da linha dos mínimos quadrados tem a ver com a fórmula que nos dá a inclinação dessa linha. Para dados emparelhados (x, y) denotamos o desvio padrão do x dados por sx e o desvio padrão do y dados por sy.

A fórmula para a inclinação uma da linha de regressão é:

  • a = r (sy/ sx)

O cálculo de um desvio padrão envolve obter a raiz quadrada positiva de um número não negativo. Como resultado, os dois desvios padrão na fórmula da inclinação devem ser não negativos. Se assumirmos que há alguma variação em nossos dados, poderemos desconsiderar a possibilidade de que qualquer um desses desvios padrão seja zero. Portanto, o sinal do coeficiente de correlação será o mesmo que o sinal da inclinação da linha de regressão.

instagram story viewer