Os dados emparelhados nas estatísticas, geralmente chamados de pares ordenados, referem-se a duas variáveis nos indivíduos de uma população que são ligadas entre si para determinar a correlação entre elas. Para que um conjunto de dados seja considerado emparelhado, esses dois valores devem ser anexados ou vinculados entre si e não considerados separadamente.
A ideia de dados emparelhados é contrastada com a associação usual de um número a cada ponto de dados, como em outros Dados quantitativos define que cada ponto de dados individual está associado a dois números, fornecendo um gráfico que permite aos estatísticos observar a relação entre essas variáveis em uma população.
Esse método de dados pareados é usado quando um estudo espera comparar duas variáveis em indivíduos da população para tirar algum tipo de conclusão sobre a correlação observada. Ao observar esses pontos de dados, a ordem do emparelhamento é importante porque o primeiro número é uma medida de uma coisa, enquanto o segundo é uma medida de algo totalmente diferente.
Exemplo de dados emparelhados
Para ver um exemplo de dados emparelhados, suponha que um professor conte o número de tarefas de casa que cada aluno entregue para uma unidade específica e, em seguida, emparelha esse número com a porcentagem de cada aluno no teste de unidade. Os pares são os seguintes:
- Um indivíduo que completou 10 tarefas ganhou 95% em seu teste. (10, 95%)
- Um indivíduo que completou 5 tarefas ganhou 80% em seu teste. (5, 80%)
- Um indivíduo que completou 9 tarefas ganhou 85% em seu teste. (9, 85%)
- Um indivíduo que completou duas tarefas ganhou 50% em seu teste. (2, 50%)
- Um indivíduo que completou 5 tarefas ganhou 60% em seu teste. (5, 60%)
- Um indivíduo que completou três tarefas ganhou 70% em seu teste. (3, 70%)
Em cada um desses conjuntos de dados emparelhados, podemos ver que o número de atribuições sempre vem em primeiro lugar no par ordenado, enquanto a porcentagem obtida no teste fica em segundo lugar, como visto na primeira instância de (10, 95%).
Embora uma análise estatística desses dados também possa ser usada para calcular o número médio de tarefas de casa concluídas ou a pontuação média no teste, pode haver outras perguntas a serem feitas sobre os dados. Nesse caso, o professor deseja saber se há alguma conexão entre o número de tarefas de casa. entregue e desempenho no teste, e o professor precisaria manter os dados emparelhados para responder a essa pergunta. questão.
Analisando dados emparelhados
o técnicas estatísticas do correlação e regressão são usadas para analisar dados emparelhados em que o coeficiente de correlação quantifica a proximidade com que os dados estão ao longo de uma linha reta e mede a força do relacionamento linear.
A regressão, por outro lado, é usada para várias aplicações, incluindo a determinação de qual linha se ajusta melhor ao nosso conjunto de dados. Essa linha pode, por sua vez, ser usada para estimar ou prever y valores para valores de x que não faziam parte do nosso conjunto de dados original.
Existe um tipo especial de gráfico especialmente adequado para dados emparelhados chamado gráfico de dispersão. Nisso tipo de gráfico, um eixo de coordenadas representa uma quantidade dos dados emparelhados, enquanto o outro eixo de coordenadas representa a outra quantidade dos dados emparelhados.
Um gráfico de dispersão para os dados acima indica que o eixo x indica o número de atribuições entregues, enquanto o eixo y indica as pontuações no teste de unidade.