Componentes Principais e Análise Fatorial

A análise de componentes principais (PCA) e a análise fatorial (FA) são técnicas estatísticas usadas para redução de dados ou detecção de estrutura. Esses dois métodos são aplicados a um único conjunto de variáveis ​​quando o pesquisador está interessado em descobrir quais variáveis ​​no conjunto formam subconjuntos coerentes que são relativamente independentes de um outro. Variáveis ​​correlacionadas entre si, mas amplamente independentes de outros conjuntos de variáveis, são combinadas em fatores. Esses fatores permitem condensar o número de variáveis ​​em sua análise combinando várias variáveis ​​em um único fator.

Os objetivos específicos do PCA ou FA são resumir os padrões de correlações entre as variáveis ​​observadas, reduzir um grande número de variáveis ​​observadas a um número menor de fatores, fornecer uma equação de regressão para um processo subjacente usando variáveis ​​observadas ou para testar uma teoria sobre a natureza dos processos subjacentes.

Exemplo

Digamos, por exemplo, que um pesquisador esteja interessado em estudar as características dos estudantes de pós-graduação. O pesquisador pesquisa uma grande amostra de estudantes de pós-graduação sobre características de personalidade, como motivação, habilidade intelectual, história escolar, história familiar, saúde, características físicas, etc. Cada uma dessas áreas é medida com várias variáveis. As variáveis ​​são então inseridas na análise individualmente e as correlações entre elas são estudadas. A análise revela padrões de correlação entre as variáveis ​​que são pensadas para refletir os processos subjacentes que afetam os comportamentos dos estudantes de pós-graduação. Por exemplo, várias variáveis ​​das medidas de capacidade intelectual combinam-se com algumas variáveis ​​das medidas da história escolar para formar um fator que mede a inteligência. Da mesma forma, variáveis ​​das medidas de personalidade podem combinar com algumas variáveis ​​da motivação e da escolaridade. medidas de história para formar um fator que mede o grau em que um aluno prefere trabalhar de forma independente - uma independência fator.

instagram viewer

Etapas da análise de componentes principais e análise fatorial

As etapas da análise de componentes principais e análise fatorial incluem:

  • Selecione e meça um conjunto de variáveis.
  • Prepare a matriz de correlação para executar PCA ou FA.
  • Extraia um conjunto de fatores da matriz de correlação.
  • Determine o número de fatores.
  • Se necessário, gire os fatores para aumentar a interpretabilidade.
  • Interprete os resultados.
  • Verifique a estrutura de fatores, estabelecendo a validade de construção dos fatores.

Diferença entre análise de componentes principais e análise fatorial

A análise de componentes principais e a análise fatorial são semelhantes porque os dois procedimentos são usados ​​para simplificar a estrutura de um conjunto de variáveis. No entanto, as análises diferem de várias maneiras importantes:

  • No PCA, os componentes são calculados como combinações lineares das variáveis ​​originais. Na FA, as variáveis ​​originais são definidas como combinações lineares dos fatores.
  • No PCA, o objetivo é responder por tanto do total variação nas variáveis ​​quanto possível. O objetivo na AF é explicar as covariâncias ou correlações entre as variáveis.
  • O PCA é usado para reduzir os dados em um número menor de componentes. A FA é usada para entender quais construções estão subjacentes aos dados.

Problemas com análise de componentes principais e análise fatorial

Um problema com o PCA e o FA é que não há variável de critério para testar a solução. Em outras técnicas estatísticas, como análise de função discriminante, regressão logística, análise de perfil e análise multivariada análise de variação, a solução é julgada pelo quão bem ela prevê a associação ao grupo. No PCA e FA, não há critério externo, como associação ao grupo, para testar a solução.

O segundo problema do PCA e FA é que, após a extração, existe um número infinito de rotações disponíveis, todos respondendo pela mesma quantidade de variação nos dados originais, mas com o fator definido ligeiramente diferente. A escolha final é deixada ao pesquisador com base em sua avaliação de sua interpretabilidade e utilidade científica. Os pesquisadores geralmente divergem na opinião de qual escolha é a melhor.

Um terceiro problema é que a FA é freqüentemente usada para "salvar" pesquisas mal concebidas. Se nenhum outro procedimento estatístico for apropriado ou aplicável, os dados podem pelo menos ser analisados ​​por fatores. Isso deixa muitos que acreditam que as várias formas de FA estão associadas a pesquisas desleixadas.