A análise de componentes principais (PCA) e a análise fatorial (FA) são técnicas estatísticas usadas para redução de dados ou detecção de estrutura. Esses dois métodos são aplicados a um único conjunto de variáveis quando o pesquisador está interessado em descobrir quais variáveis no conjunto formam subconjuntos coerentes que são relativamente independentes de um outro. Variáveis correlacionadas entre si, mas amplamente independentes de outros conjuntos de variáveis, são combinadas em fatores. Esses fatores permitem condensar o número de variáveis em sua análise combinando várias variáveis em um único fator.
Os objetivos específicos do PCA ou FA são resumir os padrões de correlações entre as variáveis observadas, reduzir um grande número de variáveis observadas a um número menor de fatores, fornecer uma equação de regressão para um processo subjacente usando variáveis observadas ou para testar uma teoria sobre a natureza dos processos subjacentes.
Exemplo
Digamos, por exemplo, que um pesquisador esteja interessado em estudar as características dos estudantes de pós-graduação. O pesquisador pesquisa uma grande amostra de estudantes de pós-graduação sobre características de personalidade, como motivação, habilidade intelectual, história escolar, história familiar, saúde, características físicas, etc. Cada uma dessas áreas é medida com várias variáveis. As variáveis são então inseridas na análise individualmente e as correlações entre elas são estudadas. A análise revela padrões de correlação entre as variáveis que são pensadas para refletir os processos subjacentes que afetam os comportamentos dos estudantes de pós-graduação. Por exemplo, várias variáveis das medidas de capacidade intelectual combinam-se com algumas variáveis das medidas da história escolar para formar um fator que mede a inteligência. Da mesma forma, variáveis das medidas de personalidade podem combinar com algumas variáveis da motivação e da escolaridade. medidas de história para formar um fator que mede o grau em que um aluno prefere trabalhar de forma independente - uma independência fator.
Etapas da análise de componentes principais e análise fatorial
As etapas da análise de componentes principais e análise fatorial incluem:
- Selecione e meça um conjunto de variáveis.
- Prepare a matriz de correlação para executar PCA ou FA.
- Extraia um conjunto de fatores da matriz de correlação.
- Determine o número de fatores.
- Se necessário, gire os fatores para aumentar a interpretabilidade.
- Interprete os resultados.
- Verifique a estrutura de fatores, estabelecendo a validade de construção dos fatores.
Diferença entre análise de componentes principais e análise fatorial
A análise de componentes principais e a análise fatorial são semelhantes porque os dois procedimentos são usados para simplificar a estrutura de um conjunto de variáveis. No entanto, as análises diferem de várias maneiras importantes:
- No PCA, os componentes são calculados como combinações lineares das variáveis originais. Na FA, as variáveis originais são definidas como combinações lineares dos fatores.
- No PCA, o objetivo é responder por tanto do total variação nas variáveis quanto possível. O objetivo na AF é explicar as covariâncias ou correlações entre as variáveis.
- O PCA é usado para reduzir os dados em um número menor de componentes. A FA é usada para entender quais construções estão subjacentes aos dados.
Problemas com análise de componentes principais e análise fatorial
Um problema com o PCA e o FA é que não há variável de critério para testar a solução. Em outras técnicas estatísticas, como análise de função discriminante, regressão logística, análise de perfil e análise multivariada análise de variação, a solução é julgada pelo quão bem ela prevê a associação ao grupo. No PCA e FA, não há critério externo, como associação ao grupo, para testar a solução.
O segundo problema do PCA e FA é que, após a extração, existe um número infinito de rotações disponíveis, todos respondendo pela mesma quantidade de variação nos dados originais, mas com o fator definido ligeiramente diferente. A escolha final é deixada ao pesquisador com base em sua avaliação de sua interpretabilidade e utilidade científica. Os pesquisadores geralmente divergem na opinião de qual escolha é a melhor.
Um terceiro problema é que a FA é freqüentemente usada para "salvar" pesquisas mal concebidas. Se nenhum outro procedimento estatístico for apropriado ou aplicável, os dados podem pelo menos ser analisados por fatores. Isso deixa muitos que acreditam que as várias formas de FA estão associadas a pesquisas desleixadas.