Análise de dados secundários é a análise de dados que foram coletados por outra pessoa. A seguir, revisaremos a definição de dados secundários, como eles podem ser usados pelos pesquisadores e os prós e contras desse tipo de pesquisa.
Principais tópicos: análise de dados secundários
- Os dados primários se referem aos dados coletados pelos pesquisadores, enquanto os dados secundários se referem aos dados coletados por outra pessoa.
- Os dados secundários estão disponíveis em várias fontes, como governos e instituições de pesquisa.
- Embora o uso de dados secundários possa ser mais econômico, os conjuntos de dados existentes podem não responder a todas as perguntas de um pesquisador.
Comparação de dados primários e secundários
Na pesquisa em ciências sociais, os termos dados primários e dados secundários são linguagem comum. Os dados primários são coletados por um pesquisador ou equipe de pesquisadores para o objetivo específico ou análise em consideração. Aqui, uma equipe de pesquisa concebe e desenvolve um projeto de pesquisa, decide
técnica de amostragem, coleta dados projetados para abordar questões específicas e realiza suas próprias análises dos dados coletados. Nesse caso, as pessoas envolvidas na análise de dados estão familiarizadas com o design da pesquisa e o processo de coleta de dados.Análise de dados secundários, por outro lado, é o uso de dados que foi coletado por outra pessoa para algum outro propósito. Nesse caso, o pesquisador coloca questões que são abordadas através da análise de um conjunto de dados que eles não estavam envolvidos na coleta. Os dados não foram coletados para responder às perguntas específicas de pesquisa do pesquisador e, em vez disso, foram coletados para outra finalidade. Isso significa que o mesmo conjunto de dados pode realmente ser um conjunto de dados primário para um pesquisador e um conjunto de dados secundário para outro.
Usando dados secundários
Há algumas coisas importantes que devem ser feitas antes do uso de dados secundários em uma análise. Como o pesquisador não coletou os dados, é importante que eles se familiarizem com o conjunto de dados: como os dados foram coletados, quais são as categorias de resposta para cada pergunta, se os pesos precisam ou não ser aplicados durante a análise, se os clusters ou estratificação precisam ou não ser considerados, quem era a população de estudo e Mais.
Muitos recursos e conjuntos de dados secundários são disponível para pesquisa sociológica, muitos dos quais são públicos e facilmente acessíveis. o Censo dos Estados Unidos, a Pesquisa Social Geral, e as Pesquisa da Comunidade Americana são alguns dos conjuntos de dados secundários mais usados disponíveis.
Vantagens da análise de dados secundários
A maior vantagem do uso de dados secundários é que eles podem ser mais econômicos. Outra pessoa já coletou os dados, portanto, o pesquisador não precisa dedicar dinheiro, tempo, energia e recursos a essa fase da pesquisa. Às vezes, o conjunto de dados secundário deve ser adquirido, mas o custo quase sempre é menor do que o custo da coleta de um conjunto de dados do zero, que geralmente envolve salários, viagens e transporte, espaço de escritório, equipamento e outras despesas gerais custos. Além disso, como os dados já são coletados e geralmente limpos e armazenados em formato eletrônico, o pesquisador pode passar a maior parte do tempo analisando os dados em vez de preparar os dados para análise.
Uma segunda grande vantagem do uso de dados secundários é a amplitude dos dados disponíveis. O governo federal conduz numerosos estudos em larga escala nacional que os pesquisadores individuais dificilmente colecionariam. Muitos desses conjuntos de dados também são longitudinal, o que significa que os mesmos dados foram coletados da mesma população em vários períodos diferentes. Isso permite que os pesquisadores analisem tendências e mudanças de fenômenos ao longo do tempo.
Uma terceira vantagem importante do uso de dados secundários é que o processo de coleta de dados geralmente mantém um nível de conhecimento e profissionalismo que podem não estar presentes em pesquisadores individuais ou em pequenos projetos de pesquisa. Por exemplo, a coleta de dados para muitos conjuntos de dados federais geralmente é realizada por funcionários especializados em determinadas tarefas e possui muitos anos de experiência nessa área específica e com essa pesquisa específica. Muitos projetos de pesquisa menores não têm esse nível de especialização, pois muitos dados são coletados por estudantes que trabalham em período parcial.
Desvantagens da análise de dados secundários
Uma grande desvantagem do uso de dados secundários é que ele pode não responder às perguntas específicas de pesquisa do pesquisador ou conter informações específicas que o pesquisador gostaria de ter. Também pode não ter sido coletado na região geográfica ou durante os anos desejados, ou com a população específica que o pesquisador está interessado em estudar. Por exemplo, um pesquisador interessado em estudar adolescentes pode achar que o conjunto de dados secundários inclui apenas adultos jovens.
Além disso, como o pesquisador não coletou os dados, eles não têm controle sobre o que está contido no conjunto de dados. Muitas vezes, isso pode limitar a análise ou alterar as perguntas originais que o pesquisador procurou responder. Por exemplo, um pesquisador que está estudando felicidade e otimismo pode achar que um conjunto de dados secundários inclui apenas um desses variáveis, mas não ambos.
Um problema relacionado é que as variáveis podem ter sido definido ou categorizado de forma diferente do que o pesquisador teria escolhido. Por exemplo, a idade pode ter sido coletada em categorias, e não como uma variável contínua, ou raça pode ser definida como "branca" e "outra", em vez de conter categorias para todas as principais raças.
Outra desvantagem significativa do uso de dados secundários é que o pesquisador não sabe exatamente como o processo de coleta de dados foi realizado ou quão bem foi realizado. O pesquisador geralmente não tem acesso a informações sobre quão seriamente os dados são afetados por problemas como baixa taxa de resposta ou incompreensão dos entrevistados sobre perguntas específicas da pesquisa. Às vezes, essas informações estão prontamente disponíveis, como é o caso de muitos conjuntos de dados federais. No entanto, muitos outros conjuntos de dados secundários não são acompanhados por esse tipo de informação e o analista deve aprender a ler nas entrelinhas para descobrir possíveis limitações dos dados.