O que é robustez nas estatísticas?

Dentro Estatisticas, o termo robusto ou robustez refere-se à força de um modelo estatístico, testes e procedimentos de acordo com as condições específicas da análise estatística que um estudo espera alcançar. Dado que essas condições de um estudo são atendidas, os modelos podem ser verificados como verdadeiros através do uso de provas matemáticas.

Muitos modelos são baseados em situações ideais que não existem ao trabalhar com dados do mundo real e, como resultado, o modelo pode fornecer resultados corretos, mesmo que as condições não sejam atendidas exatamente.

Estatísticas robustas, portanto, são estatísticas que produzem um bom desempenho quando os dados são extraídos de uma ampla variedade de distribuições de probabilidade que em grande parte não são afetadas por discrepantes ou pequenas desvios das premissas do modelo em um determinado conjunto de dados. Em outras palavras, uma estatística robusta é resistente a erros nos resultados.

Uma maneira de observar um procedimento estatístico robusto comumente adotado, é preciso olhar além dos procedimentos t, que usam testes de hipóteses para determinar as previsões estatísticas mais precisas.

instagram viewer

Observando procedimentos T

Para um exemplo de robustez, consideraremos t-procedimentos, que incluem o intervalo de confiança para uma média populacional com desvio padrão desconhecido da população, bem como testes de hipóteses sobre a média populacional.

O uso de t-procedimentos assume o seguinte:

O conjunto de dados com os quais estamos trabalhando é um amostra aleatória simples da população.
A população da qual amostramos é normalmente distribuída.

Na prática, com exemplos da vida real, os estatísticos raramente têm uma população normalmente distribuída; portanto, a pergunta se torna: “Quão robusta é nossa t-procedimentos? ”

Em geral, a condição de termos uma amostra aleatória simples é mais importante do que a condição de amostras de uma população normalmente distribuída; a razão para isso é que o teorema do limite central garante uma distribuição amostral que é aproximadamente normal - quanto maior o tamanho da amostra, mais próxima está a distribuição amostral da média da amostra normal.

Como os procedimentos T funcionam como estatísticas robustas

Portanto, robustez para t-procedimentos depende do tamanho da amostra e da distribuição de nossa amostra. As considerações para isso incluem:

Se o tamanho das amostras for grande, o que significa que temos 40 ou mais observações, t-procedimentos podem ser usados mesmo com distribuições inclinadas.
Se o tamanho da amostra estiver entre 15 e 40, podemos usar t-procedimentos para qualquer distribuição modelada, a menos que haja discrepâncias ou alto grau de assimetria.
Se o tamanho da amostra for inferior a 15, podemos usar t- procedimentos para dados que não possuem valores discrepantes, um único pico e são quase simétricos.

Na maioria dos casos, a robustez foi estabelecida através do trabalho técnico em estatística matemática e, felizmente, não precisamos necessariamente fazer esses cálculos matemáticos avançados para utilizá-los; precisamos apenas entender quais são as diretrizes gerais para a robustez do nosso método estatístico específico.

Os procedimentos T funcionam como estatísticas robustas, porque geralmente produzem um bom desempenho para esses modelos, considerando o tamanho da amostra como base para a aplicação do procedimento.