Estatística inferencial recebe o nome do que acontece neste ramo de estatísticas. Em vez de simplesmente descrever um conjunto de dados, a estatística inferencial procura inferir algo sobre uma população com base em uma amostra estatística. Um objetivo específico na estatística inferencial envolve a determinação do valor de uma população desconhecida parâmetro. O intervalo de valores que usamos para estimar esse parâmetro é chamado de intervalo de confiança.
A forma de um intervalo de confiança
Um intervalo de confiança consiste em duas partes. A primeira parte é a estimativa do parâmetro populacional. Obtemos essa estimativa usando um método amostra aleatória simples. A partir desta amostra, calculamos a estatística que corresponde ao parâmetro que desejamos estimar. Por exemplo, se estivéssemos interessados na estatura média de todos os alunos da primeira série nos Estados Unidos, use uma amostra aleatória simples de alunos da primeira série dos EUA, meça todos e depois calcule a altura média de nossas amostra.
A segunda parte de um intervalo de confiança é a margem de erro. Isso é necessário porque nossa estimativa sozinha pode ser diferente do valor real do parâmetro populacional. Para permitir outros valores potenciais do parâmetro, precisamos produzir um intervalo de números. A margem de erro faz isso e todo intervalo de confiança é da seguinte forma:
Estimativa ± margem de erro
A estimativa está no centro do intervalo e subtraímos e adicionamos a margem de erro dessa estimativa para obter um intervalo de valores para o parâmetro.
Nível de confiança
Anexado a cada intervalo de confiança, há um nível de confiança. Essa é uma probabilidade ou porcentagem que indica quanta certeza devemos ser atribuídos ao nosso intervalo de confiança. Se todos os outros aspectos de uma situação forem idênticos, quanto maior o nível de confiança, maior o intervalo de confiança.
Esse nível de confiança pode levar a alguma confusão. Não é uma declaração sobre o procedimento de amostragem ou a população. Em vez disso, está dando uma indicação do sucesso do processo de construção de um intervalo de confiança. Por exemplo, intervalos de confiança de 80%, a longo prazo, perderão o verdadeiro parâmetro populacional uma em cada cinco vezes.
Qualquer número de zero a um poderia, em teoria, ser usado para um nível de confiança. Na prática, 90%, 95% e 99% são níveis de confiança comuns.
Margem de erro
A margem de erro de um nível de confiança é determinada por alguns fatores. Podemos ver isso examinando a fórmula da margem de erro. Uma margem de erro é da forma:
Margem de erro = (estatística para nível de confiança) * (desvio padrão / erro)
A estatística para o nível de confiança depende do que distribuição de probabilidade está sendo usado e qual o nível de confiança que escolhemos. Por exemplo, se Cé o nosso nível de confiança e estamos trabalhando com um distribuição normal, então C é a área sob a curva entre -z* para z*. Este número z* é o número em nossa fórmula de margem de erro.
Desvio padrão ou erro padrão
O outro termo necessário em nossa margem de erro é o desvio padrão ou erro padrão. O desvio padrão da distribuição com a qual estamos trabalhando é preferido aqui. No entanto, normalmente os parâmetros da população são desconhecidos. Esse número geralmente não está disponível ao formar intervalos de confiança na prática.
Para lidar com essa incerteza em saber o desvio padrão, usamos o erro padrão. O erro padrão que corresponde a um desvio padrão é uma estimativa desse desvio padrão. O que torna o erro padrão tão poderoso é que ele é calculado a partir da amostra aleatória simples usada para calcular nossa estimativa. Nenhuma informação extra é necessária, pois a amostra faz toda a estimativa para nós.
Intervalos de confiança diferentes
Há uma variedade de situações diferentes que exigem intervalos de confiança. Esses intervalos de confiança são usados para estimar vários parâmetros diferentes. Embora esses aspectos sejam diferentes, todos esses intervalos de confiança são unidos pelo mesmo formato geral. Alguns intervalos de confiança comuns são aqueles para uma média populacional, variação populacional, proporção populacional, a diferença de duas médias populacionais e a diferença de duas proporções populacionais.