Nos campos de estatística e econometria, o termo variáveis instrumentais pode se referir a uma das duas definições. Variáveis instrumentais podem se referir a:
- Uma técnica de estimativa (frequentemente abreviada como IV)
- As variáveis exógenas utilizadas na técnica de estimativa IV
Como método de estimativa, variáveis instrumentais (IV) são usadas em muitas aplicações econômicas frequentemente quando um experimento controlado para testar a a existência de uma relação causal não é viável e alguma correlação entre as variáveis explicativas originais e o termo do erro é suspeito. Quando as variáveis explicativas se correlacionam ou mostram alguma forma de dependência com os termos de erro em uma relação de regressão, as variáveis instrumentais podem fornecer uma estimativa consistente.
A teoria das variáveis instrumentais foi introduzida pela primeira vez por Philip G. Wright em sua publicação de 1928 intitulada A tarifa sobre os óleos animais e vegetais mas desde então evoluiu em suas aplicações em economia.
Quando variáveis instrumentais são usadas
Existem várias circunstâncias sob as quais variáveis explicativas mostram uma correlação com os termos do erro e uma variável instrumental pode ser usada. Primeiro, as variáveis dependentes podem realmente causar um dos Variáveis explicativas (também conhecidas como covariáveis). Ou, variáveis explicativas relevantes são simplesmente omitidas ou negligenciadas no modelo. Pode até ser que as variáveis explicativas tenham sofrido algum erro de medida. O problema com qualquer uma dessas situações é que a regressão linear tradicional que normalmente pode ser empregada na análise pode produzir inconsistências estimativas tendenciosas, que é onde as variáveis instrumentais (IV) seriam usadas e a segunda definição de variáveis instrumentais se torna mais importante.
Além de ser o nome do método, as variáveis instrumentais também são as próprias variáveis usadas para obter estimativas consistentes usando esse método. Eles são exógeno, significando que eles existem fora da equação explicativa, mas como variáveis instrumentais, eles estão correlacionados com as variáveis endógenas da equação. Além dessa definição, há outro requisito primário para o uso de uma variável instrumental em um modelo linear: a variável instrumental não deve ser correlacionada com o termo de erro do equação. Ou seja, a variável instrumental não pode apresentar o mesmo problema que a variável original para a qual está tentando resolver.
Variáveis instrumentais em termos de econometria
Para uma compreensão mais profunda das variáveis instrumentais, vamos revisar um exemplo. Suponha que alguém tenha um modelo:
y = Xb + e
Aqui y é um vetor T x 1 de variáveis dependentes, X é uma matriz T x k de variáveis independentes, b é um vetor k x 1 de parâmetros a serem estimados e e é um vetor k x 1 de erros. O OLS pode ser imaginado, mas suponha que, no ambiente sendo modelado, a matriz de variáveis independentes X possa ser correlacionada com os e's. Então, usando uma matriz T x k de variáveis independentes Z, correlacionada aos X's, mas não correlacionada às e's, pode-se construir um estimador IV que seja consistente:
bIV = (Z'X)-1Z'y
O estimador de mínimos quadrados de dois estágios é uma extensão importante dessa idéia.
Na discussão acima, as variáveis exógenas Z são chamadas de variáveis instrumentais e os instrumentos (Z'Z)-1(Z'X) são estimativas da parte de X que não está correlacionada com os e's.