Метод инструментальных переменных


Метод инструментальных переменных (ИП, IV — Instrumental Variables) — метод оценки параметров регрессионных моделей, основанный на использовании дополнительных, не участвующих в модели, так называемых инструментальных переменных. Метод применяется в случае, когда факторы регрессионной модели не удовлетворяют условию экзогенности, то есть являются зависимыми со случайными ошибками. В этом случае, оценки метода наименьших квадратов являются смещенными и несостоятельными.

По-видимому, метод инструментальных переменных был впервые сформулирован Райтом (Wright) в 1928 году как метод оценки кривых спроса и предложения. Сам термин «инструментальные переменные» был впервые использован в статье 1941 года Риерсолом (Riersol) при обсуждении ошибок в переменных. Далее метод получил развитие в работах Дарбина (1954), Саргана (1958) и др. В контексте систем одновременных уравнений метод развивался параллельно под названием «двухшаговый метод наименьших квадратов (МНК)».

Сущность метода

Пусть имеется линейная регрессионная модель

y = X b + ε {displaystyle y=Xb+varepsilon }

Стандартная МНК-оценка

b ^ O L S = ( X T X ) − 1 X T y = b + V x − 1 C x ε {displaystyle {hat {b}}_{OLS}=(X^{T}X)^{-1}X^{T}y=b+V_{x}^{-1}C_{xvarepsilon }}

где V x = 1 n X T X , C x ε = 1 n X T ε {displaystyle V_{x}={frac {1}{n}}X^{T}X,C_{xvarepsilon }={frac {1}{n}}X^{T}varepsilon } .

Данная оценка очевидно является состоятельной, если V x {displaystyle V_{x}} сходится по вероятности к некоторой невырожденной матрице,а C x ε {displaystyle C_{xvarepsilon }} сходится по вероятности к нулевому вектору. Второе условие выполнено, если факторы и случайные ошибки некоррелированы.

Если факторы и случайные ошибки коррелированы, то второе условие не выполнено и следовательно, МНК-оценки не являются состоятельными. То есть даже при очень большом количестве наблюдений, оценки могут не приближаться к истинным значениям.

Пусть имеются факторы Z, некоррелированые со случайными ошибками, количество которых равно количеству исходных факторов. Эти переменные называются инструментальными переменными. Среди них могут быть как "чисто" инструментальные переменные (отсутствующие в модели), так и переменные модели (последние сами предполагаются экзогенными). Тогда оценкой метода инструментальных переменных называется оценка следующего вида:

b ^ I V = ( Z T X ) − 1 Z T y = b + V x z − 1 C z ε {displaystyle {hat {b}}_{IV}=(Z^{T}X)^{-1}Z^{T}y=b+V_{xz}^{-1}C_{zvarepsilon }}

Если матрица V z x {displaystyle V_{zx}} сходится по вероятности к невырожденной, а C z ε {displaystyle C_{zvarepsilon }} - к нулевому вектору, то оценка метода ИП состоятельна.

Случай простейшей регрессии

Для модели y t = a + b x t + ε t {displaystyle y_{t}=a+bx_{t}+varepsilon _{t}} ИП-оценка коэффициента b равна

b ^ = C o v ( z , y ) C o v ( z , x ) {displaystyle {hat {b}}={frac {Cov(z,y)}{Cov(z,x)}}}

Замечание

Несмотря на состоятельность, в общем случае ИП-оценки смещены и неэффективны. ИП-оценки тем лучше, чем сильнее инструментальные переменные коррелированы с исходными факторами модели (при сохранении некоррелированности со случайными ошибками). Выбор инструментальных переменных является отдельной достаточно сложной проблемой. Строгих рекомендаций по выбору инструментов нет.

Можно показать, что оценку метод ИП можно свести к двухшаговой процедуре: сначала обычным МНК необходимо оценить зависимость исходных факторов от инструментов и использовать полученные оценки факторов вместо самих факторов для оценки параметров исходной модели. Это так называемый двухшаговый МНК.

Обобщенный метод инструментальных переменных

В качестве инструментальных переменных могут быть выбраны МНК-оценки регрессии факторов на некоторые другие переменные Z, количество которых не меньше количества исходных факторов. То есть на первом этапе необходимо оценить регрессию X = Z β + u t {displaystyle X=Zeta +u_{t}} обычным МНК:

β ^ O L S = ( Z T Z ) − 1 Z T X {displaystyle {hat {eta }}_{OLS}=(Z^{T}Z)^{-1}Z^{T}X} .

Тогда матрица инструментальных переменных в данном случае будет равна

X ^ = Z β ^ = Z ( Z T Z ) − 1 Z T X = P Z X {displaystyle {hat {X}}=Z{hat {eta }}=Z(Z^{T}Z)^{-1}Z^{T}X=P_{Z}X}

На втором этапе применяем метод инструментальных переменных с полученными инструментами X ^ {displaystyle {hat {X}}} :

b ^ I V = ( X ^ T X ^ ) − 1 X ^ T y = ( X T P Z X ) − 1 X T P Z y {displaystyle {hat {b}}_{IV}=({hat {X}}^{T}{hat {X}})^{-1}{hat {X}}^{T}y=(X^{T}P_{Z}X)^{-1}X^{T}P_{Z}y}

Если ковариационная матрица случайных ошибок модели пропорциональна единичной σ 2 I {displaystyle sigma ^{2}I} , то ковариационная матрица этих оценок равна V b ^ I V = σ 2 ( X T P Z X ) − 1 {displaystyle V_{{hat {b}}_{IV}}=sigma ^{2}(X^{T}P_{Z}X)^{-1}}

Если количество инструментов z совпадает с количеством исходных переменных (случай точной идентификации), то матрицы Z T X ,   X T Z {displaystyle Z^{T}X,~X^{T}Z} являются квадратными. Следовательно

b ^ I V = ( X T Z ( Z T Z ) − 1 Z T X ) − 1 X T Z ( Z T Z ) − 1 Z T y = ( Z T X ) − 1 ( Z T Z ) ( X T Z ) − 1 ( X T Z ) ( Z T Z ) − 1 ( Z T y ) = ( Z T X ) − 1 Z T y {displaystyle {hat {b}}_{IV}=(X^{T}Z(Z^{T}Z)^{-1}Z^{T}X)^{-1}X^{T}Z(Z^{T}Z)^{-1}Z^{T}y=(Z^{T}X)^{-1}(Z^{T}Z)(X^{T}Z)^{-1}(X^{T}Z)(Z^{T}Z)^{-1}(Z^{T}y)=(Z^{T}X)^{-1}Z^{T}y}

То есть получаем классическую формулу метода инструментальных переменных. Таким образом, несмотря на то, что этот метод выводится как частный случай, тем не менее его можно считать обобщением классического метода ИП. Это так называемый обобщенный метод инструментальных переменных (GIVE - Generalized Instrumental Variables Estimator).

Связь с двухшаговым МНК

Можно показать, что если на втором этапе применить не метод инструментальных переменных, а обычный МНК, то получим точно такую же формулу, так как

X ^ T X ^ = X T P Z T P Z X = X T P Z X = X ^ T X {displaystyle {hat {X}}^{T}{hat {X}}=X^{T}P_{Z}^{T}P_{Z}X=X^{T}P_{Z}X={hat {X}}^{T}X}

Следовательно

b ^ T S L S = ( X ^ T X ^ ) − 1 X ^ T y = ( X ^ T X ) − 1 X ^ T y = ( X T P Z X ) − 1 X T P Z y = b ^ G I V E {displaystyle {hat {b}}_{TSLS}=({hat {X}}^{T}{hat {X}})^{-1}{hat {X}}^{T}y=({hat {X}}^{T}X)^{-1}{hat {X}}^{T}y=(X^{T}P_{Z}X)^{-1}X^{T}P_{Z}y={hat {b}}_{GIVE}}

Таким образом, обобщенный метод инструментальных переменных эквивалентен двухшаговому методу наименьших квадратов (ДМНК, TSLS, 2SLS - Two-Stage Least Squares).


  • Давность наступления смерти
  • Метод конечных разностей
  • Автоматический запрос повторной передачи
  • Итоги и перспективы межвидовой гибридизации
  • Метод биологической баллистики

  •  

    • Яндекс.Метрика
    • Индекс цитирования