Имя материала: Эконометрика Книга вторая Часть 3

Автор: Носко Владимир Петрович

Тема 3.4 несбалансированные панели, эндогенные объясняющие переменные, модели с индивидуально-специфическими переменными

 

Несбалансированные панели

Сосредоточимся на однофакторной модели. Такая модель могла бы включать временные дамми как фиксированные эффекты. До сих пор мы предполагали, что

|=1, /=1,...,Г,

так что в каждый из Т моментов времени имеются данные обо всех N субъектах, участвующих в анализе. В таких случаях говорят о сбалансированной панели (balancedpanel). Теперь рассмотрим модель

n

yit=ju + at+fixit+uit9   i = l9...9N9   t = l9...9Ti9 £аг=0,

/=і

в которой количество наблюдений для разных субъектов может быть различным. В этом случае говорят о несбалансированной панели (unbalanced panel).

Основными результатами для несбалансированных панелей являются следующие:

О/^-оценка та же, что и раньше, и она является BLUE, если crj = 0;

внутригрупповая (CV) оценка в основных чертах та же, что и ранее, хотя у( и xt вычисляются по периодам времени разной длины для разных субъектов;

«между»-оценка также в основном сохраняется, только средние вычисляются по Ti наблюдениям для субъекта /;

преобразование переменных для получения GLS-оценки здесь имеет вид:

У и =Уа ~віУі>

Xit ~Xit ~~ @iXi>

 

Ч t=    Т-і t= сти+Тіста

т.е. 0t изменяется от субъекта к субъекту.

Эндогенные объясняющие переменные

Рассмотрим модель с несколькими объясняющими переменными, часть из которых являются эндогенными:

Уги=УиУ + хиР + аі+Щ>   i = l9...,N,   / = 1,...,Г,

где   ухи — вектор-строка gx эндогенных переменных; хи — вектор-строка кх экзогенных переменных; уи /3 — векторы-столбцы размерностей gx икх.

Пусть zit — вектор-строка к2 инструментальных переменных, к2 > gx, так что E(zit uit) = 0. Обозначим:

 

Ун =ГІЬ»   Ум = тУ£Уи<>      = ^ZX*>

 

j     n   t            j    n   t j    n t

л^Цл». u=t^X5>i*> *=т^Х5>*-

іуі /=і t=        iyi i=i r=i           /=i *=i

Оценив методом инструментальных переменных (метод IV) «внутри»-регрессию

(У at - Ун) = (У га - У и) У + (** " */)/? + (и а ~ Щ \%

получим ІУ-«внутри»-оценки (IV within estimators) yIVW, J3IVW. Оценив методом инструментальных переменных «между»-регрессию

(Ун ~Уг) = (Уи -У)У + {*і-x)P + (ut-її),

получим ІУ-«между»-оценку (IV between estimator) yIVB.

Например, если k2 = gx = 1,kx = 0, так что j/2/, =ylity+ at + uin то

n t

_ /=1 t= У WW - ~ t~

n

Х^д-

 

i= t=l

n

Если E(YUt а і) = О, то более эффективна оценка со случайными эффектами. Чтобы получить ее, используем преобразование переменных:

У га =ynt ~ вУт   Ухи =Ум ~ вУи> їїії=иії-вїїі9 zit=zit-6zi9

где

 

N Т

Z Z «Ум - Уи) - (Ум - У и )rivw f

.2      і=1 t=l

NT-N

N

Т^(у2і-Уиїіув)2

л2        - /=1

°и +Т(7а =      

N

Применим метод IV к уравнению ylit = Уі(у + uit, используя в качестве

инструментов zit -zi^zi или zir

Более общим образом, пусть 8- [у ft] — вектор-строка размерности {gx + кх). На практике приходится применять метод IV (2SLS) трижды:

для получения Slvw

для получения SIVB;

в результате этих двух шагов получают оценки &1 и а2 + Та2, которые используются для преобразования модели;

реализуя метод IV для преобразованной модели.

 

ПРИМЕР 3.4.1

Для исследования зависимости заработной платы женщин от различных факторов были взяты данные из National Longitudinal Survey, Youth Sample, США, no N = 4134 молодым женщинам, находившимся в 1968 г. в возрасте от 14 до 26 лет. Наблюдения проводились с 1968 по 1988 г. Однако данные неполные: по отдельным субъектам количество наблюдений изменялось от 1 до 12 (в среднем 4.6 наблюдения для одного субъекта).

Рассмотрим сначала модель с фиксированными эффектами:

In wit = Д tenure + /?2 age + /?3 age! + /?4 notsmsa +

+ J35 union + P6 south + /и + (Х;+ии,   i = l9...9N9   t = ,...,T, где wit      — размер заработной платы;

tenure — продолжительность (стаж) работы на наблюдаемом рабочем

месте; age     — возраст;

notsmsa — проживание вне столичных регионов; union   — принадлежность к профсоюзу; south   — проживание на юге страны.

При оценивании указанной модели с использованием «внутри»-оценки получим результаты, приведенные в табл. 3.36. Все оцененные коэффициенты имеют высокую статистическую значимость и ожидаемые знаки. Значительная часть изменчивости (70\%) объясняется индивидуальными эффектами (табл. 3.37).

В то же время если считать, например, что стаж работы на наблюдаемом рабочем месте зависит от принадлежности к профсоюзу и от региона проживания (юг — не юг) и ошибки в уравнении для такой связи коррелированы с ошибками в уравнении для логарифма заработной платы, тогда переменная tenureit в уравнении

In wit = Д tenureit + /?2 ageit + fi3 age2it + /?4 notsmsait + ju + at+ uit

коррелирована с ошибкой uit, и для получения состоятельных оценок коэффициентов этого уравнения приходится прибегать к методу инструментальных переменных. При сделанных предположениях в качестве инструментов для tenureit можно использовать union и south. Полный список инструментов, обеспечивающих однозначную идентификацию коэффициентов /і и /?3, /?4, включает 5 переменных: union, south, age, agel, notsmsa. При использовании этих переменных в качестве инструментов получим результаты, приведенные в табл. 3.38 и 3.39. Оцененные коэффициенты и здесь имеют ожидаемые знаки. Однако на этот раз оказались статистически незначимыми оцененные коэффициенты при переменных age и notsmsaМ

 

Таблица 3.38

Результаты применения инструментальных переменных

.xtivreg ln_w age age_2 not_smsa (tenure = union south), fe i(idcode) Fixed-effects (within) IV regression

R-SQ:

within = 0.1333,   between = 0.2375,   overall = 0.2031 Wald chi2(4) = 147926.58       Prob > chi2 = 0.0000

Применение «внутри»-оценки предпочтительно при интерпретации индивидуальных эффектов как фиксированных эффектов. Если эти эффекты рассматривать как случайные и некоррелированные с остальными объясняющими переменными, то предпочтительнее использовать инструментальное GLS-оце-нивание, как это было описано выше. Такой подход приводит к результатам, представленным в таблицах 3.40 и 3.41.

Модели

с индивидуально-специфическими переменными

Оценивание в RE- и FE-моделях. До сих пор в модели с фиксированными эффектами неоднородность субъектов исследования характеризовалась наличием ненаблюдаемых характеристик, влияние которых отражалось в модели посредством параметров at. Однако неоднородность субъектов может выражаться также в различных значениях для этих субъектов некоторых наблюдаемых характеристик, не изменяющихся для каждого субъекта в процессе наблюдений. Например, в исследованиях, касающихся зависимости размера заработной платы индивида от различных факторов, такими характеристиками могут быть пол, базовое образование и т.п. В связи с этим рассмотрим модель

yit =M + aj + Pxit+yzt +utt>   i = l,.~9N,   t = 1,7], где z, — переменная, специфическая только в отношении субъекта.

Если эта модель трактуется как ЛЕ-модель, в которой эффекты не коррелированы с xit и zi9 то проблем с оцениванием коэффициентов /?и у т возникает: в этом случае BLUE являются GLS-оценки для /?и у.

Если же эта модель трактуется как Fit-модель или если at случайны и E(at z,) = 0, но E(at xit) * О, то GLS-оценки (строящиеся, как в ЛЕ-модели) несостоятельны, и приходится искать другие оценки. Усредним обе части уравнения по t:

yt = ju + af+ 0х(+уг(+ип   z = l,...,7V.

Тогда

у u - у і = Р(х» - */)+(«* -Ю> i = i,...,^.

В применении к последнему уравнению метод наименьших квадратов приводит опять к оценке с фиксированными эффектами (/вСУ). Но при таком подходе из исходного уравнения выметаются не только ai9 но и zt. Однако если at фиксированы или E(at xit) Ф О, но E(at zf.) = 0, то тогда все же можно построить состоятельную оценку коэффициента у.

Для этого заметим, что

Уі-Рхі^И + У^і + ІсСі + щ). Если считать значение (5 известным, можно оценить эту модель, минимизи-

N

руя ^(ягг + ut)2, и получить between-оценки:

/=і

 

/ч                     /' = 1

У -       fj '

 

/=1

fi = y-xfi-zy.

Подставив pcv вместо (і в эти два выражения, получим оценки у и р для у и /и. При этом plim/ = у9 т.е. у — состоятельная оценка.

7V->oo

ПРИМЕР 3.4.2 (продолжение примера 3.2.3 —размер заработной платы)

При оценивании модели с фиксированными эффектами оказались выметенными переменные SCHOOL, BLACK, HISP. Попробуем все же получить оценки коэффициентов при этих переменных. Использование процедуры, имеющейся в пакете Stata 8, приводит к результату, представленному в табл. 3.42. Полученные оценки практически совпадают с оценками для соответствующих коэффициентов в модели со случайными эффектами (при С15-оценивании).И

Модель Хаусмана — Тейлора. Рассмотрим модель

yit = Xitj3 + Zfy+at +uin   i = l,...,N9   t = 1,..., T,

где Xit— строка к наблюдаемых переменных, изменяющихся и от субъекта к субъекту, и во времени; Z, — строка g наблюдаемых переменных, инвариантных относительно времени на периоде наблюдений.

Предполагается, что выполнены обычные предположения ЛЕ-модели (в частности, что все объясняющие переменные экзогенны в обычном смысле), за исключением того, что теперь ненаблюдаемые индивидуальные эффекты at могут быть коррелированными с одними объясняющими переменными и не коррелированными с другими объясняющими переменными.

Хаусман и Тейлор предложили в таком случае производить разбиение:

хи = №iit X2it ],  Zi = [ZXi Z2i ],

в котором k{ переменных, входящих в состав Хип и gx переменных, входящих в состав Zh, экзогенны по отношению к at в том смысле, что

ад,.,а,) = £(гиа,.) = 0,

а к2 переменных, входящих в состав X2it9 и g2 переменных, входящих в состав Z2/, эндогенны по отношению к at в том смысле, что

E(X2itat)^^ E(Z2iat)^Q.

При таком разбиении модель записывается в виде:

У и = хмА + х at Pi + 2мУх + znYi +ai + И//, и переход к модели, скорректированной на индивидуальные средние,

Уа-Уі=(Ххи-ХХІ)Рх +(X2it-X2i)P2+uin

приводит к возможно неэффективной, но состоятельной оценке pcv для Р = (Рхт, Р2)т. Однако при этом опять вместе с at выметаются переменные, инвариантные относительно времени.

Получив оценку Pcv - (Pier* Pi,cv)T дая А вычислим для каждого субъекта остатки от оцененной «внутри»-регрессии:

 

и получим состоятельную оценку для дисперсии случайных ошибок D(uit) = crw2:

о-2 - RSSCV u NT-(kx+k2)'

Далее по аналогии с приведенным выше заметим, что

уt - ХХІРХ - Х2ір2 = ZXiyx + Z2iy2 + (a,. + uit).

Только на этот раз в правой части E{Z2ia^) * 0, так что О/^-оценки для ух и у2, получаемые по этой модели (6еґи>ееи-оценки), смещены и несостоятельны. Поэтому здесь для получения состоятельных оценок для ух и у2 применяем метод инструментальных переменных (2SLS), используя инструменты [ZXi XXit], При этом количество экзогенных переменных в XXit (кх) должно быть не меньше числа эндогенных переменных в Z2i (g2). Полученные оценки для ух и у2 обозначим yXIV и y2iv.

Используя все четыре полученные оценки, образуем «остатки»

еи = У it ~ XuP\£v ~ xntPi,cv + ZiYjv + ^иУі,іу и на их основе определим статистику

которая является состоятельной оценкой для суммы (сг^ + 7сг^). Тогда со-

стоятельная оценка для сг^ получается как

с2 л2

Т

Следующим шагом является выполнение стандартного GZ,S-npeo6pa30Ba-ния всех переменных, используемого в Л^-модели:

УІ=Уц-вУі ит-п-

Для реализации этого преобразования в качестве оценки параметра в берется а1

где Ф =

&1 и а £ — полученные выше состоятельные оценки для ol и crj. Это приводит к преобразованному уравнению

у и = КіА +   Pi + Аії + z2/^2+iv

К этому уравнению применим метод IV (2SLS), используя инструменты [XUt - XXh X2it - X2h Xlh Zu]9 в результате получим для вектора 8 = [J3T, ут]т

инструментальную оценку Хаусмана — Тейлора: днт = [РнТ, УнТ]т Замечание 3.4.1

В процедуре Хаусмана — Тейлора инструменты берутся внутри самой модели.

XUt используется как инструмент дважды: как среднее и как отклонение от среднего.

Если кх < g2, то параметр у неидентифицируем. В этом случае

Рнт - Pcv и Унт не существует.

Если кх = g2, то рнт = рСу и унт = у/у = (у*^ y{IV)T (случай точной идентифицируемости).

Если кх > g2, то уравнение сверхидентифицируемо. В этом случае

матрица Cov{(3cv) - Cov{flHT) положительно определена и оценка Хаусмана — Тейлора более эффективна, чем «внутри»-оценка.

Влияние метода Хаусмана — Тейлора на прикладные исследования относительно мало из-за трудности нахождения экзогенных переменных Хх, которые можно было бы уверенно рассматривать как не коррелированные с at (так что E(XUt at) = 0).

КОНТРОЛЬНЫЕ ВОПРОСЫ

Каковы особенности оценивания несбалансированных панелей?

Каковы особенности оценивания моделей, в которых некоторые объясняющие переменные являются эндогенными?

Каковы особенности оценивания моделей, в которых некоторые объясняющие переменные специфичны только в отношении субъекта?

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |