Имя материала: Путеводитель по современной эконометрике

Автор: Вербик Марно

10.4.3. единичные корни и коинтеграция

Последняя литература показывает возрастающую интеграцию методов и идей анализа временных рядов с моделированием панельных данных, таких, например, как единичные корни и коинтеграцион-ный анализ. Основная причина таких разработок заключается в том, что исследователи все более и более понимают, что пространственные данные являются полезным дополнительным источником информации, который следует использовать. Чтобы проанализировать эффект определенного политического решения, например принятия дорожного налога или налога на загрязнение окружающей среды, возможно, более полезно провести сравнение с другими странами, чем пробовать извлечь информацию об этих эффектах только из предыстории собственной страны. Объединение данных различных стран может также помочь преодолеть проблему довольно малых объемов выборок временных рядов, когда критерии анализа долгосрочных динамических свойств не являются достаточно мощными.

В ряде недавних статей обсуждаются проблемы единичных корней, ложных регрессий и коинтеграции в панельных данных. Следует подчеркнуть, что эти понятия являются долгосрочными динамическими понятиями и, как правило, приводят к проблемам вывода при Г стремящемся к бесконечности. Во многих случаях, предполагая Т фиксированным, а N стремящимся к бесконечности, такие проблемы обходят, по крайней мере, теоретически.

Критической проблемой при анализе временных рядов, зарегистрированных на некотором количестве выборочных единиц одновременно, является проблема гетерогенности этих единиц. До тех пор, пока мы рассматриваем каждый временной ряд (одномерный

 

По-видимому, речь идет об информационном прошлом разного уровня глубины лагирования (примеч. научн. ред. перевода).

или многомерный) индивидуально, и ряд имеет достаточную длину, нет никаких нарушений в применении методов временных рядов из глав 8 и 9. Однако если мы объединяем ряды для разных выборочных единиц, мы должны отдавать себе отчет в том, что временные процессы не все имеют одни и те же свойства или описываются одними и теми же параметрами. Например, возможно, что временной ряд г/ц является стационарным для страны 1, но интегрируемый порядка один для страны 2. Допуская, что все включенные переменные являются /(1), предположим, что в каждой стране г переменные Ун и хц являются коинтегрированными с параметром коинтеграции /3{. В таком случае линейная комбинация yu — /ЗіХц является /(0) для каждого г, но не существует общего параметра коинтеграции /3, который приводит yit — (Зхц к стационарности для всех і (если только параметры коинтеграции (Зі не одинаковые для всех стран). Точно так же нет никакой гарантии, что пространственные средние,

лежащие в основе индивидуальные ряды коинтегрированные.

Чтобы проиллюстрировать некоторые из введенных проблем, рассмотрим модель авторегрессии

Уіі = Oti+ 7i2/i,i-l + sit

которую можно написать как

ДУг* = Оіі + 7ГіУі,і-1 + sit

где 7Гг = 7г — 1. Тогда нулевой гипотезой, что все временные ряды имеют единичный корень, является Но : 7Ті = 0 для всех г. Альтернативной гипотезой может быть гипотеза, что все ряды являются стационарными с одним и тем же параметром среднего возвращения, то есть Ні : Пі — 7г < 0 для всех г. В работах (Levin, Lin, 1992), (Quah, 1994) и (Harris, Tzavalis, 1999) альтернативная гипотеза подразумевается неявно. Менее ограниченная альтернативная гипотеза специфицируется в виде: Ні : тхі < 0 для всех г, которая позволяет параметрам Пі различаться по группам, и которая использовалась в работе (Im, Pesaran, Shin, 1997). Альтернативные критические статистики выводятся вместе с их асимптотическими распределениями, если N —> ос или Г —^ оо, или одновременно N —> оо и Т —» оо, но обсуждение таких статистик выносится вне рамок этого текста. В любом случае центральная гипотеза состоит в том, что временные ряды всех индивидуальных выборочных единиц имеют единичный корень против альтернативной гипотезы, что все временные ряды являются стационарными. Поэтому можно было бы критиковать вышеупомянутые подходы, говоря, что возможно существование отличной от нуля вероятности, что один или более индивидуальных временных рядов являются стационарными, тогда как все другие имеют единичный корень или наоборот. В этом случае не удовлетворяется ни нулевая, ни альтернативная гипотеза, и неясно, желали бы мы отклонения нулевой гипотезы в результате нашего тестирования или нет. Другая техническая проблема заключается в возможности пространственной зависимости между остатками єц для разных стран, которая делает неправомерным использование совокупности упомянутых критериев.

В работах (Robertson, Symons, 1992) и (Pesaran, Smith, 1995) подчеркивалась важность параметрической гетерогенности в динамических моделях панельных данных, и анализировались потенциально серьезные смещения, которые могут возникать в результате обработки параметрически гетерогенных данных несоответствующим образом. Такие смещения особенно вводят в заблуждение в нестационарном мире, поскольку соотношения между индивидуальными временными рядами могут полностью лишаться силы. Результаты по методам тестирования панельных данных на ложные регрессии и коинтеграцию относительно ограничены; см. (Као, 1999) и (Phillips, Moon, 1999).

 

10.5. Пример: эластичности спроса на труд по заработной плате

В этом разделе мы рассмотрим модель, которая объясняет спрос фирм на труд в зависимости от заработной платы, объема производства, лагированного спроса на труд и некоторых других переменных. Наша цель состоит в том, чтобы получить оценки для краткосрочных и долгосрочных динамических эластичностей спроса на труд по заработной плате в Бельгии. Данные и модели взяты из статьи (Konings, Roodhooft, 1997), в которой используются панельные данные более 3000 больших бельгийских фирм за период 1986-1994 гг. Статический спрос на труд задается моделью

log Lit = 01+02 log wit + 0з log rit + 04 log Yit + 0ъ log wjt + uiu

где Ьц обозначает желаемую занятость на фирме і в период t (спрос на рабочую силу), wu и г и удельные издержки на труд и основные фонды соответственно, а У и обозначает уровень объема производства. Последняя переменная Wjt обозначает среднее реальной заработной платы в промышленности. Это соотношение интерпретируется как долгосрочный динамический результат, поскольку оно игнорирует издержки «настройки» (регулирования) модели.

Для краткосрочной динамики авторы статьи (Konings, Roodhooft, 1997) экспериментировали с альтернативными динамическими спецификациями. Самая простая спецификация предполагает, что

log Ьц = Pi+ Р2 log wit + Рз bg rit + /?4 log Yit +

+ /?5 log wjt + 7 log Liit-i + uit.

При оценивании величина Гц аппроксимировалась акционерным капиталом К и, а У и добавленной стоимостью. Тогда динамическая модель, которую мы оцениваем, имеет вид

log Lu = Pi + #2 log wit + Рз log Ku + Pa log У и +

+ /?5 log Wjt + 7 log Lijt-i + oti + su,

где предполагается, что остатки состоят из двух компонент. Компонента ai обозначает ненаблюдаемую гетерогенность фирм, специфицированную не зависящей от времени. Первое взятие разности в этом уравнении, как и в предыдущем параграфе, исключает компоненту ai, но не приводит к уравнению, которое можно оценить состоятельно с помощью МНК. Во-первых, разность AlogL^t-i и разность Аби коррелированны (как и выше). Во вторых, ни в коем случае не очевидно, что факторные издержки заданы экзогенно. В частности, для удельных издержек на труд wu можно представить несколько альтернативных ситуаций, в которых заработная плата определяется одновременно с занятостью. Например, профсоюзы могут заключить сделку с предпринимателями по заработной плате и занятости. Таким образом, мы можем ожидать, что

E{AogwuAeit} 7^0.

Поэтому логарифмическая разность Д log wu также инструментована при оценивании. Правомочные инструментальные переменные задаются переменными logu^t-2, gWij-3, • • • > подобными инструментальным переменным для логарифмической разности Д logL^t-i • Таким образом, число доступных инструментальных переменных возрастает вместе с ростом t.

В таблице 10.3 мы представили результаты оценивания для статической и динамической моделей, обсужденных выше. Эти результаты являются подмножеством результатов, представленных в работе (Konings, Roodhooft, 1997), в которой также рассматривались модели с другими дополнительными лагированными переменными. В первом столбце приведены оценки для статической (т. е. долгосрочной динамической) функции спроса на труд. Заработная плата рассматривается, как эндогенная, и инструментована, как указано выше. Во второй столбец включен лагированный спрос на труд, который тоже инструментован, как описано выше. Обе спецификации также включают региональные и временные фиктивные переменные (манекены). Чтобы протестировать модель против неспецифициро-ванной альтернативной гипотезы, мы можем использовать тесты на сверхидентифицирующие ограничения, как обсуждалось в главе 5. Критические статистики, равные 29,7 и 51,66, должны сравниваться с критическими значениями из хи-квадрат распределения с 15 и 29 степенями свободы соответственно. С р-значениями, равными 0,013 и 0,006, сверхидентифицирующие ограничения, на 1\%-ом уровне значимости, отвергаются, — на границе отклонения для обеих спецификаций. Значимость лагированной зависимой переменной (стандартные ошибки даны в круглых скобках) предполагает, что следует предпочесть динамическую спецификацию.

Оцененная краткосрочная динамическая эластичность по заработной плате из последнего столбца равна —0,66, в то время как долгосрочная динамическая эластичность равна —0,66/(1 — 0,60) = —1,6, которая близка к оценке, равной —1,78, из статической долгосрочной динамической модели. Обе эти оценки весьма высокие. Например, они предполагают, что в долгосрочной динамике увеличение заработной платы на 1\% приводит к снижению на 1,6\% в спросе на труд. Эти оценки намного выше, чем представлялось вначале на основе макроэкономических данных временных рядов. Очевидно, что возможность корректировать гетерогенность для наблюдаемых и ненаблюдаемых фирм имеет существенное влияние на оценки. Потенциальная проблема результатов в таблице 10.3 лежит в направлении структурного логического построения данных.

Во-первых, панельные данные несбалансированы (см. параграф 10.7 ниже), в то время как модель игнорирует изменения в спросе на труд, обусловленные включением или невключением фирм в выборку (например, из-за финансовых затруднений). Кроме того, занятость измеряется средним числом занятых в данном году, в то время как заработная плата (удельные издержки на труд) вычисляется в виде общих трудовых издержек, деленных на число занятых. Ясно, что тем самым игнорируется проблема сокращения среднего трудового времени рабочего, которая, возможно, в это десятилетие имела место. Например, если фирма заменяет одного рабочего, занятого полный рабочий день, двумя рабочими, занятыми неполный трудовой день, то занятость возрастает, а трудовые издержки снижаются, в то время как в действительности никаких реальных изменений не происходило. Более подробное обсуждение проблемы см. в (Konings, Roodhooft, 1997).

 

10.6. Модели с ограниченными зависимыми переменными

Панельные данные относительно часто используются в микроэкономических проблемах, где интересующие нас модели включают нелинейность. Дискретные или ограниченные зависимые переменные являются важным феноменом в этой области, а их комбинация

с панельными данными обычно усложняет оценивание. Причина заключается в том, что для панельных данных обычно нельзя аргументировать, что различные наблюдения относительно одной и той же выборочной единицы независимы. Корреляции между различными членами ошибок, как правило, усложняют функции правдоподобия таких моделей и, следовательно, усложняют их оценивание. В этом разделе мы обсудим оценивание логит-модели, пробит-модели и тобит-модели панельных данных. Больше деталей относительно моделей панельных данных с ограниченными зависимыми переменными можно найти в статье (Maddala, 1987).

 

70.6.7. Модели бинарного выбора

Как и в случае пространственных данных, модель бинарного выбора обычно формулируется в терминах лежащей в основе латентной модели. Как правило, мы пишем

УІу = x'itP + ai + eiu (10.69)

где мы наблюдаем, что yu = 1, если y*t > 0, и у a = 0 в противном случае. Например, уи может служить показателем, работает или нет индивидуум і в период t. Предположим, что специфические остатки Єц имеют симметричное распределение с функцией распределения F(-), независимо и одинаково распределенные по индивидуумам и времени, и независиммые от всех Х{8. Даже при таких допущениях присутствие эффектов oti усложняет оценивание в обоих случаях: и когда мы рассматриваем их в качестве неизвестных фиксированных параметров, и когда мы рассматриваем их в качестве случайных остатков.

Если мы рассматриваем щ как фиксированные неизвестные параметры, то по существу мы включаем в модель N фиктивных переменных. Таким образом функция логарифма правдоподобия задается (сравните с функцией логарифма правдоподобия (7.12)) как

log ЬЦЗ, аь • • • , &n) = ^2 Vit bg F{pti + x'it(3) +

і J

+ J> - Vit) log [1 - F(ch + x'M- (10-70)

i,t

 

Для упрощения обозначений мы предположим, что хц включает константу, всякий раз, когда это уместно.

Максимизация этой функции относительно (3 и щ (i = 1,...,7V) приводит к состоятельным оценкам при условии, что число тактов времени Т стремится к бесконечности. Для фиксированного Г и N —> ос, оценки несостоятельны. Причина заключается в том, что для фиксированного Г число параметров возрастает с ростом объема выборки N, и мы имеем проблему, которая известна как проблема «побочных (incidental) параметров». То есть, любой эффект оіі можно оценить состоятельно, если только мы имеем возрастающее число наблюдений для каждого фиксированного г, следовательно,

ЄСЛИ Т СТреМИТСЯ к беСКОНеЧНОСТИ. В Общем, НеСОСТОЯТеЛЬНОСТЬ OLi

для фиксированного Г переносится на функцию оценивания вектора неизвестных параметров /3.

Проблема побочных параметров, когда число параметров растет с числом наблюдений, возникает в любой модели с фиксированными эффектами, включая линейную модель. Однако для линейного случая можно исключить параметры а^, так что вектор параметров (3 можно оценить состоятельно, даже при том, что все параметры оценить нельзя. Тем не менее, для большинства нелинейных моделей, несостоятельность dti также приводит к несостоятельности оценок для других параметров. К тому же заметим, что с практической точки зрения оценивание более, чем N параметров, по- видимому, не очень привлекательно, если N является довольно большим.

Несмотря на то, что латентную модель можно преобразовать таким образом, что индивидуальные эффекты oti исключаются, в данном контексте это не помогает, поскольку нет никакого отображения, например, y*t — y*t_1 в наблюдаемые переменные, подобные переменным у и — Уг,£-і. Альтернативная стратегия состоит в применении условного максимального правдоподобия (см. (Andersen, 1970), (Chamberlain, 1980)). В этом случае мы рассматриваем функцию правдоподобия условную по множеству статистик которые являются достаточными для параметров щ. Это означает, что условный по ti вклад в правдоподобие индивидуума больше не зависит от параметра но все еще зависит от других параметров (3. В модели бинарного выбора для панельных данных, существование достаточной статистики зависит от функционального вида функции распределения F, то есть, зависит от распределения специфических остатков є и.

На общем уровне напишем совместную плотность распределения случайных величин уц,... , у^т как f(yn,... , Уіт\&і, &)•> которая зависит от вектора параметров /3 и параметра oti. Если существует достаточная статистика ^, то это значит, что существует статистика U такая, что /(уц,...,у{Ти,щ}(3) = f(yn,... , yirU, /?)* и поэтому она не зависит от параметра о^. Следовательно, мы можем максимизировать функцию условного правдоподобия, основанную на /(угъ • • • »/?), и получить состоятельную оценку для вектора параметров /?. Кроме того, мы можем использовать все относящиеся к законам распределения результаты главы 6, только заменить в них логарифмическую функцию правдоподобия условной логарифмической функцией правдоподобия. Для линейной модели с нормальными ошибками достаточная статистика для параметра щ есть у{. Таким образом, условное распределение у и при заданном у{ не зависит от параметра о^, и можно показать, что максимизация функции условного правдоподобия воспроизводит оценку с фиксированными эффектами для вектора неизвестных параметров j3. К сожалению, этот результат автоматически не распространяется на нелинейные модели. Например, для пробит-модели было показано, что никакая достаточная статистика для параметра не существует. Это означает, что мы не можем оценить пробит-модель фиксированных эффектов состоятельно для фиксированного Г.

 

70.6.2. Логит-модель с фиксированными эффектами

Для логит-модели с фиксированными эффектами, ситуация отличается. В этой модели ti — yi является достаточной статистикой для параметра , и состоятельное оценивание возможно в соответствии с условным максимальным правдоподобием. Следует отметить, что условное распределение УгЪ • • • , 2/гТ является вырожденным, если ti = 0 или ti = 1. Следовательно, такие индивидуумы не вносят свой вклад в условное правдоподобие, и надо отказаться от них при оценивании. Выражаясь иначе, их поведение полностью улавливалось бы их индивидуальным эффектом о^. Это значит, что только индивидуумы, которые изменяют свой статус, по крайней мере, хотя

 

Математически несколько небрежная формулировка. Точнее: если

f(Vil, • • • ,2/гТК, 0),

— совместная плотность распределения случайных величин уц, ... ,Уіт, зависящая от параметров осі и (3, и если ti — достаточная статистика в оценивании параметра , то условная совместная плотность f(yn, ... , УіТ-> аЬ P i) (при условии заданного фиксированного значения t{) не будет зависеть от щ (примеч. научн. ред. перевода).

бы один раз, уместны для оценивания вектора параметров (3. Чтобы проиллюстрировать логит-модель с фиксированными эффектами, мы рассмотрим случай Т — 2.

Существует два возможных исхода, условных по ti = 1/2, (0,1) и (1,0). Условная вероятность первого исхода равна

P{(0,i)U = i/2,at,(3}=       и^ях^рт       яг (1071)

Р{(0,1)|а», р + Р{{1, 0)|а», р)

Используем, что

Р{(0,    0} = Р{уц = Ofa, (3}Р{Уг2 = 1|«<, /З}

с)

РЬ-2 - На- 3 -   exP{Qi + ^>

{W'2      1        1 + ехр{аг+^2/?}-

Откуда следует, что условная вероятность задается в виде

Р{(0,= 1/2, а,, /3} =   2Хр{(^2~Жа)^} (10.72) которая действительно не зависит от щ. Аналогично,

 

Это означает, что мы можем оценить логит-модель с фиксированными эффектами для Г = 2, используя стандартную логит-модель с Хі2 — хц в качестве объясняющих переменных и изменение в переменной уа в качестве эндогенного события (с 1 для положительного изменения и с 0 для отрицательного изменения). Отметим, что в этой модели бинарного выбора с фиксированными эффектами еще более ясно, чем в линейном случае, что модель идентифицируется только через «внутригрупповую размерность» данных; от индивиду-умов,которые не изменяют статус, при оценивании просто отказываются, поскольку они вообще не обеспечивают никакой информации о векторе параметров /?. Для случая с большими значениями Г все необходимые условные вероятности получить несколько сложнее, но в принципе они являются прямым обобщением вышеприведенного случая (см. (Chamberlain, 1980) или (Maddala, 1987)). В статье (Chamberlain, 1980) также обсуждается, как подход условного максимального правдоподобия можно обобщить на мультиномиальную логит-модель.

Если можно предположить, что эффекты оіі независимы от объясняющих переменных в векторе Хн, то, по-видимому, схема случайных эффектов более уместна. Она оказывается более легко реализуемой в контексте пробит-модели.

 

70.6.3. Пробит-модель со случайными эффектами

Начнем со спецификации с латентной переменной

y^=x'lt3 + ulU (10.74)

yit = h если y*t > 0 yit = 0,   если   y*t < 0,

 

(10.75)

где Uu — остатки с нулевым средним и дисперсией, равной единице, независимые от (хц,... , Жгт)- Чтобы оценить вектор параметров /3 методом максимального правдоподобия, мы должны сделать дополнительное предположение о совместном распределении остатков ошибок иц,... , щт- Вклад в правдоподобие индивидуума і есть (совместная) вероятность наблюдения Г исходов УгЪ--->УгТ- Эта совместная вероятность определяется из совместного распределения латентных переменных у*х,... , у*т интегрированием по соответствующим интервалам. Таким образом, в общем, будет Г интегралов, которые для оценивания следует, как правило, вычислять численно. Когда Т = 4 или более, то оценивание методом максимального правдоподобия осуществимо. Можно обойти эту «напасть размерности» применением функций оценивания на основе моделирования, например, как описано в справочнике (Кеапе,1993) и статье (Weeks, 1995). Такое обсуждение выходит за рамки этого текста.

Ясно, если можно предполагать, что все Чц независимы, то мы имеем, что совместная условная плотность вероятностей

ДУгЪ • • • , У\%тХіи     • > ХІТ, Р) = JJ f(yitXiu Р),

t

которая включает только Г одномерных интегралов (как и в случае пространственных данных). Если мы делаем предположение о компонентах ошибок, и предполагаем, что чц = осі + є и, где ец не зависит от времени (и индивидуумов), то совместную условную вероятность можно написать как

f{yn,     ,Уітхц,-- -,xiT, Р)

оо

J ДУгЪ • • • , УітХц, • • • , ХІТ, Оіі, (3)f(CLi) doti —

оо

-fin

 

f(yitxit, Qi, /3)

 

f(ai) doti, (10.76)

которая требует одномерного численного интегрирования. Это практически реализуемая спецификация, которая допускает коррелиро-ванность остатков для разных тактов времени, хотя и ограниченным образом. Критический момент в реализации выражения (10.76) состоит в том, что условные по cti остатки были бы независимыми при разных t.

В принципе о распределениях oti и єц можно делать произвольные предположения. Например, можно было бы предположить, что остатки Єц независимо и одинаково распределены по нормальному закону, в то время как cti имеет логистическое распределение. Однако это может привести к распределениям для остатков оіі + єц, которые являются нестандартными. Например, сумма двух логистически распределенных переменных, в общем, не имеет логистического распределения. Это подразумевает, что индивидуальные вероятности, подобные f(yitxit,P)i трудны для вычисления, и не соответствуют пространственной пробит-модели или пространственной логит-модели. Поэтому, обычно следует начинать с совместного распределения остатков иц,... ,щт- Многомерное логистическое распределение имеет такое неудобство, что все корреляции должны ограничиваться 1/2 (Maddala, 1987), так что на практике это не очень привлекательно. Следовательно, самый общий подход состоит в том, чтобы начать с многомерного нормального распределения, которое приводит к пробит-модели случайных эффектов.

Предположим, что совместное распределение иц,... ,Щт нормально с нулевыми средними значениями, дисперсиями, равными 1, и cov {иц,щ8} = сг^, s ф t. Это соответствует предположению, что ai является НОНР(0, сг^), а є и есть НОНР(0,1 — сг^). Вспомним, что, как и в случае пространственных данных, нам требуется нормировка дисперсий остатков. Выбранная здесь нормировка подразумевает, что дисперсия остатка в заданный такт времени равна единице, так что оцененные коэффициенты /3 непосредственно сравнимы с оценками, полученными из оценивания модели по данным одного такта времени (выбранного из общих панельных данных), используя пространственное пробит максимальное правдоподобие. Для пробит-модели со случайными эффектами выражения в функции правдоподобия задаются в виде

Подпись:

 

(10.77)

где Ф обозначает функцию распределения стандартного нормального закона. Плотность а і задается в виде

Подпись:

(10.78)

Интеграл в выражении (10.76) следует вычислять численно, что можно сделать, используя алгоритм, описанный в статье (Butler, Moffitt 1982). Несколько пакетов программ (например, LIMDEP и Stata) имеют стандартные подпрограммы для того, чтобы оценивать про-бит-модель случайных эффектов.

Можно показать (Robinson, 1982), что игнорирование взаимных корреляций остатков по времени и оценивание коэффициентов /?, использующее стандартное максимальное правдоподобие пробит-модели для объединенных данных, является состоятельным, хотя и неэффективным. Кроме того, обычно вычисляемые стандартные ошибки некорректны. Однако их значения можно использовать в качестве начальных оценок в итерационной процедуре максимального правдоподобия, основанной на совместной вероятности (10.76).

 

70.6.4. Тобит-модели

Тобит-модель случайных эффектов очень похожа на пробит-модель случайных эффектов, единственное различие состоит в правиле наблюдения. Следовательно, мы можем быть довольно краткими. Начнем с модели

Vit =x,itP + ai + eit,

(10.79)

вместе с тем, что

Уи = Уіи если l/t*t>° yit = 0,     если   y*t < 0

(10.80)

Мы сделаем обычное предположение случайных эффектов, что эффекты oti и остатки є и являются независимо и одинаково распределенными по нормальному закону с нулевыми средними значениями и дисперсиями, равными сг^ и а2е соответственно, и независимыми от хц,... ,хіт- Используя / как общее обозначение для функции плотности или функции вероятностной меры, функцию правдоподобия можно написать, как выражение (10.76), в виде

 

ДУгЪ ■ • • , Угтхц, . . . , ХІТ, /?) =   /   Ц f(VitXiU <*г, P)f(<*i)

^ t

-оо z

где f(ai) задается выражением (10.78), а /(уцхц, оц, Р) задается выражением

f( і о 1 / 1 {yit-xfitP-ai)2 ^п

f{y\%tхц,ol\%,Р) = г-—j= exp            ,   если   yit >0,

 

f(y\%t хц, oti,P) = 1 - Ф         5          если   j/it = 0.

(10.81)

Заметим, что последние два выражения аналогичны вкладам в функцию правдоподобия в случае пространственных данных, как обсуждалось в главе 7. Единственное различие состоит во включении эффекта cti в условном смысле.

Полностью подобным же образом можно рассмотреть другие формы цензурирования, чтобы получить, например, пробит-модель с упорядоченными случайными эффектами. Во всех случаях интегрирование по оіі должно проводиться численно.

Тобит-модель можно оценить состоятельно, так же как и усеченную модель регрессии с фиксированными эффектами, применяя обобщенный метод моментов с использованием моментных условий, представленный в статье (Нопоге, 1992) или статье (Нопоге, 1993) для динамической модели. Эти функции оценивания являются полупараметрическими в том смысле, что на вид функции распределения остатков Ец никакие предположения не налагаются.

 

70.6.5. Динамика и проблема начальных условий

Возможность включения лагированной зависимой переменной в вышеупомянутые модели представляет экономический интерес. Например, предположим, что мы объясняем, действительно ли индивидуум является безработным (или нет) за ряд последующих месяцев. Как правило, справедливо, что индивидуумы, которые имеют более длинную предысторию находиться в состоянии безработного, менее вероятно оставят состояние безработицы. Как обсуждалось в вводном разделе этой главы существует два объяснения этого: индивидуум с более длинной предысторией безработного может быть обескуражен в своих поисках работы, или для работодателя, возможно (по любой причине), менее привлекательно нанять его на работу. Это называется зависимостью от статуса: чем дольше вы находитесь в определенном состоянии, тем менее вероятно, что Вы его оставите. Альтернативно, возможно, что присутствует ненаблюдаемая гетерогенность такая, что индивидуумы с определенными ненаблюдаемыми характеристиками менее вероятно оставят статус безработного. То есть, факт, что мы наблюдаем мнимую зависимость от статуса в данных, происходит просто из-за механизма выбора: безработные с продолжительными периодами имеют определенные ненаблюдаемые (не зависящие от времени) особенности, которые делают менее вероятным найти ему работу каким-либо образом. В обсужденных выше моделях бинарного выбора индивидуальные эффекты ai улавливают ненаблюдаемую гетерогенность. Если мы включаем лагированную зависимую переменную, то мы можем различить вышеупомянутые два объяснения.

Рассмотрим пробит-модель со случайными эффектами, хотя подобные результаты справедливы и для случая тобит-модели со случайными эффектами. Предположим, что спецификация латентной переменной изменена на

у* = хф + -ууіі-і +    + eiu (10.82)

где = 1» если y*t > 0, и у a = 0 в противном случае. В этой модели 7 > 0 указывает на положительную зависимость от статуса: при прочих равных условиях вероятность, что уu = 1 больше, если уц-1 также равна единице. Рассмотрим оценивание методом максимального правдоподобия такой динамической пробит-модели со случайными эффектами, сделав те же самые предположения о распределениях как прежде. В общем виде вклад правдоподобия индивидуума і имеет вид

ДУгЪ • • •, У\%тхіи • • •, хІТ, 0) =

 

Для удобства обозначений индекс времени определяется так, что первое наблюдение есть (уц,х'ц).

• • • , Уіт, осі, P)f{oti) dai =

iityi,t-i,oii,/3) /(уцхц,а{,(3)/(а{) da{

(10.83)

 

где

Ґ(УііУі,і-і,<Хі,0) = Ф

s-t/3 + 72/m-i + oti

0^

если J/it

= 1,

 

/(j/itlj/M-i, «і, /?) = 1 - ФІ —  ,                       ,   если   Jfa = 0.

Это полностью аналогично стационарному случаю, а переменная y^t-i просто включена как дополнительная объясняющая переменная. Однако член /(уцхц, oti, Р) в функции правдоподобия может вызвать проблемы. Он дает вероятность наблюдения уц — 1 или Ун = 0, без знания предыдущего состояния, но условную по гетерогенности ненаблюдаемого члена oti •

Если начальное значение экзогенно в том смысле, что его распределение не зависит от oti, то вне интеграла мы можем положить член f(ynxn, oti, (3) — f(yaxn, (3). В этом случае мы можем просто рассмотреть функцию правдоподобия условную по уц и игнорировать член /(упхц, (3) при оценивании. Единственным последствием может быть потеря эффективности, если /(уцхц, (3) обеспечивает информацию о векторе параметров /3. Этот подход был бы уместен, если необходимым условием для всех индивидуумов было бы одинаковое начальное состояние, или если бы для индивидуумов оно назначалось случайно. Пример первой ситуации приведен в статье (Nijman, Verbeek, 1992), где моделируется «неотклик» относительно потребления, и начальный такт времени соответствует месяцу перед панельными данными, и «неотклик» необязательно наблюдался.

Однако во многих приложениях, возможно, трудно аргументировать, что начальное значение уц экзогенно и не зависит от ненаблюдаемой гетерогенности индивидуума. В таком случае мы нуждались бы в выражении для /(уцхц, о^, /?), а это проблематично. Если процесс, который мы оцениваем, продолжался в течение многих тактов времени перед текущим выборочным тактом времени, то f{ynxn, oti, (3) является сложной функцией, которая зависит от ненаблюдаемой предыстории индивидуальных г. Это означает, что, как правило, невозможно получить выражение для маргинальной вероятности f(ynxn, c*i, /?), которая является непротиворечивой с остатком модели. В работе (Heckman, 1981) предлагается приближенное решение этой проблемы начальных условий, которое, по-видимому, на практике работает достаточно хорошо. Это решение основано на аппроксимации маргинальной вероятности начального состояния пробит- функцией, использующей насколько возможно больше доступной предвыборочной информации, без наложения ограничений на ее коэффициенты и структурные параметры /3 и 7. В статье (Vella, Verbeek, 1999) приведен пример такого подхода к динамической тобит-модели со случайными эффектами. Влияние начальных условий снижается при возрастании числа выборочных тактов времени Т, поэтому, если Т является довольно большим, то проблему можно игнорировать.

 

10.7. Неполные панельные данные и смещение, обусловленное выборочной селективностью

По разнообразным причинам эмпирические совокупности панельных данных часто неполные. Например, после того как прошло несколько тактов времени индивидуумы, включенные в обследование, предполагающее сбор панельных данных, могут отказаться от сотрудничества; для одних домашних хозяйств не возможно определить их новое местонахождения, другие распались; фирмы могут завершить свой бизнес или слиться с другими фирмами; а инвестиционные фонды могут закрыться. С другой стороны, фирмы могут войти в бизнес на более поздней стадии; можно извлечь обновленную выборочную информацию, компенсирующую потерянную; или панельные данные могут собираться в виде панели ротации. В панели ротации на каждом такте времени определенная доля выборочных единиц заменяется другими выборочными единицами. Последствие всех таких событий состоит в том, что получающаяся совокупность панельных данных больше не является «прямоугольной». Несмотря на то, что общее количество индивидуумов равно 7V, а число тактов времени равно Т, общее количество наблюдений оказывается существенно меньшим, чем NT.

Первая особенность, присущая работе с неполными панельными данными, это возникновение вычислительных проблем. Если наблюдения отсутствуют, то большинство выражений для представленных выше оценок больше просто неприемлемо. Простое «решение» состоит в том, чтобы любого индивидуума, по которому мы имеем неполную информацию, исключить из панельных данных, и работать только с полностью наблюдаемыми выборочными единицами. При таком подходе для оценивания используются только «сбалансированная субпанель». В вычислительном отношении этот подход заманчив, но потенциально очень неэффективен: можно «потерять» существенное количество информации. Потери в эффективности можно устранить, учитывая все имеющиеся наблюдения, включая тех индивидуумов, которые наблюдались в Т периодах времени только частично. В этом случае используется «несбалансированная субпанель». В принципе применение несбалансированных панельных данных является прямой процедурой, но в вычислительном отношении требуются определенные корректировки формул, представленных в предыдущих разделах. Мы обсудим некоторые из корректировок в п. 10.7.1. К счастью, большая часть программного обеспечения, которое может обрабатывать панельные данные, также учитывает несбалансированные данные.

Другое потенциальное и еще более серьезное последствие применения неполных панельных данных заключается в опасности смещения, обусловленного ограничениями в отборе выборочных единиц, т. е. так называемой выборочной селективностью ("selection bias"). Если индивидуумы наблюдаются неполностью из-за эндогенной причины, использование сбалансированной субпанели или несбалансированных панельных данных может привести к смещенным оценкам и вводящим в заблуждение критериям. Для пояснения этого предположим, что интересующая нас модель задается в виде

УИ = XitP + <*i + єіи (10.84)

Кроме того, определим индикаторную переменную Гц («отклик») в виде: Гц = 1, если (хц^уц) наблюдалось, и Гц — 0 в противном случае. Наблюдения {хц,Уи) отсутствуют (пропущены) случайным образом, если Гц не зависит от эффекта о?; и остатка ей- Это означает, что заданные условия процесса отбора выборочных единиц не влияют на условное распределение уи для данного хц- Если мы хотим сконцентрироваться на сбалансированной субпанели, то условия процесса отбора определяются соотношениями

Гц = • • • = Гіт = 1, и мы требуем, чтобы индикатор Гц был независим от эффекта оіі и остатков єц, ... , Єіт- В этих случаях обычные свойства состоятельности функций оценивания не изменяются, если мы ограничиваем внимание только доступными или полными наблюдениями. Если процесс отбора зависит от МНК-оцененных остатков уравнения, то оценки случайных и фиксированных эффектов могут пострадать от «выборочного» смещения (см. главу 7). В п. 10.7.2 описываются подробности по этой проблеме, включая некоторые простые тесты. В случаях с выборочным смещением, следует использовать альтернативные оценки, которые в вычислительном отношении являются, как правило, непривлекательными, что обсуждается в п. 10.7.3. Дополнительные детали и обсуждение методов анализа, основанного на неполных панельных данных, и вопросов «селективного» смещения можно найти в статьях (Verbeek, Nijman, 1992, 1996).

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 |