Имя материала: Путеводитель по современной эконометрике

Автор: Вербик Марно

Протестируйте, является ли коэффициент коррекции нулем.

 

10       

Совокупность панельных данных содержит повторные наблюдения для одних и тех же выборочных единиц (людей, домашних хозяйств, фирм), собранные за ряд тактов времени. Хотя панельные данные, как правило, собираются на микроэкономическом уровне, все более и более становится практикой объединять индивидуальные временные ряды множества стран или множества отраслей промышленности и анализировать их одновременно. Применение повторных (для разных тактов времени) наблюдений относительно одних и тех же выборочных единиц позволяет экономистам специфицировать и оценивать более сложные и более реалистические модели, чем применение одной пространственной ("cross-section") выборки или одного временного ряда. Неудобства имеют скорее практическую природу: поскольку мы повторно наблюдаем одни и те же выборочные единицы, то обычно больше нереалистично предполагать, что различные наблюдения независимы. Это может усложнить анализ, особенно для нелинейных и динамических моделей. Кроме того, совокупности панельных данных очень часто страдают от пропущенных наблюдений. Даже если эти наблюдения отсутствуют случайным образом (см. ниже), стандартный анализ должен быть скорректирован.

Эта глава является введением в анализ панельных данных. В параграфе 10.1 представлена простая линейная модель панельных данных и в контексте этой модели обсуждены определенные

 

Модели, основанные на панельных данных

преимущества по сравнению с пространственными данными или данными одномерного временного ряда. В параграфе 10.2 уделяется внимание так называемым моделям с фиксированными эффектами и моделям со случайными эффектами, и обсуждаются проблемы, относящиеся к выбору между этими двумя основными моделями. В параграфе 10.3 приводится эмпирический пример. Введение датированной зависимой переменной в линейную модель усложняет состоятельное оценивание, и, как обсуждается в параграфе 10.4, методы инструментальных переменных или ОММ предоставляют интересные альтернативы. В параграфе 10.5 приводится эмпирический пример оценивания краткосрочных и долгосрочных динамических эластичностей спроса на рабочую силу относительно заработной платы. Другие сложности возникают, когда интересующая нас модель включает ограниченные зависимые переменные. Расширение логит, пробит и тобит моделей на случай панельных данных обсуждается в параграфе 10.6. И, наконец, в параграфе 10.7 мы обсуждаем проблемы, связанные с неполными панельными данными и смещениями, обусловленными ограничениями в способе отбора выборочных единиц*^. Обширные обсуждения эконометрического анализа цанельных данных можно найти в работах (Hsiao, 1986), (Baltagi, 1995) и (Matyas, Sevestre, 1996).

 

10.1. Преимущества панельных данных

В общем плане эта проблема («проблема выборочной селективности») обсуждалась в параграфе 7.5 (прим. научн. ред. пер.).

Важное преимущество панельных данных по сравнению с данными одномерного временного ряда или пространственной совокупностью данных состоит в том, что панельные данные позволяют идентифицировать определенные параметры или вопросы без необходимости делать ограничительные допущения. Например, панельные данные позволяют анализировать изменения на индивидуальном уровне. Рассмотрим ситуацию, в которой средний уровень потребления повышается на 2\% ежегодно. Панельные данные могут идентифицировать, является ли это повышение результатом, например, увеличения на 2\% уровня потребления для всех индивидуумов или увеличения на 4\% уровня потребления приблизительно для одной половины индивидуумов и никакого изменения уровня потребления для другой половины (или результатом любой другой комбинации). Таким образом, панельные данные подходят не только для моделирования или объяснения, почему выборочные единицы ведут себя по-разному, но также и для моделирования, почему конкретная выборочная единица ведет себя по-разному в различные периоды времени (например, из-за различного прошлого).

В последующем мы будем индексировать все переменные индексом і для индивидуумов^ (г = 1,... , N) и индексом t для периодов времени (t = 1,... , Г). В общем виде мы могли бы специфицировать линейную модель как

У it = \% it Pit + £г£5

где вектор коэффициентов Pit измеряет частные эффекты вектора объясняющих переменных хц в период t для выборочной единицы г. Конечно, такая модель является слишком общей, чтобы быть полезной, и мы должны наложить более ограниченную структуру на вектор коэффициентов /Зц. Стандартное предположение, используемое во многих эмпирических случаях, состоит в том, что вектор /Зц является вектором констант для всех і и £, за исключением, возможно, свободного члена. Такую модель можно написать как

Ун = oti + x'it(3 + eit, (10.1)

где Xu — К-мерный вектор объясняющих переменных, не включающий константу 2 Это означает, что влияние от изменений в компонентах вектора х на у одинаковы для всех выборочных единиц и всех периодов, но средний уровень для выборочной единицы г может отличаться от среднего уровня для выборочной единицы j. Таким образом, коэффициент улавливает эффекты тех переменных, которые являются специфическими для г-го индивидума, и которые являются постоянными во времени. В стандартном случае предполагается, что остатки є и являются независимыми и одинаково распределенными по индивидуумам и времени с нулевым средним и дисперсией а. Если мы рассматриваем коэффициенты     как N

 

Несмотря на то, что мы ссылаемся на пространственные выборочные единицы как на индивидуумов, они могут также относиться к другим выборочным единицам, например, фирмам, странам, отраслям промышленности, домашним хозяйствам или активам.

Элементы в векторе /3 индексируются от элемента /Зі до /З^, где первый элемент в отличие от предыдущих глав не относится к свободному члену.

фиксированных неизвестных параметров, то модель (10.1) называется стандартной моделью с фиксированными эффектами.

Альтернативный подход предполагает, что свободные члены индивидуумов различны, но их можно рассматривать как извлечения из распределения со средним р и дисперсией <7^. Существенное предположение здесь состоит в том, что эти извлечения являются независимыми от объясняющих переменных в векторе хц (см. ниже). Это приводит к модели со случайными эффектами, где индивидуальные эффекты ai рассматриваются как случайные. Член ошибки в этой модели состоит из двух компонент: не зависящей от времени компоненты 3) ai и остаточной компоненты ец, которая некоррелирована во времени 4^. Такую модель можно написать как

yit = р + x'it/3 + ai + eiu (Ю.2)

где р обозначает свободный член.

Возможность рассматривать эффекты ct{ как фиксированные параметры имеет несколько больше преимуществ, но также и некоторые неудобства. Большинство моделей панельных данных оценивается либо в предположении фиксированных эффектов, либо в предположении случайных эффектов, и мы будем обсуждать это подробно в параграфе 10.2. Но сначала в следующих двух пунктах обсудим более подробно некоторые потенциальные преимущества панельных данных.

 

10.1 ш1. Эффективность оценивания параметров

В модели случайных эффектов случайные величины переопределены таким образом, что они имеют нулевое среднее значение.

Модель иногда называется (однофакторной) моделью остаточных ошибок.

Поскольку совокупности панельных данных, как правило, обширнее, чем совокупности пространственных данных или совокупности данных одномерного временного ряда, и объясняющие переменные изменяются в двух измерениях (индивидуумы и время), а не в одном измерении, то оценки, построенные на основе панельных данных, весьма часто точнее, чем те, которые построены на основе других источников данных. Даже при одинаковых объемах выборок применение совокупности панельных данных часто будет приводить к более эффективным оценкам, чем ряд независимых совокупностей пространственных данных (где различные выборочные единицы извлекаются в каждом такте времени). Чтобы проиллюстрировать это, рассмотрим следующий специальный случай модели со случайными эффектами (10.2), в которую мы включим временные фиктивные переменные (манекены), то есть

Ун = ІЛі + осі +eiu (10.3)

где каждый fit является неизвестным параметром, соответствующим среднему значению генеральной совокупности для такта времени t. Предположим, что мы не интересуемся средним /it для определенного такта времени £, а интересуемся изменением /it от одного такта времени к другому. Вообще дисперсия эффективной оценки для разности [it — /is (s ф і),     — /2S, задается в виде

V{jxt - ДЛ = V{fk} + V{\%} - 2 cov {ft, ft} (10.4)

 

с

1 N

& = х^2уи,  t = і,...,г.

1=1

Как правило, если используется совокупность панельных данных, то ковариация между средними fit и jis будет положительна, в частности, если справедливы допущения, принятые для модели со случайными эффектами (10.2), то эта ковариация равна a^/N. Однако, если используются две независимые совокупности пространственных данных, то разные периоды времени будут содержать различных индивидуумов, поэтому средние и /25 будут иметь нулевую ковариацию. Другими словами, если интересуются изменениями параметра модели от одного такта времени к другому, то методы анализа панельных данных приводят к более эффективным оценкам, чем методы анализа пространственных данных, примененные к той же совокупности исходных данных.

Однако заметим, что обратное также справедливо, в том смысле, что повторные пространственные данные будут более информативны, чем панельные данные, когда, например, речь идет об оценке суммы или среднего значения /it по совокупности нескольких тактов времени. На интуитивном уровне панельные данные могут предоставить лучшую информацию, поскольку одни и те же индивидуумы наблюдаются повторно. С другой стороны, наличие одних и тех же индивидуумов, а не различных, может подразумевать меньшую вариацию в объясняющих переменных и таким образом снижать эффективность построенных по ним оценок. Всесторонний анализ выбора между чисто панельными данными, чисто пространственными данными и совместной комбинацией этих двух источников данных представлен в работе (Nijman, Verbeek, 1990). Результаты работы показали, что, когда речь идет об оценке параметров, определяющих эффект влияния включенных в модель экзогенных переменных, то анализ совокупности панельных данных, как правило, будет приводить к более эффективным оценкам, чем анализ, основанный на выборке пространственных данных с тем же самым числом наблюдений.

 

70. 7.2. Идентификация параметров

Другое преимущество наличия панельных данных состоит в том, что ослабляются проблемы идентификации и, хотя такое преимущество может проявляться в разных ситуациях, во многих случаях оно включает идентификацию при наличии эндогенных регрессоров или ошибки измерения, устойчивость по отношению к не включенным в модель переменным и идентификацию индивидуальной динамики.

Начнем с примера последнего. Существует два альтернативных объяснения часто наблюдаемого явления, что индивидуумы, которые испытали некоторое событие в прошлом, более вероятно, испытают то же событие в будущем. Первое объяснение состоит в том, что факт испытания события индивидуумом изменяет его предпочтения, ограничения, и т.п. таким образом, что он более вероятно испытает такое событие в будущем. Второе объяснение говорит, что индивидуумы могут отличаться ненаблюдаемыми особенностями, которые влияют на вероятность испытания события (но испытание события не влияет на ненаблюдаемые особенности индивидуума). Хекмэн (Heckman, 1978) назвал первое объяснение истинной зависимостью состояния, а последнее — мнимой зависимостью состояния. Известный пример относится к «событию» — быть безработным. Наличие панельных данных ослабит проблему различения между истинной и мнимой зависимостью состояния, поскольку наблюдаются индивидуальные предыстории, которые можно включить в модель.

Смещение от невключения переменной возникает, если переменная, которая коррелированна с включенными переменными, не включена в модель. Классическим примером является оценивание производственных функций (Mundlak, 1961). Во многих случаях, особенно в случае малых фирм, в качестве производственных затрат в производственную функцию желательно включить качество менеджмента. Однако вообще качество управления не наблюдаемо. Предположим, что производственная функция типа Кобба—Дугласа задана в виде

yit=fi + x'it(5 + тфк+і + eiu (Ю.5)

где уц обозначает логарифмический объема производства, хц — К-мерный вектор логарифмических производственных затрат для фирмы г в момент времени і, а обозначает качество управления для фирмы г (которое, как предполагается, является постоянным во времени). Ожидается, что ненаблюдаемая переменная ті будет отрицательно коррелированна с другими производственными затратами в векторе хц , так как высококачественное управление вероятно приведет к более эффективному использованию производственных затрат. Поэтому кроме случая 0к+1 = О, исключение ті из модели (10.5) приведет к смещенным оценкам других параметров модели. Если доступны панельные данные, то такую проблему можно решить, введя специфический эффект фирмы ai — fi + тфк+ и рассматривая его в качестве фиксированного неизвестного параметра. Заметим, что без дополнительной информации идентифицировать неизвестный параметр (Зк+i невозможно; ограничение, которое идентифицирует параметр Дк+ъ состоит во введении условия постоянной отдачи от масштаба 5^.

Подобным образом в модель можно включить фиксированный временной эффект, чтобы уловить эффект всех (наблюдаемых и ненаблюдаемых) переменных, который не изменяется на индивидуальных единицах. Этим поясняется утверждение, что для панельных данных можно снизить эффекты смещения из-за невключенных переменных, или, другими словами, оценки, построенные по совокупности панельных данных, могут быть более устойчивыми к неполной спецификации модели.

И, наконец, во многих случаях панельные данные предоставляют «внутренние» инструментальные переменные для регрессоров, которые являются эндогенными переменными или переменными, подверженными ошибке измерения. То есть, часто можно аргументировать такие преобразования исходных переменных, при которых

Постоянная отдача от масштаба производства подразумевает, что 0к-+і = і-(/Зі + ...+0к-).

они станут некоррелированными с остатками модели и коррелированными с самими объясняющими переменными, и никакие внешние инструментальные переменные не требуются. Например, если вектор хц коррелирован с эффектом то можно утверждать, что разность хц — Хі , где Хі — среднее по времени для индивидуума г, некоррелирована с эффектом и предоставляет действительную инструментальную переменную для вектора хц. Более обще, оценивание модели при предположении фиксированных эффектов устраняет эффект oti из остаточного члена и, следовательно, устраняет все связанные с этим проблемы эндогенности. Это будет проиллюстрировано в следующем параграфе. Обширное обсуждение преимуществ и ограничений панельных данных представлено в работе (Hsiao, 1985).

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 |