Имя материала: Сборник задач к начальному курсу эконометрики

Автор: Катышев П.К.

Глава 13 панельные данные

 

Задача 13.1

Докажите равенства (13.17)

 

Г а'2

ІТ —

 

и (13.18)

 

а] {Іт~тгтгт)+°2тгтг'т.

 

Решение

1) Имеем

 

1   / 2г_ , ( 2 Га4.

ff« V   V "    сг| + Таї     аТТТаї ) \%rlr ) = Ь-

 

2) Для доказательства формулы ґтяї „

Формулы (13.18) достаточно проверить равенство

1     Я*__.    1 а2

 

Шо делается с помощью элементарной арифметики.

Задача 13.2

Докажите равенство (13.22

 

0RE = W&B + (J* - W)/3W = Wf3B + (Ik - W)f3n.

 

Решение

(Ср. (Greene. 1997, Ch. 14.3).) Сформулируем предложение, которое вытекает из более общего результата, доказанного в упражнении 4.3.

Предложение. Пусть задана классическая линейная модель регрессии со свободным членом

Подпись: .2yt =a + x{/3 + £tl V(et) = 9\% Cov(e,,e,4) = 0, t ф s, t\%s = 1, Тогда

 

71.

л

-1

Г J

Подпись: где

 

 

Оценка /3RE может быть получена как обычная МНК-оценка преобразованной модели (13.24):

(*)

Уи - (1 - 0)уі = (1 - Щ + (хгі - (1 - еЩУ(Э + г//,, г = 1,..., п, і = 1,..., Г,

еде

I  7"     1 г

2 є

 

 

В модели (*) ошибки 7}ц не коррелированы и имеют постоянную дисперс

Vfott) = <ге2.

Из сформулированного выше предложения сле/гует, что МНК-оценк вектора (3 в уравнении (*) может быть получена применением МНК к этому уравнению, записанному в отклонениях от глобальных средних:

**)

Ы - Уі) + в(уг - у) = ((«« - ж») +        - ж))' /3 + ffti - ffc

где

«Г *

Обозначим

iml

і=

Для уравнения (**) соответствующая матрица Х'Х есть

 

n Г

Подпись:
а соответствующий вектор Х'у —

((хн - Ж») + в{хі - х)) ((yit - Щ + в{Уі - у)) = ЯД 4- в2Е^. Таким образом,

 

Подпись: («*)
Подпись: Поскольку

 

 

то

3W = КГ* \% 3B = (sbr/)_1sbrl,,

 

^xy = ^xx3w>     ^xy = ^ххЗв-

Подставляя эти выражения в (***), получаем:

 

где

 

и

 

Задача 13,3

І    Покажите, что существует к х к матрица S, такая, что

 

где /30|jS — МНК-оценка вектора параметров /3 в объединенной регрессии (13.2).

Решение ML

Оценка /3qls является частным случаем оценки 0кЕ, когда crj; = 0, т.е. когда 0 = 1. Поэтому из результатов упражнения 13.2 следует, что

 

мы сохранили обозначения упражнения 13.2).

 

Задача 13.4

Докажите равенство (13.23)

Р = А [ 1г

1-0

 

 

Решение

Необходимо показать, что Р'Р ------ Е   . Имеем

Р'Р = Л ( /г

2(1 -в) (1-0)2Т7 ,

            ^          lT«r + ^2        1 1тгТ

 

Подпись: = — I If - Подпись: -1

і=і (=i

t=i

 

 

Решение Т

Требуемое равенство непосредственно следует из решения упражнения 13.2 и сформулированного в этом упражнении предложения.

 

Задача 13.6

Докажите, что решение задачи (13.42)

(IЩ ШЩ -тДуД-і)))     £ЩЩ _7дУі(-і))

—> nun

задается равенством (13.43)

Подпись:  Подпись: я71

1=1

7GMM =   Е Ду',(-і)г, s Е z'Avii-D

1=1

-1

Подпись:  71

 

г=1

я

 

Ы 1

 

 

Решение

Обозначим для краткости

 

l-Y.Z'Ayi = a,   і£>;ДУі(-1)) = Ь.

1=1 1=1

Тогда левую часть формулы (13.42) можно представить в следующем виде:

/(7) = (а - yb)'S(a - yb) = a'Sa - 27b'So + y2b'Sb. Минимум этой функции (по 7) достигается в точке

 

Tmin =

b'Sa b'Sb'

 

что совпадает с формулой (13.43).

 

Задача 13.7

Постройте функцию правдоподобия для модели (13.47), (13.48)

 

*       / л           II.   если уТ4 > О,

L          [0, еслиу*е<0.

 

Решение

Предполагая, что ошибки €ц независимы и имеют одинаковое симметричное распределение, по аналогии с обычными моделями бинарного выбора (см.

(12.4) и (12.5)) получаем следующее выражение для функции правдоподобия:

 

U         п т

Цаг,... ,ап,(3) = Ц Ц [F(x'a0 + rfV [1 - F(x'lt0 -I- at)]1'"" ,

I           *=1 t=l

 

где F(-) ~ функция распределения ошибок єц.

Задача 13.8     # ЖМУ

Рассмотрим модель ■

 

где ошибки Єц ~ iid(0. о*2) и независимы с при s < £. В уравнении вну-тригрупиовои регрессии (13.35)

 

Ун ~Уі= тШйІ'ї -        + є" ~ £i

ошибки коррелированы с регрессорами. Покажите, что МНК-оценка 7 в последнем уравнении несостоятельна (например, покажите, что при 7 = 0 получаем р lim 7 Ф 0).

п — эс

 

Решение

Применяя формулу для простейшей регрессии с одной объясняющей пере-

менной, получаем:

 

7 = 7 +

Ei-i      ~ Vi.-x\%*k - £i)

 

 

Если 7 = 0, то уи~ — уг,_і = Єгі-і ™ є і. — і ■ Таким образом, смещение Д7 оценки 7 есть

Е^1Е;=,(^-1-^,-1)(^-ёо

 

где

1

 

Мы предполагаем, что ошибки независимы и одинаково распределены. Тогда С помощью прямых вычислений получаем:

.2

Ё&_Ы=   # - если^Т-1,

(О,     если ( = Т,

—если * > 2, Г

0,     если t = 1,

 

Подпись: Т2
Подпись: Обозначим

 

t=l

/.= 1

Случайные величины {&} независимы и одинаково распределены, то же самое справедливо относительно {тц}. Из предыдущих формул следует, что

Е(&) =

-   Е(гА) = а\{Т - 1).

 

Следовательно,

 

р lim Д7 - р lim ^pJii = р lim   уф^1* = "^^Л #

 

в силу закона больших чисел. Таким образом, оценка 7 имеет асимптотическое смещение.

 

Задача 13.9

с.    Оценка производственной функции российских предприятий топливно-энергетического комплекса.

В файле fuel.xls содержатся ежегодные данные об объемах выпуска, трудозатратах, капитальных вложениях российских предприятий топ-L    ливно-энергетического комплекса за период 1993-2000 гг. (Е. В. Бессонова, I    ЦЭФИР). В панель включено около 2400 предприятий, панель не сбаланси-I    ровапа (см. таблицу 13.1).

Цель примера — оценить производственную функцию предприятий.

 

Таблица 13.1

 

Переменная Описание

I      окро         номер предприятия по классификации ОКНО

okonh  код отрасли ОКОНХ

year     год

rout      реальный выпуск

етпр    численность работников

wor      промышленно-производствепный персонал

гк        реальные капиталовложения

Вычислите описательные статистики основных переменных.

Оцените производственную функцию Кобба-Дугласа с помощью простой полной регрессии. Выполняется ли условие постоянства отдачи на

масштаб?        ^ *   ''

Повторите упражнение 13.9.2 для регрессий с фиксированным и случайным эффектами. Сравните результаты.

Является ли влияние индивидуальных эффектов существенным? Проверьте гипотезы:

 

простая регрессия против регрессии с фиксированным эффектом;

простая регрессия против регрессии со случайным эффектом;

регрессия со случайным эффектом против регрессии с фиксированным эффектом.

13.9.5. Повторите предыдущие упражнения для более сложной модели производственной функции путем включения квадратичных и перекрестных членов. Выберите наиболее адекватную, с вашей точки зрения, модель.- i

 

Решение ^t^^M^*

13.9.1. Описательные статистики основных переменных представлены в таблице 13.2.

Если более детально проанализировать данные, то можно заметить, что распределение всех переменных сильно скошено влево: большинство наблюдений сосредоточено в области средних значений и имеется относительно небольшое число сравнительно больших выбросов.

 

13.9.2. Рассмотрим производственную функцию Кобба-Дугласа: Output = А • (Capital)0 • (Labor)6, полагая Output == rout, Capital = гй, Lobar = стр. Для оценивания эластичностей а и /5 перейдем к логарифмам и проведем простую регрессию Intout на In г/с, шетпр и константу. Результаты представлены в таблице 13.3. Условие постоянства отдачи на масштаб означает

 

Таблица 13.3. Простая регрессия

Dependent Variable: rout

Variable           Coefficient      Std. Error        i-Statistic Probability

const    -2.488  0.080   -31.08 0.0000

InrA:                0.330  0.016   20.15   0.0000

emp             0.928    0.024   37.66)  0-0000

R2 0.5804

 

выполнение равенства cv + 0 = 1. Проверяя эту гипотезу с помощью стандартного F-теста, получаем значение соответствующей статистики, равное 359.00, что позволяет уверенно отвергнуть гипотезу о постоянстве отдачи на масштаб.

Заменяя переменную Іп-emp на Inwor, получаем несколько иные результаты (см. таблицу13.4). Однако содержательно эти две регрессии мало от

личаются. Во второй регрессии гипотеза постоянства отдачи на масштаб отвергается сто.чь же уверенно, как и в первой, — значение соответствующей статистики равно 270.40.

13.9.3. Результаты оценивания модели с фиксированным эффектом приведены в таблице 13.5. модели со случайным эффектом — в таблице 13.6. В этой и следующей задачах при оценивании модели с фиксированным эффектом используется нормировка ^JL4 &і = 0, т.е. сумма индивидуальных эффектов равна нулю, поэтому в регрессии присутствует константа.

Можно заметить, что результаты оценивания модели с фиксированным •эффектом значительно отличаются как от простой регрессии,^так и от регрессии со случайным эффектом. В то же время оценки в простой регрессии и в регрессии со случайным эффектом сравнительно близки. Отметим, что в модели со случайным эффектом гипотеза постоянства отдачи на масштаб не отвергается - значение соответствующей хп-квадрат статистики равно 1.24 с р-значением 0.265.

 

13.9.4. Будем использовать обозначения учебника.

Простая регрессия против регрессии с фиксированным эффектом. Проверяем гипотезу Но: а = ci2 — •■■ = Фп = 0 с помощью .Р-теста. Значение соответствующей F-статнстики равно 17.62 с р-значением 0.0000. Гипотеза об отсутствии индивидуальных эффектов уверенно отвергается.

Простая регрессия против регрессии со случайным эффектом. Проверяем гипотезу Но: <ти = 0 с помощью теста множителей Лагранжа. Значение соответствующей хи-квадрат статистики равно 6505.11, и нулевая гипотеза безоговорочно отвергается.

Регрессия со случайным эффектом против регрессии с фиксированным эффектом. Проверяем гипотезу Но: Cov(ai,Xji) = 0 с помощью теста Хаусмана. Значение соответствующей хи-квадрат статистики равно 141.00, что позволяет уверенно отвергнуть модель со случайным эффектом в пользу модели с фиксированным эффектом.

 

13.9.5. Мы приведем здесь лишь один из возможных результатов. Сравнительно адекватной оказалась модель с фиксированным эффектом, включающая дополнительно квадраты логарифмов капиталовложений и трудозатрат (см. таблицу13.7):

Задача 13.10   f J\%

(Tammo Bijniolt. Ervvin Charlier) В этом упражнении модели панельных данных используются для анализа продаж некоторого сорта тунца (обозначеи-• ного как А) в нескольких магазинах. Использовались данные о продажах консервированного тунца в 28 магазинах Чикаго в течение 104 недель. Данные для этого примера (описание переменных приведено в таблице 13.8) находятся в файле brand_a.xls'.

 

Таблица 13.8

 

Переменная Описание

sale зп tot sales

 

regpva

OCtpTa

feata

 

displa

 

ftdpla

 

regpn actpj'b

гедргс

actprc regprd

actpvd

объем продаж тунца сорта А

общий объем продаж магазина за весь рассматриваемый период

цена тунца сорта А

цена тунца сорта А с учетом скидки

фиктивная переменная (1 - если в магазине была реклама рыбы copra А, и рыба сорта А не выкладывалась на витрину, 0 — иначе)

фиктивная переменная (1 — если в магазине рыба сорта А выкладывалась на витрину, и не было рекламы рыбы сорта -4, 0 — иначе)

фиктивная переменная (1 — если в магазине рыба сорта А выкладывалась на витрину, и была реклама рыбы сорта Л, 0 — иначе)

цена тунца сорта В (В, Щ.D — конкурирующие сорта)

цена тунца сорта В с учетом скидки

цена тунца сорта С

цена тунца сорта С с учетом скидки

цена тунца сорта D

цена тупца сорта D с учетом скидки

Исследуйте описательные статистики данных. Проверьте (например, с помощью графиков), как связана зависимая переменная с объясняющими.

Оцените простую (pooled) модель зависимости объема продаж от всех остальных переменных. Ввиду того что розничные цены и цены с учетом скидок сильно коррелироваиы, для каждого сорта г тунца используйте переменные гедрГі и discount = regprj - actpr, (і = а, 6, с, d).

 

'Оригинальный пример доступен на странице Эрвина Чарлиера по адресу :tP: //center. uvt.iil/staff/charlier/paneldata. html

Оцените панельную модель с фиксированными эффектами. Все ли

параметры удалось оценить? Если нет, то почему? (В дальнейшем исклю-

чите из модели переменную, вызвавшую проблему.)      I ^^^^^^^

Приведите оценки стандартных ошибок коэффициентов в модели упражнения 13.10.3, интерпретируйте результаты, сравните с результатами упражнения 13.10.2.

Вычислите межгрупповую (between-group) оценку для модели. Интерпретируйте результаты, сравните их с результатами модели с фиксированными эффектами.

Оцените панельную модель со случайными эффектами. Интерпретируйте результаты и сравните с результатами упражиеииий 13.10.4 и 13.10.5.

Используя известные вам тесты (тест Хаусмаиа, LM-тест Бреуша-Пагаиа), выберите наиболее подходящую модель.

Считая, что издержки продажи sales а тунца сорта Л равны 0.5 • salesa, выведите из модели, выбранной в упражнении 13.10.7, оптимальную цену данного сорта рыбы.

 

Решение

 

13.10.1. В таблице 13.9 представлены описательные статистики переменных, относящихся к тунцу сорта А, и цен одного из конкурирующих сортов В.

 

Таблица 13.9

 

salesa   regpra  actpra  feata    displa   ftdpla  гедргь асЬргь

Mean         310.63       0.895   0.793   0.053   0.055   0.149   0.906   0.831

Maximum     5207       1.12     1.12     1          1          1          1.09     1-09

Minimum          7         0.49     0.4       0          0          0          0.56     0.39

Std.Dev.    458.63       0.139   0.169   0.223   0.227   0.356   0.131   0.155

 

Графически связь между переменными actpra и salesai асіргь и salcsb показана на рис. 13.1 и 13.2.

 

13.10.2. Результаты простой регрессии объема продаж тунца сорта А на все остальные переменные (с учетом замены actpri на discount и г = a,b,c,d) представлены в таблице 13.10. Мы включили в число объясняющих переменных фактор totsaleS) хотя с содержательной точки зрения это може -г вызывать возражения, ведь она содержит в качестве слагаемого зависиму10

 

sale а а

1.2

 

неременную salesa. В данном случае это обстоятельство не играет значительной роли, поскольку выборочный коэффициент корреляции между переменными saleSa и totsales равен 0.175. Переменную totsales следует трактовать как фактор, характеризующий величину магазина.

Видим, что ценовые характеристики сортов С и D незначимы, а у сорта В значимо влияет лишь величина скидки. Знаки коэффициентов (при значимых переменных) соответствуют здравому смыслу.

13.10.3. Результаты оценивания модели с фиксированным эффектом приведены в таблице 13.11.

Как и следовало ожидать, пришлось исключить переменную totsales, поскольку для каждого магазина эта величина не меняется но времени.

Dependent Variable: salesa

Сравнивая результаты двух регрессий (таблицы 13.10 и 13.11), видим, что качественные выводы обеих регрессий совпадают: значимо на объем продаж тунца сорта А влияют его цена и величина скидки, рекламная деятельность. Что касается конкурирующих сортов, то только скидки на рыбу сорта В оказываю] значимое влияние на объем продЯщ^^^^^^г

При проведении межгрупповой регрессии выяснилось, что средние по времени переменных fcata, displa и ftdpl.a линейно зависимы, поэтому их нельзя одновременно (при наличии константы) включать в уравнение межгрупповой регрессии. Поэтому в таблице 13.12 представлены результаты межгрупповой регрессии (between group) без переменной ftdpla-

Результаты межгрупповой регрессии значительно отличаются от результатов внутригрупповой (с фиксированным эффектом) регрессии. Объясняется это, по-видимому, тем, что число наблюдений в межгрупповой регрессии (п = 28) слишком небольшое, чтобы можно было надежно оценить 12 параметров. Поэтому прямое сопоставление межгрупповой и внутригрупповой регрессий в данном случае малоипформативно.

 

13.10.6. Результаты оценивания модели со случайным эффектом представлены в таблице 13.13 Мы видим, что результаты оценивания моделей с фиксированным и со случайным эффектом близки не только качественно, по и количественно. Можно проверить, что удаление из регрессий незначимых

переменных не приводит к существенному изменению оценок коэффициентов при оставшихся переменных.

Поскольку все модели, которые здесь рассматриваются, являются простыми линейными моделями, интерпретация коэффициентов стандартная, и мы рекомендуем читателю проделать это самостоятельно.

 

13.10.7. Так же, как и в предыдущей задаче, проверим гипотезу «простая регрессия против модели с фиксированным эффектом» с помощью F-'recTa. Значение соответствующей F-статистики равно 14.35, что говорит в пользу модели с фиксированным эффектом.

Проверяя гипотезу «простая регрессия против модели со случайным эффектом» с помощью теста множителей Лагранжа (теста Бреуша-Пагаиа), получаем значение соответствующей хи-квадрат статистики, равное 1730.17. Вновь модель простой регрессии отвергается.

Наконец, воспользуемся тестом Хаусмаиа для проверки гипотезы «модель со случайным эффектом против модели с фиксированным эффектом». Значение соответствующей хи-квадрат статистики равно 8.96. При нулевой гипотезе проверочная статистика имеет хи-квадрат распределение с 12 степенями свободы. Соответствующее р-значение равно 0.706. Таким образом, тест Хаусмана не отвергаег гипотезу о наличии случайного индивидуального эффекта.

Следует отметить, что к выводам относительно выбора модели следует относиться достаточно осторожно. Если из рассмотренной модели удалить незначимые переменные и оценить ее как модель с фиксированным эффектом и как модель со случайным эффектом, то вновь результаты оценивания будут очень схожими, однако, применив тест Хаусмана, получим /^значение, равное 0.024, что говорит в пользу модели с фиксированным эффектом.

13.10.8. Для определенности остановимся на модели со случайным эффектом, результаты оценивания которой представлены в таблице 13.13. Кроме того, для упрощения выкладок будем считать, что продажа тунца сорта А происходит по регулярной цене гедрга. Итак, согласно принятой модели средний объем продаж есть линейная комбинация переменных, включенных в модель, с коэффициентами, приведенными в таблице 13.13. Выделим слагаемое, относящееся к переменной regprQy т. е. представим объем продаж в виде

salesa = 0vegpra + V,

 

где V — линейная комбинация остальных переменных. Обозначим также для удобства regpra = х, salesa = у. Тогда чистая прибыль netprofit от продажи объемом у равна

 

netprofit = ху- 0.5?/ = (х - 0.5)у = (х - 0.5)(/?ix + V) = 0{х2 + (V - 0.5/?i)x - 0.5V.

 

Поскольку 01 < 0, то максимум этой функции достигается при

 

V - 0.5А

 

Таким образом, оптимальная цена зависит от значений остальных переменных. В подобных случаях можно либо найти значение хтах для среднего (но выборке) значения V, либо вычислить .т1пах по формуле (*) для каждого наблюдения и затем взять среднее (по выборке) значение xmftX. Мы здесь дадим результаты второго подхода, оставляя первый читателю. Итак, проводя необходимые вычисления, получаем, что среднее значение оптимальной регулярной цены тунца сорта А в соответствии с предложенной моделью равно 0.954. Интересно отметить, что среднее значение переменной гедрга равно 0.895. Полученный результат говорит в пользу адекватности построенной модели.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |