Имя материала: Введение в эконометрику

Автор: Кристофер Доугерти

7.4. что можно сделать в случае гетероскедастичности?

 

Пусть а,- — стандартное отклонение случайного члена в наблюдении /. В том случае если бы было известно а, для каждого наблюдения, можно было бы устранить гетероскедастичность, разделив каждое наблюдение на соответствующее ему значение а. Тогда случайный член в i-м наблюдении становится равным и,/о, и его теоретическая дисперсия представляется в виде:

Подпись:

 

что равняется:

Это выражение переписывается как

 

of

и, следовательно, оно равно единице. Таким образом, каждое наблюдение будет

иметь случайный член, полученный из генеральной совокупности с единичной дисперсией, и модель будет гомоскедастичной. Теперь модель имеет вид:

 

— = — + Р — + — > (78)

 

что может быть переписано как

y'=av+ р*'+ і/', (7.9)

Л xi

где к'определяется как ~> лс/представляет собой ~» v — новая переменная,

О/ О/

1 и, /-е наблюдение которой равно т~> величина і/,'есть _ • Следует отметить, что

О/ О/

в данном уравнении не должно быть постоянного члена. Оценивая регрессионную зависимость у' от v и х мы получим эффективные оценки для а и р с несмещенными стандартными ошибками.

Математическое доказательство того, что уравнение (7.9) даст более эффективные оценки, чем уравнение (7.1), выходит за рамки данной книги, но здесь можно дать простое интуитивное объяснение. Наблюдения с наименьшими значениями а, будут наиболее полезными для определения истинной зависимости между у и дс, поскольку величина случайного члена в них, как правило, наименьшая. Мы воспользуемся этим, оценивая так называемую взвешенную регрессию, придавая наибольшие веса наблюдениям самого «высокого качества», а наименьшие веса — соответственно, наблюдениям самого «низкого качества». Уравнение (7.9) можно рассматривать как «взвешенный» вариант уравнения (7.1), где значения у и х были умножены на величины 1/с„ которые, конечно, тем больше, чем меньше а,.

Препятствием для этой процедуры является то, что вам почти наверняка будут неизвестны фактические значения а,. Однако процедура будет применимой, если мы сможем подобрать некоторую величину, пропорциональную, по нашему мнению, а в каждом наблюдении, и разделим на нее обе части уравнения.

Допустим, есть основания предположить, что некоторая величина z пропорциональна а, и Zj^kOj, где X — некоторая константа. После деления на z уравнение принимает вид:

 

У і      а    о хі иі

i=V*t+i' <7Л°)

Дисперсия случайного члена представлена как

 

что равно 1 А2. Следовательно, эта величина постоянна для всех наблюдений, и проблема устранена.

Например, может оказаться целесообразным предположить, что а прибли

ЕЕ

GDP

= -0,066

 

GDP

+ 0,053;

R2 = 0,15;

(7.13)

F= 0,48;

R2 = 0,83;

 

(7.14)

F= 160,9.

В каждом случае оценивались «частные» регрессии по первым 12 и последним 12 наблюдениям в выборке, которые определялись упорядочением по переменной GDPb первой регрессии и по GDP/P — во второй. В первом случае RSSX было больше, чем RSS2, что показывает, что пересчет более чем компенсировал гетероскедастичность, но при этом отношение RSSl/RSS2 равнялось 1,37 и, следовательно, было недостаточно высоким, чтобы указывать на статистически значимую гетероскедастичность. Во втором случае RSS2/RSSX было равно 4,60, что указывает на то, что нулевая гипотеза о гомоскедастичности должна быть отклонена при уровне значимости в 5\% (критическое значение /'составляет 2,98).

После преобразования этих уравнений обратно к форме (7.4) можно видеть, что оценки коэффициента при GDP — это такого же порядка величины, что и в данном уравнении, но они несколько ниже. На этой основе было бы целесообразно сделать вывод о том, что указанный коэффициент ближе к 0,06, чем к 0,07. Стандартные ошибки, как это видно, стали больше, но сравнение их со стандартной ошибкой коэффициента при GDP в уравнении (7.4) было бы некорректным по той причине, что последний почти наверняка был серьезно занижен. Оценки величины а незначимо отличаются от нуля как в уравнении (7.13), так и в уравнении (7.14).

Может вызывать беспокойство то, что уровень коэффициента детерминации R2 стал ниже, чем в уравнении (7.4). Действительно, в уравнении (7.13) он настолько низок, что ./-статистика не отличается значимо от нуля даже при уровне значимости в 5\%. Следует, однако, помнить, что определение зависимой переменной в каждом уравнении свое, поэтому значения коэффициента R2 в них несравнимы. В уравнении (7.13) коэффициент R2 измеряет объясняющую способность переменной 1/GDP, которая зависит от значимости в исходном уравнении постоянного члена а, а не р. Теперь же параметр р стал постоянным членом и поэтому не может внести какой-либо вклад в величину Л2.

 

Подход Глейзера

После выполнения теста Глейзера мы могли устранить гетероскедастичность за счет приравнивания zt в уравнении (7.10) к а, в уравнении (7.6) и оценивания регрессионной зависимости уД. от ІДих,/^, где 5, является оценкой а,. После расчета^ на основе формулы (7.7) была оценена следующая регрессия (в скобках даны стандартные ошибки):

R2 = 0,89;

/=263,8.

(7.15)

В сущности, данное уравнение схоже с уравнениями (7.13) и (7.14). Оценивание регрессионной зависимости его остатков от GDPi, где у равно —0,5, 0,5 и 1,0, не привело к отклонению нулевой гипотезы о наличии гомоскедастичности.

Нелинейные функции

Предположим, что истинная модель имеет нелинейную форму (7.16), рассмотренную в разделе 4.3, и что для определенности Р положительна; таким образом, у является возрастающей функцией от х:

y = axh. (7.16)

Мультипликативный случайный член v увеличивает или уменьшает у в соответствующей случайной пропорции. Распределение вероятностей v одинаково для всех наблюдений, что означает, например, что вероятность возрастания у на 2\% под действием этой величины одинакова, независимо от того, является лих малым или большим. Тем не менее абсолютная величина прироста^ на 2\% оказывается большей, когда х принимает высокие, а не низкие значения. Следовательно, будет проявляться тенденция к более сильному разбросу наблюдений вокруг истинной зависимости по мере увеличения х, и линейная регрессионная зависимость у от х может, следовательно, показывать гетероскедастичность.

Решением здесь, конечно, является переход к логарифмической регрессии. Это не только было бы более подходящей математической спецификацией, но и сделало бы модель регрессии гомоскедастичной:

log j> = log а + р logx + log v. (7.17)

Случайный член log v теперь воздействует на зависимую переменную log у аддитивно, поэтому абсолютная величина его воздействия не зависит от величины log х.

 

Пример

Оценка логарифмической регрессионной зависимости государственных расходов на образование от ВВП с использованием данных табл. 7.1 дает следующие результаты (в скобках приводятся стандартные ошибки):

log ££=-3,31 + 1,06 log GDP        Д2 = 0,93; (7.18) (0,24)  (0,05) £=420,4,

откуда видно, что эластичность величины ЕЕ по объему ВВП приблизительно равна единице. Для повышения качества расчетов была также оценена логарифмическая регрессионная зависимость государственных расходов на образование на душу населения от ВВП на душу населения:

1о| ^ = -3,75+ 1,37 log ^-;      R2 =0,89; (7.19)

(со.)  (0,17) (0,09)       F= 254,8.

Результат близок к предшествующему с несколько более высокой эластичностью. Для обоих вариантов были определены «частные» регрессии для первых 12 и последних 12 наблюдений, и в обоих случаях RSSl было больше, чем RSS2, а отношения RSS{/RSS2, соответственно, составили 1,92 и 2,78. Критическое значение .Р-статистики при 10 и 10 степенях свободы и уровне значимости в 5\% составляет 2,98. Таким образом, в обоих случаях нулевая гипотеза о гомос-кедастичности не будет отклонена.4

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 |