Имя материала: Эконометрика

Автор: А.И. Новиков

Глава 5 гетероскедастичность и автокоррелированность случайного члена 5.1. обнаружение гетероскедастичности

Одной из предпосылок регрессионного анализа является предположение о постоянстве дисперсии случайного члена для всех наблюдений (гомоскедастинность). Это значит, что для каждого значения объясняющей переменной случайные члены имеют одинаковые дисперсии. Если это условие не соблюдается, то имеет место гетероскедастичность.

При отсутствии гетероскедастичности коэффициенты регрессии имеют наименьшую дисперсию среди всех несмещенных оценок, являющихся линейными функциями от наблюдений у.

Если наблюдается гетероскедастичность, то МНК-оценки будут неэффективными (они не будут иметь наименьшую дисперсию по сравнению с другими оценками данного параметра).

Оценки стандартных ошибок коэффициентов регрессии вычисляются в предположении, что распределение случайного члена гомоскедастично; если это не так, то оценки неверны (занижены), а, следовательно, /-статистика завышена. Это может привести к статистически значимым коэффициентам регрессии, тогда как в действительности это неверно.

Проблема гетероскедастичности характерна для пространственных данных, полученных от неоднородных объектов. Например, если исследуется зависимость прибыли предприятий от размера основного фонда, то можно ожидать, что для больших предприятий размах колебаний прибыли будет больше, чем для малых.

Предложено большое количество тестов для обнаружения гетероскедастичности, в которых делаются различные предположения о зависимости между дисперсией случайного члена и величиной объясняющей переменной (или объясняющих переменных), например тест ранговой корреляции Спирмена, тест Голдфельда — Квандта и тест Глейзера.

 

ТЕСТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА

Выдвигается нулевая гипотеза об отсутствии гетероскедастич-ности случайного члена. При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия случайного члена будет либо увеличиваться, либо уменьшаться по мере увеличения х, и поэтому в регрессии, оцениваемой с помощью МНК, абсолютные величины остатков е и значениях будут коррелирован ы.

Данные по х и остатки е ранжируются по переменной х, и определяются их ранги.

Ранг — это порядковый номер значений переменной в ранжированном ряду.

Коэффициент ранговой корреляции Спирмена определяется по формуле

 

г = 1    >

п(п2 -1)

где D-, — разность между рангами х и е.

Если предположить, что коэффициент корреляции для генеральной совокупности равен нулю, то коэффициент ранговой корреляции имеет нормальное распределение с нулевым математическим ожиданием и дисперсией 1/(я - 1) в больших выборках. Соответствующая тестовая статистика гуіп -1 сравнивается с критическим значением /кр при заданном уровне значимости (ґКр = 1,96 при ос = 5\%, /кр= 2,58 при ос= 1\%).

Если г4п - 1 > ґкр, то нулевая гипотеза об отсутствии гетероске-дастичности будет отклонена.

Если в модели регрессии имеется более одной объясняющей переменной, то проверка гипотезы может выполняться с использованием любой из них.

Пример 5.1. Оценим регрессионную зависимость выпуска продукции обрабатывающей промышленности на душу населения у от валового внутреннего продукта на душу населения х в том же году для 17 стран. Исходные данные (усл. ед.):

 

 

 

s

н ее

н о О

50 40 30 20 10 0

-10 -20 -30 -40 -50

 

♦ 5*    10     15     20    25     30    35    40    45 50 ♦ ♦

Рис. 15

Из рисунка видно, что с увеличением переменной х размах колебаний остатков е, тоже возрастает, поэтому есть предположение о зависимости ошибки регрессии от независимой переменной (гетероскедастичность).

Для установления гетероскедастичности применим тест Спир-мена. Выдвигается нулевая гипотеза об отсутствии гетероскедастичности.

Отклонения от линии регрессии (остатки е) и данные по х в порядке возрастания приведены в следующей таблице:

 

X

Ранг

hi

Ранг

А

А2

X

Ранг

е

Ранг

А

А2

3

1

3,6

2

-1

1

24

10

17,1

10

0

0

6

2

3,3

1

1

1

25

11

22,8

11

0

0

7

3

15,2

9

-6

36

26

12

41,2

15

-3

9

9

4

5,9

4

0

0

27

13

43,3

16

-3

9

13

5

4,2

3

2

4

28

14

34,5

12

2

4

15

6

11,4

7

-1

1

35

15

45,0

17

-2

4

18

7

14,4

8

-1

1

37

16

40,8

14

2

4

21

8

9,8

6

2

4

44

17

38,7

13

4

16

22

9

7,9

5

4

16

Итого

ПО

Замечание. При расчете ранга переменной можно воспользоваться статистической функцией РАНГ пакета Excel.

На основе этих данных вычислен коэффициент ранговой корреляции:

Подпись: 61 А2Подпись: 6110

1

= 1

= 0,866.

n(nz-l) 17-288

Тестовая статистика составляет г4п^ = 0,866^17-1 =3,5. Это больше, чем /кр, и, следовательно, нулевая гипотеза об отсутствии гетероскедастичности отклоняется.

 

ТЕСТ ГОЛДФЕЛЬДА - КВАНДТА

При проведении проверки по этому тесту предполагается, что стандартное отклонение а случайного члена пропорционально значению независимой переменной х.

Тест включает следующие шаги:

Все п наблюдений в выборке упорядочиваются по возрастанию переменной х.

Оцениваются отдельные регрессии для первых «0 и Для последних «о наблюдений. Средние (п - 2п0) наблюдений отбрасываются.

3. Составляется статистика: F= RSS2 /RSSX, где RSSX, RSS2 — суммы квадратов остатков для первых и последних п0 наблюдений соответственно. Если верна гипотеза Н0 об отсутствии гетероске-дастичности. то /"имеет распределение Фишера с Vj = щ - к - 1, v2-n0- к- 1 степенями свободы, где к — число объясняющих переменных.

По таблице определяется критическое значение критерия FKp. Если F> FKp, то нулевая гипотеза об отсутствии гетероскедас-тичности отклоняется.

Замечание. Тест Голдфельда — Квандта можно также использовать для проверки на гетероскедастичность при предположении, что а, обратно пропорционально х,-. В этом случае тестовой статистикой является величина F- RSS^'RSS^

Пример 5.2. На основе данных примера 5.1 с помощью обычного МНК оценим регрессии для шести стран с наименьшими значениями показателя х и для шести стран с наибольшими значениями этого показателя.

Получены соответственно уравнения:

у = -0,18 + 4,38х; у 2 = 39,9 +2,11х.

Суммы квадратов отклонений составляют RSS - 229, RSS2 = 9804, при этом F= 9804/229 = 42,8. Критическое значение FKp = 6,39 при 5\%-ном уровне значимости. Поскольку F-42,8 > FKp = 6,39, то нулевая гипотеза об отсутствии гетероскедастичности отклоняется.

 

ТЕСТ ГЛЕЙЗЕРА

Тест Глейзера основывается на более общих представлениях о зависимости стандартной ошибки случайного члена от значений объясняющей переменной. Например, зависимость может быть представлена в виде

о~; = ос + (3xj? + є,-. (5.2)

Используя абсолютные значения остатков в качестве оценки а„ оценивают данную регрессионную зависимость при различных значениях у и выбирают наилучшую из них.

Таким образом, гетероскедастичность аппроксимируется уравнением

s, = а + Ьх],

где s, = е, — оценка с,.

Нулевая гипотеза об отсутствии гетероскедастичности отклоняется, если оценка Ь значимо отличается от нуля.

R2

= 0,655,

h

= 5,34;

R2

= 0,698,

h

= 5,9;

R2

= 0,654,

h

= 5,3;

R2

= 0,538,

h

= 4,18.

Пример 5.3. На основе данных |е,[ их примера 5.1с использованием различных значений у были оценены уравнения (5.2):

у = У2,    s = -20,2 + 9,4Vx~,

у = 1,      5 = -3,15 + 1,146х:,

у = 2,     s = 7,32 + 0,024х2,

7 = 3,     s = 12,12 + 0,0005л3,

Наилучший результат (по R2) соответствует значению у = 1, при этом оценкой о является величина

s = -3,15 + 1,146х. (5.3)

(4,7) (0,19)

Коэффициент b = 1,146 значимо отличается от нуля, следовательно, имеет место гетероскедастичность.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 |