Имя материала: Математические методы в экономике

Автор: Замков Олег Олегович

18.4. мультиколлинеарность

Теперь мы предпримем для иллюстрации шаг, который впоследствии окажется ошибочным, но поможет при этом показать очень важное явление в оценивании множественной регрессии - мультиколлинеарность. Мультиколлинеарность - это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. Проблема мультиколлинеарности возникает только для случая множественной регрессии, поскольку в парной регрессии лишь одна объясняющая переменная. Оценка коэффициента регрессии может оказаться незначимой не только из-за несущественности данного фактора, но и из-за того, что трудно разграничить воздействие на зависимую переменную двух или нескольких факторов. Это бывает в том случае, когда какие-то факторы линейно связаны между собой (коррелированы) и меняются синхронно. Связь зависимой переменной с изменениями каждого из них можно определить, только если в число объясняющих переменных включается лишь один из этих факторов.

Природа мультиколлинеарности нагляднее всего может быть продемонстрирована на примере совершенной мультиколлинеарности, то есть строгой линейной связи между объясняющими переменными. Например, если в уравнении

у = р0 + р, х, + р2 х2 + є (12)

объясняющие переменные х, и Xj связаны линейным соотношением х2 = "К хр то исходное уравнение сводится к уравнению простой линейной регрессии

у = р0 + р, х, + р2 ?іх, + є = р0 + р; X, + є, (13)

в котором могут быть получены оценки коэффициентов Р0 и Р,' = Р, + Я р2. Последнее уравнение представляет собой одно уравнение с двумя неизвестными р, и Р2, которые найдены по отдельности, естественно быть не могут. Таким образом, совершенная мультиколлинеарность не позволяет определить коэффициенты регрессии (в данном примере р, и Р2) и разделить вклады переменных х, и х2 в объяснение поведения переменной у.

Несовершенная мультиколлинеарность, то есть стохастическая связь переменных х, и х2, характеризуется величиной коэффициента корреляции р между ними. Чем ближе по абсолютной величине значение коэффициента корреляции к единице, тем ближе мультиколлинеарность к совершенной и тем труднее разделить влияния объясняющих переменных х, и х2 на поведение переменной у и тем менее надежными будут оценки коэффициентов регрессии при этих переменных.

Предположим, что чистый экспорт зависит от потребления: поскольку существенная часть импортируемой продукции потребляется, для этого есть основания. Для этого введем в последнее уравнение дополнительную объясняющую переменную: величину реальных потребительских расходов CONS (Real Consumption Expenditures). Получаем уравнение

RNX= 406,6 - 0,07-GNP- 2,61 ER(-) + 0,035 CONS (14)

(70,1) (0,110)      (0,31) (0,152) (в скобках приведены стандартные ошибки) R2 = 0,82; DW= 0,87.

Мы видим здесь, что R- и DW пе стали лучше - переменная CONS не дает дополнительной информации для объяснения поведения RNX. Однако здесь сразу два коэффициента регрессии оказались статистически незначимыми - коэффициент при переменной потребления CONS (что понятно) и коэффициент при переменной GNP (что требует объяснения). Проблема здесь состоит в том, что переменные GNPn CONS сильно коррелированы между собой - за период 1965-1990 гг. их коэффициент корреляции равен 0,9978. Итак, даже если существует сильное влияние на RNXобеих переменных GNPw CONS, мы не можем разделить это влияние при оценивании регрессии поданным нашей выборки. Поэтому мы исключаем из числа объясняющих только что введенную переменную CONS.

В общем случае, если при оценке уравнения регрессии несколько факторов оказались незначимыми, то нужно выяснить, нет ли среди них сильно коррелированных между собой. Для этого распечатывается корреляционная матрица (это предусмотрено стандартными статистическими программными пакетами), и проверяется статистическая значимость коэффициентов парной корреляции. При наличии корреляции один из пары связанных между собой факторов исключается, либо в качестве объясняющего фактора берется какая-то их функция. Если же незначимым оказался только один фактор, то можно его исключить или заменить другим (хотя, возможно, на каком-то более коротком промежутке времени данный фактор оказался бы значимым).

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 |