Имя материала: Математические методы в экономике

Автор: Замков Олег Олегович

17.3. проверка условий, выполнение которых предполагалось при оценивании уравнения регрессии. автокорреляция остатков. статистика дарбина-уотсона

Близкое к единице значение коэффициента детерминации R2 еще не свидетельство высокого качества уравнения регрессии. Рассмотрим рис. 17.3. На нем показана зависимость реального объема потребления (CONS, млрд.долл., 1982 г.) от численности населения (POP, млн.) в США за 1931-1990 гг., а также линия оцененного по этим данным уравнения парной линейной регрессии. Формула этого уравнения следующая:

СО^= -1817,3 + 16,7 РОЯ. (5)

Стандартные ошибки свободного члена и коэффициента регрессии равны, соответственно, 84,7 и 0,46; их /-статистики - (-21,4 и 36,8). По абсолютной величине /-статистики намного превышают 3, и это свидетельствует о высокой надежности оцененных коэффициентов. Коэффициент детерминации R2 уравнения равен 0,96, то есть объяснено 96\% дисперсии объема потребления. И в то же время уже по рисунку видно, что оцененная регрессия не очень хоро-

CONS 3000

2500-

2000.

1500

1000

500

 

Рисунок 17.3. График зависимости реального объема потребления {CONS, млрд. долл., 1982 г.) от численности населения (POP, млн.) в США в 1931-1990 гг.

ша: зависимость величин POP и CONS явно нелинейна. Если использовать проведенную прямую, скажем, для прогнозирования дальнейшей динамики потребления, результат будет неудовлетворительным. Существо вопроса здесь понятно - в течение рассматриваемого периода значительно вырос объем потребления в расчете на душу населения. Численность населения США росла во времени почти линейно (то есть с постоянными годовыми приростами), а объем потребления - по экспоненте (то есть с примерно постоянным темпом). Это ясно и без уравнения линейной регрессии, но мы специально оценили его для иллюстрации.

Как же можно выразить формально неудовлетворительность полученного уравнения регрессии? Можно видеть, что не выполнены необходимые предпосылки об отклонениях от линии регрессии е.. Эти величины явно не являются взаимно независимыми, и дисперсия их не постоянна. Нарушения исходных предпосылок не только свидетельствуют о неточной спецификации уравнения регрессии, но и делают неточными полученные оценки коэффициентов регрессии и их стандартных ошибок. Поэтому следующий этап проверки качества уравнения регрессии - проверка некоторых важных свойств, выполнение которых предполагалось при оценивании уравнения регрессии.

Приступая к оценке линейного уравнения регрессии, мы предполагали, что реальная взаимосвязь переменных линейна, а отклонения от регрессионной прямой случайны, независимы между собой и имеют нулевое среднее и постоянную дисперсию. Так ли это на самом деле? Если нет, то наш анализ статистической значимости коэффициентов регрессии неточен и оценки этих коэффициентов не обладают такими желательными свойствами, как несмещенность, состоятельность и эффективность.

Попытаемся ответить на вопрос, в каких случаях отклонения не обладают предполагавшимися свойствами. Во-первых, если в действительности исследуемая взаимосвязь нелинейна. Мы видим, например, на рис. 17.3, что в этом случае отклонения от линии регрессии не случайно распределены вокруг нее, а обладают определенной закономерностью. Эта закономерность, в частности, выражается в одинаковом, как правило, знаке каждых двух соседних отклонений. Это может являться следствием нелинейного характера связи переменных, либо воздействием какого-то фактора, не включенного в уравнение регрессии. Величина такого неучтенного фактора может менять свою динамику в рассматриваемый период, отклоняясь в достаточно длительные промежутки времени в ту или иную сторону от своего среднего значения. Это, очевидно, может служить причиной длительных устойчивых отклонений зависимой переменной от линии регрессии. Обе указанные причины свидетельствуют о том, что существует возможность улучшить уравнение рефессии путем оценивания какой-то новой нелинейной формулы или включения некоторой новой объясняющей переменной.

Зависимость, показанная нарис. 17.3, очевидно, нелинейна. Но это - крайний случай. Далеко не всегда бывает столь же очевидно, что отклонения от рефессионной прямой имеют неслучайный, закономерный характер. Для оценки степени такой неслучайности необходимо ввести количественную меру.

Итак, одним из основных предполагаемых свойств отклонений е(. значений у. от рефессионной формулы у=а+$х является их статистическая независимость между собой. Поскольку значения е; остаются неизвестными ввиду неизвестности истинных значений а и р, то проверяется статистическая независимость их аналогов - отклонений е.. При этом проверяется обычно их некоррелированность (являющаяся необходимым, но недостаточным атрибутом независимости), причем некоррелированность не любых, а соседних величин е.. Соседними можно считать соседние во времени (в случае временных рядов) или по возрастанию переменной х (в случае перекрестных выборок) значения е.. Для этих величин можно рассчитать, например, коэффициент корреляции (называемый коэффициентом автокорреляции первого порядка):

Подпись: ее-1*1-1

£е2£ рг (считаем, что Ще] = 0). Практически, однако, используют тесно связанную с /•., статистику Дарбина-Уотсона DW, рассчитываемую по формуле:

1>,-^.,)2 DW= '   £е»     - <6>

2 -1

5> - 2Еел-.+ Ее-

*      і   і          

Очевидно, /)И/=        2          , и, поскольку при боль-

і

ших и Ееі ~ Е еі- получаем DW& 2(1-г,..). Если е. в точности

равно е;,, то = 0; если е. — -е._,, то Z)H^ = 4, во всех других случаях 6 < DW < 4.

В случае, когда каждое отклонение е. примерно совпадает с предыдущим отклонением е._,, каждое слагаемое в числителе величины DH/близко к нулю. Сумма квадратов разностей отклонений в числителе будет намного меньше суммы квадратов отклонений в знаменателе, и поэтому статистика Дарбина-Уотсона окажется близкой к нулю. Рис. 17.3 представляет такой случай - это случай положительной автокорреляции остатков первого порядка. Значение статистики Дарбина-Уотсона здесь равно 0,045, что очень мало и подтверждает статистическую зависимость отклонений е. без всяких таблиц. Другой крайний случай возникает, когда точки наблюдений поочередно отклоняются в разные стороны от линии регрессии, и каждое следующее отклонение е. имеет, как правило, противоположный знак, чем предыдущее отклонение eiV В этом случае (е-е.,)

 

_>                    - 4_/    

«2е., и DW я   дре2    = 4. Это - случай отрицательной

автокорреляции остатков первого порядка. Последняя достаточно редко встречается в экономическом анализе. Если рассматриваются временные ряды с годовыми данными, то подобную закономерность поведения последовательных отклонений довольно трудно проинтерпретировать. Однако она может встретиться при работе, например, с полугодовыми данными показателей с сезонным характером изменения. Наконец, если характер поведения отклонений случаен, можно предположить, что в половине случаев знак последовательных отклонений совпадает, а в половине - различен. Поскольку абсолютная величина их в среднем предполагается одинаковой, можно считать, что здесь в половине случаев е. равно е._,, а в оставшейся половине е. равно -е £0.5-(2Є/)2 J>2

_>                    = п s -4-           І          

Итак, при этом DW «     ^ ^ g2 = 2. Это пока-

зывает, что близость статистики Дарбина-Уотсона к двум является необходимым условием случайного характера отклонений от линии регрессии. Нужно, однако, иметь в виду, что в показателе DWcpaB-ниваются только соседние отклонения от регрессии, в то же время циклы изменения экономических переменных могут быть более или менее длительными, чем одна единица времени. Например, если рассматриваются поквартальные данные сельскохозяйственного производства (имеющего годовой цикл) и оценивается их линейная регрессия от времени, статистика Дарбина-Уотсона может быть близкой к двум при выраженной регулярности отклонений зависимой переменной от линии регрессии.

Если статистика Дарбина-Уотсона близка к двум, мы считаем отклонения от регрессии случайными (хотя в действительности они могут и не быть таковыми). Это означает, что линейная функция, вероятно, отражает реальную взаимосвязь; скорее всего, не осталось существенных неучтенных факторов, влияющих на зависимую переменную, и какая-либо другая, нелинейная формула не превосходит по статистическим характеристикам данную линейную. Даже если доля дисперсии зависимой переменной, объясненной с помощью регрессии, при этом мала, можно ожидать, что другая часть этой дисперсии, оставшаяся необъясненной, порождена действием множества различных малых факторов и может быть описана как случайная нормальная ошибка. Но как определить, достаточно ли близка величина статистики DWk двум? Для этого имеются специальные таблицы, позволяющие при данном числе наблюдений и объясняющих переменных, для заданного уровня значимости, найти критические значения статистики Дарбина-Уотсона.

Итак, статистика Дарбина-Уотсона применяется для проверки гипотезы об отсутствии автокорреляции остатков е. первого порядка (нулевой гипотезы). Для этого по таблицам находятся (при данном уровне значимости, числе наблюдений и независимых переменных) доверительные интервалы, в пределах которых нулевая гипотеза принимается, отвергается или не может быть принята или отвергнута. Важно, что для статистики Дарбина-Уотсона существуют два критических значения, меньшие двух: нижнее dt как граница для признания положительной автокорреляции остатков и верхнее du как граница признания ее отсутствия. Для проверки гипотезы об отрицательной автокорреляции остатков эти критические значения отражаются симметрично относительно числа 2:

4 DW

 

Например, пусть оценена парная линейная регрессия по 15 наблюдениям, и DW= 1,1. Зададим уровень значимости 5\% и найдем по таблицам dt = 0,95;

d = 1,23. Нулевая гипотеза была бы принята при d = 1,23 < DW < 2,77 = 4-du и отвергнута при DW< 0,95 = d, или DW> 3,05 = 4 -dr Поскольку в данном случае Облежит между d и dr нулевая гипотеза не может быть ни принята, ни отвергнута. Если альтернативной гипотезой является гипотеза о положительной автокорреляции остатков (отрицательная из содержательных соображений отбрасывается), то критические значения du = 1,23 и d = 0,95 соответствуют 2,5\%-ному уровню значимости.

Как в общем случае выглядят примерно критические величины статистики DW. Очень грубо, в первом приближении можно сказать, что при достаточном числе наблюдений (не меньше 12-15), при 1-3 объясняющих переменных /ЭИЛцолжна быть не менее 1 (и не больше 3). В противном случае мы признаем существование автокорреляции остатков и попытаемся улучшить формулу. Если статистика О^находится приблизительно между 1,2-1,3 и 2,7-2,8, мы можем считать, что статистически значимая автокорреляция остатков отсутствует. В промежуточном случае достаточно надежный вывод сделан быть не может. Если число наблюдений растет, то критические значения статистики Дарбина-Уотсона dt и du приближаются к двум: для 60-70 наблюдений ее нижнее критическое значение dt составляет примерно 1,4-1,5. Это верно для прежнего относительно малого числа объясняющих переменных; если это число растет, то критическое значение DM7становится меньше.

Итак, обобщая, если статистика Дарбина-Уотсона составляет 1,5-2,0-2,5, мы хотя и не можем быть абсолютно уверены, что отклонения от линии регрессии взаимно независимы, но обычно удовлетворяемся этим в проверке их независимости.

В случае наличия автокорреляции остатков полученная формула регрессии считается обычно неудовлетворительной. Взглянув на график поведения отклонений е., можно поискать другую (нелинейную) формулу, включить неучтенные до этого факторы, уточнить период проведения расчетов или разбить его на части, либо применить к данным уменьшающее автокорреляцию остатков преобразование (например, автокорреляционное преобразование или метод скользящих средних). Так, в рассмотренной уже зависимости объема реального потребления от численности населения объясняющая переменная POP должна быть заменена другой; обычно это объем располагаемого дохода Yd. Если добавить переменную К, к оцененному уравнению, переменная POP становится незначимой (ее г-ста-тистика равна 0,16). Высокий уровень R2 в первоначальном уравнении был обусловлен не тем, что динамика численности населения определяла динамику объема реального потребления, а тем, что обе эти переменные имели выраженную тенденцию возрастания в рассматриваемый период.

Статистика DWпозволяет проверить некоррелированность отклонений от линии регрессии. Некоторые другие свойства этих отклонений (например, постоянство их дисперсии) могут быть также проверены с помощью специальных статистик. Мы не будем останавливаться на этом подробно, упомянув лишь о существовании самой проблемы. Рассуждения при этом могут быть подобными прежним: если значения тестовых статистик "плохие", то можно попытаться уточнить формулу связи, набор объясняющих переменных или процедуру оценивания.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 |