Имя материала: Институт экономики переходного периода

Автор: Носко Владимир Петрович

3.3. неадекватность подобранной модели: примеры и последствия

Пример. Рассмотрим статистические данные по США за период с 1959 по 1985 г. г. о следующих макроэкономических показателях:

DPI — годовой совокупный располагаемый личный доход; CONS — годовые совокупные потребительские расходы; ASSETS — финансовые активы на конец календарного года (все показатели в млрд. долларов, в ценах 1982 г.). Представление об изменении этих макроэкономических показателей дает следующий график:

 

t = 1,...,27

Рассмотрим модель наблюдений

| CONSt = ЄХ +Є2DPIt + в3ASSETSt_1 + є, ,

где индексу t соответствует (1958+ t) год. Это модель с 3 объясняющими переменными:

X1 = 1, X2 - DPI, X3 - ASSETS(-1);

символ ASSETS(-1) обозначает переменную, значения которой запаздывают на одну единицу времени относительно значений переменной ASSETS.

Оценивание этой модели дает следующие результаты:

R2

= 0.9981, в 2 - 0.672 0, - 0.174

 

P-value - 0.0000 ; P -value - 0.0069 ;

объясняющие  переменные   X2 = DPI, X3 = ASSETS(-1)

имеют высокую статистическую значимость. Ниже представлены диаграмма рассеяния для предсказанных (CONSF) ина-блюдаемых (CONS) значений переменной CONS, а также график зависимости стандартизованных остатков ci - ejS (RESID STAND) от предсказанных (CONSF) значений переменной CONS:

RESID_STAND vs. CONSF

 

1500

 

 

2000

 

 

2501

 

CONSF

CONSF

Левый график отражает высокое значение коэффициента детерминации. На правом графике заметно возрастание разброса точек относительно нулевого уровня при значениях

Ci >1600.

Поскольку первый из приведенных в этом примере графиков указывает на возрастание годовых потребительских расходов с течением времени, для реализации процедуры Goldfeld-Quandt естественно воспользоваться уже имеющимся упорядочением наблюдений во времени (это и будет направлением ожидаемого возрастания дисперсий случайных ошибок). Заметим теперь, что вследствие использования статистических данных, начиная с 1959 года, мы не имеем в своем распоряжении значения ASSETS0, соответствующего 1958 году. Поэтому реально при оценивании коэффициентов модели наблюдений мы  используем только  26  (ане 27)  наборов значений

 

Подпись:

соответствующие периодам с 1960 по 1969 ис 1976 по 1985 годы (так что отброшены r = 6 центральных наблюдений). При раздельном подборе линейной модели по этим группам наблюдений получаем остаточные суммы квадратов RSS1 - 208.68 и RSS2 - 1299.66, соответственно, так что наблюдаемое значение F - статистики критерия Goldfeld-Quandt равно

RSSJRSS1 = 1299.66/208.68 - 6.228 .

Если стандартные предположения о случайных ошибках в модели наблюдений выполнены, то тогда отношение указанных остаточных сумм квадратов как случайных величин имеет

F -распределение Фишера F(^у-6 ~ З,26^-6 ~ -3j = F(7,7).

Если мы, как обычно, задаем уровень значимости равным а - 0.05, то соответствующее этому уровню значимости критическое значение F -статистики равно F0.95 (7,7) = 3.79 .

Наблюдаемое значение этой статистики 6.228 превышает критическое; поэтому гипотеза выполнения стандартных предположений об ошибках отклоняется в пользу гипотезы возрастания дисперсий D^s t) с ростом значений в1 +6*2 DPI + в3 ASSETS(-1) . Заметим, наконец, что вероятность превышения случайной величиной с распределением F(7,7) значения 6.228 равна

P - value = 0.0138.

Сравним результаты применения критерия Голдфелда-Квандта с результатами, получаемыми при использовании двух вариантов критерия Уайта.

При использовании первого варианта наблюдаемое значение статистики критерия равно nR2 = 8.884. Поскольку p = 3, то число степеней свободы соответствующего распределения хи-квадрат равно 2p - 2 = 4 . Вероятность того, что случайная величина, имеющая такое распределение, превысит значение 8.884 , равна 0.0641, так что значение nR2 = 8.884 меньше критического, а значит, гипотеза однородности дисперсий этим вариантом критерия Уайта не отвергается.

При использовании второго варианта наблюдаемое значение статистики критерия равно nR2 = 9.699. Число степеней свободы соответствующего распределения хи-квадрат равно

p2 + p — 2^2 = 5. Вероятность того, что случайная величина,

имеющая такое распределение, превысит значение 9.699 , равна 0.0842 , так что значение nR2 = 9.699 меньше критического, а значит, гипотеза однородности дисперсий не отвергается и этим вариантом критерия Уайта.

Таким образом, статистические выводы относительно однородности дисперсий случайных составляющих в рассматриваемой модели наболюдений оказались противоречивыми: гипотеза однородности отвергается критерием Голфелда-Квандта, но не отвергается обоими вариантами критерия Уайта. Как можно объяснить такое противоречие?

Оба варианта критерия Уайта асимптотические, тогда как критерий Голдфелда-Квандта учитывает реально имеющееся количество наблюдений.

Оба варианта критерия Уайта являются критериями согласия, не настроенными на какой-то специфический класс альтернатив гипотезе однородности, тогда как использование критерия Голдфелда-Квандта непосредственно связано с альтернативой, выраженной в форме возрастания дисперсий ошибок для соответствующего упорядочения наблюдений. И здесь проявляется общее положение: критерии, построенные с расчетом на у_зкий класс альтернатив, оказываются более мощными по сравнению с критериями, рассчитанными на более широкий класс альтернатив, т. е. чаще отвергают нулевую гипотезу, когда она не верна. Рассмотрим теперь график зависимости стандартизованных остатков ci = ejS от номера наблюдений и его вариант в виде зависимости от года наблюдения:

RESIDSTAND & i     RESIDSTAND & YEAR

2

2

Здесь обращает на себя внимание наличие серий остатков одинакового знака, что сигнализирует о том, что ошибки в модели наблюдений скорее всего имеют положительную автокорреляцию. Для 26 наблюдений и p = 3 объясняющих переменных границы для критического значения статистики Дарбина-Уотсона при а = 0.05 (односторонний критерий) равны

dL,0.05 — 1.22 ,   dU,0.05 — 1.55 .

В то же время, вычисленное по остаткам от оцененной модели значение статистики Дарбина-Уотсона равно DW = 1.01,

что меньше нижней границы dL 005 = 1.22 . Следовательно, нулевая гипотеза о выполнении стандартных предположений отклоняется в пользу гипотезы о положительной автокоррели-рованности ошибок.

Сравним результаты применения критерия Дарбина-Уотсона с результатами, получаемые при использовании критерия Бройша-Годфри.

Если исходить из допущения зависимости очищенных случайных ошибок только на один шаг (K = 1), как это делается при использовании критерия Дарбина-Уотсона, то в этом случае вычисленное значение статистики критерия Бройша-Годфри равно nR2 = 6.068, что соответствует P -значению, равному 0.014 . Гипотеза независимости ошибок отвергается, что согласуется с результатом, полученным при использовании критерия Дарбина-Уотсона.

В то же время, если взять K = 5, то тогда nR2 = 10.331, что соответствует P -значению, равному 0.066. Гипотеза независимости ошибок в этом случае не отвергается при установленном уровне значимости а - 0.05, что расходится с результатом, полученным при использовании критерия Дарбина-Уотсона. Эта гипотеза не отвергается также при выборе K = 6 (P - value = 0.095), K = 7 (P - value = 0.127) ит.д., и это вполне

объяснимо: выбор K = 5, K = 6, K = 7 соответствует выбору все более широких альтернатив по сравнению с K = 1, что приводит к уменьшению вероятности отвергнуть гипотезу независимости ошибок в случае, когда она не верна.

Проверим, наконец, предположение о нормальном распределении ошибок. Сначала рассмотрим диаграмму «квантиль-квантиль»(<(2-<(2рІоґ) и диаграмму плотности (DPP-plot):

3

Первая диаграмма не выглядит удовлетворительной; вторая обнаруживает определенную асимметрию. Выборочный коэффициент асимметрии равен здесь -1.285, а выборочный коэффициент эксцесса равен 5.321. Оба эти значения говорят отнюдь не в пользу нормальности ошибок. Статистика критерия Jarque-Bera принимает значение 12.997, что соответствует P - value - 0.0015. Следовательно, имеющиеся данные не подтверждают гипотезу о выполнении стандартных предположений об ошибках и по этому критерию.

В связи со столь неутешительными результатами в отношении проверки гипотезы выполнения стандартных предположений в рассмотренном примере, возникает естественный вопрос о том, как именно влияют нарушения этих предположений на статистические выводы.

Неоднородность дисперсий ошибок (гетероскедастич-ность, heteroscedasticity). Этот вид нарушений стандартных предположений характерен для статистических данных, относящихся к одному моменту времени, но собранных по различным регионам, различным предприятиям, различным социальным группам (данные в сечениях, cross-section data). Неоднородность дисперсий возникает также как результат тех или иных структурных изменений в экономике, например связанных с мировыми экономическими кризисами. Последний пример как раз и иллюстрирует подобную ситуацию: резкое возрастание абсолютных величин остатков в этом примере относится к периоду глобального нефтяного кризиса. Последствия неоднородности дисперсий ошибок:

Оценки дисперсий случайных величин в Х,...,Ъ (оценок коэффициентов линейной модели) оказываются смещенными.

Построенные доверительные интервалы для в 1,... ,в p

не соответствуют заявленным уровням значимости.

Вычисленные значения t - и F - отношений уже нельзя рассматривать как наблюдаемые значения случайных величин, имеющих t - и F -распределения, соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений t - и F - отношений с квантилями указанных t - и F -распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели.

Автокоррелированность (сериальная корреляция) ошибок (autocorrelation, serial correlation). Этот вид нарушений стандартных предположений характерен для статистических данных, развернутых во времени (продольные данные, longitudial data). Автокоррелированность ошибок обычно возникает вследствие направильной спецификации модели, например, при невключении в модель существенной объясняющей переменной с выраженной автокорреляцией.

Последствия автокоррелированности ошибок:

Оценка S2 = RSS/(n - p) дисперсии случайных ошибок

смещена вниз в случае положительной и смещена вверх в случае отрицательной автокоррелированности ошибок.

Оценки дисперсий случайных величин в Х,...,Ъ (оценок коэффициентов линейной модели) оказываются заниженными в случае положительной и завышенными в случае отрицательной автокоррелированности ошибок.

Построенные доверительные интервалы для в 1,..., в p

не соответствуют заявленным уровням значимости: в случае положительной автокоррелированности ошибок построенные интервалы неоправденно узки, а в случае отрицательной автокоррелированности ошибок неоправданно широки.

Вычисленные значения t - и F - отношений нельзя рассматривать как наблюдаемые значения случайных величин, имеющих t - и F -распределения, соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений t - и F - отношений с квантилями указанных t - и F -распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели. Вычисленные значения t - и F - отношений завышены в случае положительной и занижены в случае отрицательной автокоррелированности ошибок.

При обнаружении нарушений стандартных предположений следует либо улучшить спецификацию модели, привлекая подходящие дополнительные объясняющие переменные, либо использовать для оценивания коэффициентов и оценивания дисперсий коэффициентов модели специальные методы оценивания, принимающие во внимание обнаруженные нарушения (далее мы рассмотрим два таких метода: взвешенный метод наименьших квадратов и авторегрессионное преобразование переменных).

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 |