Имя материала: Математика в экономике

Автор: Юдин С.В.

6.4. анализ временных рядов

Временные ряды, в отличие от остальных, изначально упорядочены по параметру «время».

В качестве примера для анализа возьмем данные по Нью-Йоркской фондовой бирже с 05 января 1966 г. по 26 июня 2006 г. (всего 2117 наблюдений). График представлен на рис. 6.21.

NYSE closing price, Wednesdays

Эти данные имеются в базе примеров программы GRETL. Их можно загрузить последовательностью команд меню: [File] —> [Open data] —» [Sample file] (рис. 6.22). To же можно выполнить нажатием крайней правой кнопки на нижней панели.

Появляется окно выбора файлов примеров (рис. 6.23). Следует обратить внимание на большое количество имеющихся там статистических данных. Эти примеры широко используются в различных учебниках по эконометрике.

К—

Рис. 6.22. Открытие файлов.

 

R,:...,,,...,.-.      ДІ-      

<? Q @ *

 

 

 

 

Gretl Greene Kufel_ru | Ramanathan | Wo о Id ridge |

File SuimiTiary

 

ІМ'_ II 1                                   '_' _■—1 1 IU Ц_| U—LI U '_U—ГОТ—1 M'_ II 1  J  1' 1 L'LI'_ 1—I 

krnenta      US macro data plus artificial data longley      Annual U.S. labor-market data leverage     Illustrates detection of incorrect data mccullagli   Ship damage data used by William Greene mroz&7     Women's labor force participation and pay mrw         Mankiw, Rome г and Weil cross-country data

np        Nelson and Plosser (JMEr 19S2) US macro data      

nysewk     Weekly NYSE closing price, 1996-2006

penngrow  Nerlove cross-country growth data

pension      Pension-plan participation (Papke, 2004)

poisson      Test data for Poisson regression

rac3d        Ca nne ro n -Trive d і d о cto г visits d ata

sw_chl2    International macro data (Stock and Watson]

5w_chl4    Unemployment and inflation (Stock and Watson)

Close

 

Рис. 6.23. Окно выбора файлов примеров.

Выбранный нами файл очень большой и охватывает 40-летний период, в течение которого, как видно из графика на рис. 6.21, поведение цен было различным. Для исследования выберем период с 06 января 1988 г. по 30 декабря 1998 г. (574 наблюдения). График представлен на рис. 6.24.

 

 

 

Выбор линии тренда

Наблюдаемые данные можно приближать разными функциями. Самая распространенная модель - линейная. Но отобранные нами данные явно имеют нелинейную зависимость от времени.

Здесь возникает проблема, какую функцию выбрать для приближения?

С одной стороны, у исследователя могут быть некоторые теоретические соображения по виду функциональной зависимости. С другой стороны, часто нет никакой априорной информации о характере процесса.

 

Наиболее часто приближение осуществляется степенными ря-

п

дами, т.е. полагаем, что x{t) = ^а/ + s(t), где п - степень многочле-

2=0

на; аи i=...n- неизвестные коэффициенты; z(t) - случайная составляющая. Здесь и далее параметр времени t численно равен номеру недели, начиная с первой (06 января 1988 г.).

Мы рассмотрим три модели: линейную, квадратическую и кубическую. Для построения квадратической и кубической моделей

2 3

были введены новые переменные: time = t, time2 = t, time3 = t.

Необходимо отметить, что многочлены более высоких степеней нецелесообразно применять в статистическом анализе.

 

Ниже представлены результаты расчета трех моделей.

 

1. Линейная модель.

Model 1: OLS estimates using the 574 observations 88/01/06-98/12/30 Dependent variable: close

Variable           Coefficient    Std. Error      t-statistic p-value

const    961,45 43,2647        22,2225       <0,00001 ***

time     7,06538       0,130381       54,1901       <0,00001 ***

Mean of dependent variable = 2992,75

Standard deviation of dep. var. = 1280,8

Sum of squared residuals = 1,53243e+008

Standard error of residuals = 517,597

Unadjusted R2 = 0,836971 Adjusted R2 = 0,836686 Degrees of freedom = 572

F-statistic (2, 571) = 2930,46 (p-value < 0,00001) Durbin-Watson statistic = 0,0152249 First-order autocorrelation coeff. = 0,996553

Log-likelihood = -4400,51

Akaike information criterion = 8805,02 Schwarz Bayesian criterion = 8813,72 Hannan-Quinn criterion = 8808,41

 

2. Квадратическая модель.

Model 3:OLS estimates using the 574 observations 88/01/06-98/12/30 Dependent variable: close

Подпись: t-statistic
55,3534
-11,1158
37,3970
Подпись: const time time2

Variable

Std. Error

35,05 0,281516

Coefficient 1940,14 -3,12927

0,0177298 0,000474098 Mean of dependent variable = 2992,75 Standard deviation of dep. var. = 1280,8 Sum of squared residuals = 4,44275e+007 Standard error of residuals = 278,938

Unadjusted R2 = 0,952735 Adjusted R2 = 0,95257

F-statistic (2, 571) = 5754,93 (p-value < 0,00001) Durbin-Watson statistic = 0,0521203 First-order autocorrelation coeff. = 0,973034

Log-likelihood = -4045,16

Akaike information criterion = 8096,31 Schwarz Bayesian criterion = 8109,37 Hannan-Quinn criterion = 8101,4

p-value

<0,00001 <0,00001 <0,00001

 

***

***

***

 

3. Кубическая модель.

Model 11: OLS estimates using the 574 observations 88/01/06-98/12/30

Dependent variable: close

Подпись: 5,53039e-05 2,29458e-06
Variable

const time time2 time3

Coefficient

1411,7 7,8512 -0,0299698

Std. Error

33,0182 0,496865 0,00200705

t-statistic

42,7553 15,8015 -14,9323

24,1020

p-value

<0,00001 <0,00001 <0,00001 <0,00001

 

***

***

***

 

Mean of dependent variable = 2992,75 Standard deviation of dep. var. = 1280,8 Sum of squared residuals = 2,20032e+007 Standard error of residuals = 196,474

Unadjusted R2 = 0,976592 Adjusted R2 = 0,976468

F-statistic (3, 570) = 7926,73 (p-value < 0,00001) Durbin-Watson statistic = 0,105053 First-order autocorrelation coeff. = 0,94817

Log-likelihood = -3843,49

Akaike information criterion = 7694,98 Schwarz Bayesian criterion = 7712,39 Hannan-Quinn criterion = 7701,77

 

Анализ полученных результатов дает основание для принятия квадратичной модели:

 

Модель

Коэффициент R2

Расчетное значение F-критерия

Линейная

0,836686

2930,46

Квадратичная

0,95257

5754,93

 

Кубическая

0,976468

796468

Добавление кубического слагаемого ничего не дает с точки зрения надежности и точности модели: коэффициент множественной корреляции увеличивается незначительно, а сложность модели возрастает. В этой связи оставляем квадратичную модель.

 

Уравнение модели:

 

x{t) = 1940,14 - 3,12927 • t + 0,0177298 • t2

Здесь x - значение переменной close, t - порядковый номер недели, начиная с первой.

 

Оценка автокорреляции остатков (критерий Дарбина-Уотсона)

Если остатки, т.е. разница между рассчитанными по модели значениями и фактическими значениями, коррелированны, то это означает, что модель более сложная, чем предполагалось. В этом случае нарушается независимость наблюдений друг от друга и необходимо использовать автокорреляционные модели.

В таблице данных второй (квадратической) модели имеется два параметра, характеризующих автокорреляцию остатков:

1. Статистика Дарбина-Уотсона (Durbin-Watson statistic). Эта величина равна Durbin-Watson statistic = 0,0521203.

Для сравнения ее с критическими значениями необходимо вызвать функцию статистических таблиц программы GRETL последовательностью команд меню [Tools] -» [Statistical tables] (рис. 6.25).

На появившемся окне статистических таблиц выбрать закладку [DW] (рис. 6.26) и ввести объем выборки n.

Подпись:  Подпись:
Рис. 6.25. Вызов статистиче- Рис. 6.26. Ввод исходных данных ских таблиц

К сожалению, максимальное значение объема выборки в этих таблицах - 100. Ниже приведены результаты, которые выдает программа для n =100 и n=50.

5\% critical values for Durbin-Watson statistic,  n = 100

Number of explanatory variables   (excluding the constant):

1          2          3          4          5 10

dL    dU       dL    dU       dL    dU       dL    dU       dL    dU       dL dU

1,65 1,69      1,63 1,72      1,61 1,74      1,59 1,76      1,57 1,78      1,46 1,90 5\% critical values for Durbin-Watson statistic,  n = 50 Number of explanatory variables   (excluding the constant):

1          2          3          4          5 10

dL    dU       dL    dU       dL    dU       dL    dU       dL    dU       dL dU 1,50 1,59    1,46 1,63    1,42 1,67    1,38 1,72    1,34 1,77    1,11 2,04

 

В нашей модели оценивается два коэффициента, следовательно, необходим второй столбец значений.

Расчетное значение d = 0,0521203. Оно существенно меньше левой границы, что дает основание утверждать о наличии автокорреляции остатков.

2. Коэффициент автокорреляции первого порядка (First-order autocorrelation coefficient).

Он равен 0,973. При выборке объемом 574 эта величина по критерию Стьюдента заведомо значима.

Таким образом, два критерия говорят о наличии автокорреляции.

 

Автокорреляция остатков (прямые расчеты)

Программы GRETL позволяет прямые вычисления автокорреляционной функции. Для расчета автокорреляционной функции остатков в окне модели необходимо выбрать последовательность [Tests] -» [Autocorrelation] (рис. 6.27).

Таблица 6.7. Тест на автокорреляцию остатков

with p-value = P(F(14,543) > 763,499) = 0   

Alternative statistic: TRA2 = 532,927332,

with p-value = P(Chi-square(14) > 532,927) = 9,61e-105     

Ljung-Box Q' = 5406,48 with p-value = P(Chi-square(14) > 5406,48) = 0 Test statistic: LMF = 763,499452,

with p-value = P(F(14,543) > 763,499) = 0   

Звездочки в последнем столбце показывают наличие значимой автокорреляции при сдвиге на 1, 3, 4, 6, 12, 13 единиц времени.

Авторегрессия

Т.к. в разделе 6.4.2. было установлено, что в модели имеется явление авторегрессии, то есть последующие наблюдения зависят от предыдущих, необходимо использовать авторегрессионную модель, включающую в себя предыдущие наблюдения.

Для этого выбираем пункты меню [Model] —» [Time series] —» [Autoregressive estimation...] (рис. 6.28).

Появляется окно спецификации модели (рис. 6.29).

Выбираем зависимую переменную close (цена закрытия) и независимую time (время). Выбираем лаги (List of AR lags) и нажимаем кнопку [lags.].

В окне выбора лагов по переменной (рис. 6.30), указываем шаг на единицу.

Дважды нажимаем [OK] и получаем результаты расчета (табл.

6.8).

Уравнение регрессии:

x(t) = 1,63842 + 0,0506474 • t + 0,997384 • x(t -1)

Исправленное значение квадрата коэффициента множественной корреляции равно 0,997527, что очень велико.

Рис 6.29. Окно спецификации авторегрессионной модели.

Критерий Дарбина-Уотсона равен 1,9993, что говорит об отсутствии корреляции остатков. Это подтверждается и коэффициентом автокорреляции остатков, который равен -0,0002.

Таблица 6.8.

Авторегрессионная модель.

Model 7: Cochrane-Orcutt estimates using the 572 observations 88/01/20-98/12/30

Dependent variable: close

Variable           Coefficient    Std. Error      t-statistic p-value

const    1,63842        7,31885  0,2239 0,82294

time     0,0506474   0,0388241     1,3045 0,19258

close_1            0,997384   0,00504203   197,8138    <0,00001 ***

Statistics based on the rho-differenced data: Sum of squared residuals = 2,30544e+006 Standard error of residuals = 63,6533

Unadjusted R2 = 0,997536 Adjusted R2 = 0,997527

F-statistic (2, 569) = 123084 (p-value < 0,00001) Durbin-Watson statistic = 1,9993 First-order autocorrelation coeff. = -0,000246158 Akaike information criterion = 6377,81 Schwarz Bayesian criterion = 6390,85 Hannan-Quinn criterion = 6382,9

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 |