Имя материала: Эконометрика

Автор: Кремер Н.Ш.

Глава 12 эконометрические компьютерные пакеты 12.1. оценивание модели с помощью компьютерных программ

На практике союкупность выборочных данных содержит большое количество наблюдений (иногда несколько тысяч). Разумеется, «вручную» производить вычисления такого объема невозможно.

Компьютерные эконометрические (их также называют регрессионными) пакеты содержат в качестве готовых подпрограмм основные, наиболее часто встречающиеся вычисления, которые приходится выполнять исследователю.

В последние годы появились десятки эконометрических пакетов1, в том числе и разработанные в России. В настоящем учебнике мы рассмотрим в качестве примера пакет «Econometric Views», который используется, например, для обучения в Российской Экономической Школе.

Перечислим основные возможности, предоставляемые пакетом «Econometric Views».

 

1. Анализ данных.

Первым этапом эконометрического моделирования является анализ экспериментальных (выборочных) данных, которые предварительно должны быть введены в рабочий файл («Workfile»). Там они хранятся в виде последовательностей чисел, причем каждая выборка имеет свое имя.

Имеется возможность представить данные графически, получить значения основных количественных характеристик выборочных данных.

В качестве примера рассмотрим моделирование формирования цены на автомобили на вторичном рынке в зависимости от года выпуска машины и ее пробега. Пусть Х — срок эксплуата-

 

О возможностях некоторых из них см., например, [13], [14].

279

ции автомобиля — разность между текущим годом и годом выпуска автомобиля, Х2 — пробег (в тыс. км), Y — цена (в у.е.). Рабочий файл пакета содержит основные числовые данные — выборочные значения всех перечисленных переменных. Чтобы получить экспериментальные данные в виде столбцов чисел, надо выполнить команду «Ореп». Экспериментальные данные могут быть получены на экране в виде столбцов:

 

Obs

Xi

х2

У

1

6,000000

91,00000

14800,00

2

7,000000

116,0000

14200,00

3

2,000000

34,00000

17000,00

48

5,000000

90,00000

15300,00

49

14,00000

217,0000

10400,00

50

4,000000

64,00000

15800,00

Графическое изображение данных представлено на рис. 12.1.

При желании можно получить все графики на одном рисунке.

Регрессионные программы допускают преобразования экспериментальных данных. Так, например, имеется команда, позволяющая упорядочить выборочные наблюдения по возрастанию какой-либо переменной. Обычно это имеет смысл в случае пространственной выборки. Также имеется возможность «редактировать» экспериментальные данные: например, исследователь может удалить слишком «нетипичные» наблюдения, которые могут неадекватно исказить модель.

Более подробное представление о распределении выборочных данных дают гистограммы.

В «Econometric Views» имеются команды, с помощью которых сразу получаются основные количественные характеристики выборочных распределений. Вот как выглядит соответствующий результат для нашего примера:

 

 

Xj

x2

У

Mean

7,560000

117,9400

13918,00

Median

6,500000

103,5000

14450,00

Maximum

24,00000

373,0000

17500,00

Minimum

1,000000

15,00000

5000,000

Std. Dev.

5,107657

78,26470

2783,530

Skewness

1,127798

1,157630

-1,123340

Kurtosis

3,994277

4,115747

3,973437

Jarque-Bera

12,65896

13,76109

12,48990

Probability

0,001783

0,001028

0,001940

Observations

50

50

50

 

281

Выдается математическое ожидание (mean), максимум, минимум и медиана распределения, стандартное отклонение (Std. Dev.), асимметрия (Skewness), эксцесс (Kurtosis). Статистика Jar-que-Bera — это статистика проверки гипотезы о том, что соответствующая выборка взята из нормально распределенной совокупности. Ниже приводится соответствующее значение вероятности (Probability). В строке Observations (наблюдения) указывается число наблюдений п,

 

2. Оценивание модели.

После того, как анализ данных завершен, можно приступать к собственно моделированию. Допустим, мы хотим оценить зависимость Y от Х и Xi с помощью метода наименьших квадратов. Для этого в «Econometric Views» имеется специальная команда, результат выполнения которой имеет следующий вид:

LS // Dependent Variable is Y

Sample: 1 50

Included observations: 50

 

Variable

Coefficient

Std. Error

/-statistic

Prob.

С

18046,09

14,98877

1203,974

0,0000

X

-483,3643

32,93229

-14,67752

0,0000

Хг

-4,017735

2,149205

-1,869406

0,0678

В столбце «Coefficient» находятся значения оценок соответствующих параметров регрессии, в столбце «Std. Еггог» — их стандартные отклонения, в столбце «t-statistic» — значения t-критерия Стьюдента при проверке гипотезы о незначимости соответствующих регрессоров. В последнем столбце приводится

ВерОЯТНОСТЬ Р (t > /набл)-

Ниже основной таблицы помещаются некоторые количественные характеристики регрессионной модели: коэффициент детерминации Я2 (R-squared), скорректированный коэффициент детерминации R2 (Adjusted R-squared), стандартная ошибка регрессии — оценка а в предположении, что выполняются условия классической модели Гаусса—Маркова (S.E. of regression), сумма квадратов остатков (sum squared resid), логарифм функции правдоподобия (log likelihood).

Регрессионная программа имеет дело с набором чисел, она не может понимать их природу. Поэтому при использовании метода наименьших квадратов выдаются результаты, имеющие смысл, вообще говоря, только для временных рядов. Таковы статистика Дарбина—Уотсона (Durbin—Watson stat.) и еще некоторые характеристики, которые мы не рассматривали в данном учебнике.

В конце выдается значение ^-статистики при проверке гипотезы о незначимости регрессии в целом и значение соответствующей вероятности.

Как видно, на пятипроцентном уровне значимости регрессор Х2 (пробег автомобиля) оказался незначимым (хотя он значим на десятипроцентном уровне, ибо /п,95; 48 = 2,01; /п,9; 48 =Ь67). Причиной этого может быть высокая коррелированность между двумя величинами Х и Х2 и малый объем выборки.

Обычный метод наименьших квадратов является наиболее распространенным, но, как известно, далеко не всегда наилучшим методом оценивания. Регрессионная программа позволяет выбрать метод наиболее отвечающий характеру экспериментальных данных и их взаимозависимости. При этом в одном меню на выбор предлагаются как методы, специфические, как правило, для пространственной выборки (например, взвешенный метод наименьших квадратов), так и применимые исключительно для временных рядов — например, ARMA. Отметим еще раз, что программа не различает характера экспериментальных данных, и ее неосознанное использование может привести к абсолютно бессмысленному результату.

Для оценивания систем регрессионных уравнений предлагается отдельное меню, в которое входят обычный метод наименьших квадратов, двухшаговый и трехшаговый методы наименьших квадратов, а также метод одновременного оценивания уравнений как внешне не связанных. При выборе двухшагового или трехшагового метода программа запросит также ввести имена инструментальных переменных.

3. Анализ модели.

После получения адекватного регрессионного уравнения, удовлетворяющего исследователя на данный момент, наступает этап анализа модели. Обычно при этом проверяются некоторые предположения — гипотезы, описанные в основном тексте пособия. При этом применяются основные тесты — такие, как тест Уайта, тест Чоу, линейный тест и другие. Большинство из них (что- также было отмечено в основном тексте) выполняются специальной командой.

Вот как выглядит, например, применение теста Уайта для рассматриваемого примера формирования цены автомобиля:

White Heteroskedasticity Test:

F-statistic       0,146329       Probability 0.963694

Obs^-squared           0,642001        Probability 0.958284

Test Equation:

LS // Dependent Variable is RESIDA2

Sample: 1 50

Included observations: 50

 

Variable

Coefficient

Std. Error

t-statistic

Prob.

С

2027,021

2099,532

0,965463

0,3395

X

-3481,328

6934,929

-0,501999

0,6181

 

192,2855

449,3960

0,427875

0,6708

x2

238,8914

451,6586

0,528920

0,5995

 

0,846622

1,871088

-0,452476

0,6531

 

/^-squared

0,012840

Mean dependent var

930,364

Adjusted /^-squared

-0,074908

S.D. dependent var

4618,038

S.E. of regression

4787,878

Akaike info criterion

17,04232

Sum squared resid

l,03E+09

Schwarz criterion

17,23353

Log likelihood

-492,0050

F-statistic

0,146329

Durbin—Watson stat.

2,006108

Prob. (F-statistic)

0,963694

Как видно, низкое значение /"-статистики и соответствующее высокое значение вероятности позволяет принять гипотезу о гомоскедастичности.

Приведем также пример проверки гипотезы о выполнении некоторого условия, задаваемого линейным равенством.

Некоторые дилеры считают, что год «жизни» не слишком дорогого автомобиля уменьшает его стоимость примерно на 500 долларов. Проверим гипотезу о том, что истинное значение (по абсолютной величине) параметра Pi равно 500 (разумеется, значение оценки будет при каждом выборочном наблюдении несколько другим).

Вот как выглядит тестирование гипотезы в компьютерном пакете «Econometric Views».

Null Hypothesis: C(2)=-500

F-statistic 0,255174 Probability 0,615816 Chi-square      0,255174       Probability 0,613455

Гипотезу о выполнении линейного условия можно проверять с помощью /"-теста и А,2-теста. Компьютерная программа приводит значения соответствующих статистик и значения соответствующих вероятностей. Как видно, результаты тестирования позволяют принять соответствующую гипотезу.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 |