Имя материала: Эконометрика Книга первая Часть 1

Автор: Носко Владимир Петрович

Раздел 6 особенности регрессионного анализа для стохастических объясняющих переменных тема 6.1        линейные регрессионные модели со стохастическими объясняющими переменными

В предыдущих разделах главное внимание было уделено статистическим выводам в рамках классической нормальной линейной модели наблюдений (модели нормальной линейной множественной регрессии)

Уі=віХІІ+в2хі2+... + Єрхір+єі9   / = 1,...,л,

в которой предполагается, что значения объясняющих переменных хп, хй9 хір9 і = 1,п фиксированы, а случайные составляющие єІ9 \%9 єп (ошибки) являются независимыми случайными величинами, имеющими одинаковое нормальное распределение с нулевым математическим ожиданием и конечной дисперсией (такие предположения об ошибках называются стандартными). Далее были проанализированы последствия различного типа нарушений таких предположений об ошибках и рассмотрены некоторые методы коррекции статистических выводов о коэффициентах модели при наличии соответствующих нарушений стандартных предположений.

В матрично-векторной форме классическая нормальная линейная модель наблюдений имеет вид:

у = Хв + є9

где у = (yl9y29 ...9уп)т —вектор-столбец значений объясняемой переменной

в п наблюдениях; X — («х /?)-матрица значений объясняющих переменных в п наблюдениях, п >р;

в19 • • •» 6рУ   —   вектор-столбец коэффициентов; є-(єІ9 \%9     єп)т — вектор-столбец случайных ошибок (возмущений) в п наблюдениях.

Предполагается, что случайный вектор є имеет я-мерное нормальное распределение с нулевым вектором математических ожиданий

Е(е) = (Е(єх), Е(є2),..., Е(є„ ))т = (0,0,...,0)r (в краткой записи: Е(є) = О)

и ковариационной матрицей

Cov(s) = (Cov(enSj)) = cr2I„,

где /„ — единичная матрица (размера п х п).

Здесь

Cov(si9sj) = E{si-E(si))(sj-E(Sj))

— ковариация случайных величин st и Sj.

Предположение о фиксированности значений объясняющих переменных в совокупности со стандартными предположениями об ошибках удобно с чисто математической точки зрения: при таких предположениях оценки параметров, получаемые методом наименьших квадратов, имеют нормальное распределение. Это, в свою очередь, дает возможность:

строить доверительные интервалы для коэффициентов линейной модели, используя квантили ^-распределения Стьюдента;

проверять гипотезы о значениях отдельных коэффициентов, используя квантили ^-распределения Стьюдента;

проверять гипотезы о выполнении тех или иных линейных ограничений на коэффициенты модели, используя квантили F-распределения Фишера;

строить интервальные прогнозы для будущих значений объясняемой переменной, соответствующих заданным будущим значениям объясняющих переменных.

Вместе с тем используемое в классической модели предположение о фиксированности значений объясняющих переменных в п наблюдениях фактически означает, что можно повторить наблюдения значений объясняемой переменной при том же наборе значений объясняющих переменных хП9хй9 ...9xip9 /=1,...,л. При этом получим другую реализацию (другой набор значений) случайных составляющих єІ9 ^ sn9 что приведет к значениям объясняемой переменной, отличающимся от значений^,у19 ...9уп9 наблюдавшихся ранее.

С точки зрения моделирования реальных экономических явлений предположение о фиксированности значений объясняющих переменных можно считать реалистичным лишь в отдельных ситуациях, связанных с проведением контролируемого эксперимента. Между тем в реальных ситуациях по большей части нет возможности сохранять неизменными значения объясняющих переменных. Более того, и сами наблюдаемые значения объясняющих переменных (как и ошибки) часто интерпретируются как реализации некоторых случайных величин. В таких ситуациях становится проблематичным использование техники статистических выводов, разработанной для классической нормальной линейной модели.

Поясним последнее, обратившись к матрично-векторной форме классической линейной модели с р объясняющими переменными

у = Хв + є

и не требуя нормальности распределения вектора є.

Если матрица X имеет полный ранг р9 то матрица XТХ является невырожденной, для нее существует обратная матрица (ХТХ)~ и оценка наименьших квадратов для вектора в неизвестных коэффициентов имеет вид:

в = (ХтХ)~хХту.

Математическое ожидание вектора оценок коэффициентов равно:

Е(в) = Е((ХтХу1Хт(Хв+є)) =

= Е((ХтХухХтХв)+Е{(ХтХухХтє) = в+Е{{Хт Х)~х Хт є).

Если матрица X фиксирована, то

Е((ХтХу1Хтє) = (ХтХухХтЕ(є) = О,

так что Е{в) = в9 т.е. в — несмещенная оценка для в.

Пусть, однако, мы имеем дело со стохастическими {stochastic) объясняющими переменными, т.е. столбцы матрицы X рассматриваются как случайные векторы, а сама матрица X образует систему р случайных векторов и является случайной матрицей. Элементы этой матрицы xij9 і = 1, п9 j = 1, являются случайными величинами, имеющими некоторое совместное распределение вероятностей. Тогда в общем случае Е((ХтХ)~хХтє)) Ф 0, так что Е{в) Ф в9 и в — смещенная оценка для 0. Кроме того, эта оценка уже не имеет нормального распределения, даже если вектор є имеет нормальное распределение.

Если объясняющие переменные стохастические, то в некоторых случаях все же остается возможным использовать стандартную технику статистических выводов, предназначенную для классической нормальной линейной модели, по крайней мере, в асимптотическом плане (при большом количестве наблюдений).

Рассмотрим несколько таких ситуаций.

Ситуация А (наиболееблагоприятная)

случайная величина єк не зависит (статистически) от хп, хй9 хір при всех / и к;

єї9       єп являются независимыми случайными величинами, имею-

щими одинаковое нормальное распределение с нулевым математиче-

ским ожиданием и конечной дисперсией а2 > 0. Как и ранее, кратко

обозначим это как є( ~ НА N(09 а2).

При выполнении таких условий имеем:

Е((ХТХ)~хХТє) = Е((ХтХ)~1Хт)Е(є) = 0,

так что оценка наименьших квадратов для в является несмещенной. Распределение статистик критериев (тестовых статистик) можно найти с помощью двухшаговой процедуры. На первом шаге находим условное распределение при фиксированном значении матрицы Х при этом значения объясняющих переменных рассматриваются как детерминированные (как в классической модели). На втором шаге получаем безусловное распределение соответствующей статистики, путем умножения условного распределения на плотность X и интегрирования по всем возможным значениям X.

Если применить такую процедуру для получения безусловного распределения оценки наименьших квадратов в, то на первом шаге найдем:

вХ~Щ09ст2(ХтХух).

Интегрирование на втором шаге приводит к распределению, являющемуся смесью нормальных распределений N(09 a2(XTX)~l) по X. Это распределение в отличие от классического случая не является нормальным.

В то же время для оценкиу'-го коэффициента имеем:

 

где (Хт Х)~~ — у-й диагональный элемент матрицы (ХТХ)~ так что

 

0,-0,

/    J X~N(09).

 

Xr        (n~P)S2           C2       RSS nec

Условным распределением для       ^—, где £ =    , RSS — остаточ-

а п-р

ная сумма квадратов, является распределение хи-квадрат с (п-р) степенями свободы:

 

Заметим, что /-статистика для проверки гипотезы Н0 : в}г = в* определяется соотношением

f_ _Фге])1ФТхг«

 

Из предыдущего вытекает, что если гипотеза Н0 верна, то условное распределение этой /-статистики имеет /-распределение Стьюдента с (п -р) степенями свободы

tX~t{n-p).

Это условное распределение одно и то же для всех X. Поэтому независимо от того, какое именно распределение имеет Х9 безусловным распределением /-статистики для Н0 : в}, = в* при выполнении этой гипотезы будет все то же распределение t(n -р).

Аналогичные рассуждения показывают возможность использования стандартных F-критериев для проверки линейных гипотез о значениях коэффициентов.

Те же самые выводы остаются в силе при замене предположений ситуации А следующим предположением.

Ситуация А'

є | Х-N(09 <j2i„)9 где /„ — единичная матрица размера (п х п). Для краткости будем далее обозначать:

xt = (хп,хй9хір)т—вектор-столбец значений р объясняющих переменных в 1-м наблюдении; Хп —матрица значений объясняющих переменных для п наблюдений.

Ситуация В

случайная величина єк не зависит (статистически) от xil9 ха9     хір при всех і и к

распределение случайной величины st не является нормальным, но 6t ~ lid., Е(єг) = О, D{st) = а2 > О и E(sf) = ju4 < oo;

E(xtxJ) = Qt — положительно определенная матрица, (l/n)(Q{ + ... + + Qn)    Q ПРИ n ~~> °°i гДе Q — положительно определенная матрица;

E(xfj xik xn xis) < oo для всех k9l9s;

(/ri)(xxx{ + ... +xnx*) = (lri)X*X„ -> Q при n —► oo по вероятности.

В силу первого предположения оценка наименьших квадратов вектора коэффициентов в остается несмещенной, как и в ситуации А. Однако при конечном количестве наблюдений п из-за негауссовости (ненормальности) распределения st распределения статистики S2, а также t- и F-статистик будут отличаться от стандартных, получаемых в предположении нормальности. Чтобы продолжать пользоваться обычной техникой регрессионного анализа, необходимо сослаться на следующие асимптотические результаты, строгий вывод которых можно найти, например, в книге (Hamilton, 1994). Пусть

в(п)      — оценка наименьших квадратов вектора в поп наблюдениям; S2, tn,Fn — статистики S291, F, вычисляемые по п наблюдениям.

Если выполнены предположения, перечисленные при описании ситуации В, то при п —► оо:

yfc(e(n)-e)^N(0,a2Q-1);

^t(S2-a2)-^N(0^,-G\%

ґ„->аді);

qFn —► хя)^ гДе Ч — количество линейных ограничений на компоненты вектора ft

Здесь везде имеются в виду сходимости по распределению, т.е. функции распределения случайных величин, стоящих слева от стрелки, поточечно сходятся при п —► оо к функциям распределения, стоящим справа от стрелки. При этом имеют место приближенные соотношения:

в(п) *N(09 <r2Q~l/ri)9 или 9(п) * N(09 аХТпХУ) (последнее аналогично точному соотношению в гауссовской модели);

qFn~xq)-

Если в ситуации В при имеющемся количестве наблюдений п использовать не асимптотические распределения, а распределение Стьюдента t{n -р) для ^-статистики (вместо N(09 1)) и распределение Фишера F(q, п-р) для F-статистики (вместо хч) Для Ч^п то это приводит к более широким доверительным интервалам (по сравнению с интервалами, построенными по асимптотическим распределениям). Многие исследователи предпочитают поступать именно таким образом, учитывая это обстоятельство и то, что при конечных п распределения Стьюдента и Фишера могут давать лучшую аппроксимацию истинных распределений статистик tn и Fn.

Ситуация С

В рассмотренных выше ситуациях, как и в классической модели, предполагалось, что є і Х~ i.i.d. Откажемся теперь от этого предположения и предположим, что:

условное распределение случайного вектора є относительно матрицы X является «-мерным нормальным распределением N(09 a2V)

V — известная положительно определенная симметричная матрица размера (п х п).

Поскольку матрица V симметрична и положительно определена, такой же будет и обратная к ней матрица V~ Но тогда существует такая невырожденная (п х я)-матрица Р9 что Vі = РТР. Используя матрицу Р9 преобразуем вектор є к вектору

є*=Рє.

При этом Е(є*) = О и условная (относительно X) ковариационная матрица вектора е

Cov(s*X) = Е(є*є*тХ) = Е(Рє(Рє)тХ) = РЕ(єєтХ)Рт = Pa2VPT. Но V = (V~l)~l = (РТР)~ так что

Cov(s* Х) = Pcj2VPt = а2Р(РтРу{Рт = а21„. Преобразуя с помощью матрицы Р обе части основного уравнения

у = Хв+є9

получим:

Ру = РХв+Рє9 или у* = Х*0+є щеу* = Ру9 Х* = РХ9 є* = Рє. В преобразованном уравнении

є*Х~М(09ст2Іп)9

так что преобразованная модель удовлетворяет условиям, характеризующим ситуацию А Это означает, что все результаты, полученные в ситуации А9 применимы к модели

у=Ґв+є В частности, оценка наименьших квадратов

0* =(X*TX*ylX*Ty =(XTPTPXylXTPTPY = (XTV-lXylXTV-ly

является несмещенной, т.е. Е(в*)- в9 ее условное распределение (относительно X) нормально и имеет ковариационную матрицу

Cov(6* Х) = a2(X*TX*yl = <T2(XTV-lXyl. Получение этой оценки равносильно минимизации по в суммы

п п

Z Z wnt (У і - вха -...-ОрХь ){ук - 0{хк1 - ... -        ),

і=к=

где wik =vkx) —элементы матрицы V~

Отсюда название описанного метода оценивания — обобщенный метод наименьших квадратов (GLS — generalized least squares). Сама оценка в* называется обобщенной оценкой наименьших квадратов (GLS estimator), для ее обозначения обычно используется подстрочный индекс GLS:

e*=9GLS={XTV-xxrXTV-xy.

Заметим, что в рамках модели >>* = Х*6+ є* можно использовать обычные статистические процедуры, основанные на t- и F-статистиках.

yf Замечание 6.1.1. Если матрица V диагональная, V- diag(Aj2, А2), Aj, hn > О, и не все hk одинаковы (так что еХ9 еп — условно независимые случайные величины с неодинаковыми дисперсиями), то Vх - diag(l/A2, 1/А2), и в качестве подходящей матрицы Р естественно взять Р = diag(l/A1? 1/AJ. При этом в преобразованном уравнении

У*=Уі/Ьі>   xl'=xij/hi>   J = U—>P>  « = 1,...,я,

так что обобщенная оценка наименьших квадратов вектора в получается как результат минимизации по в суммы

 

1=1

ґУі-вххп—-0рхір^

К

= іі(л-^п--«л)2»

/-і А,-

т.е. суммы квадратов взвешенных отклонений, или взвешенной суммы квадратов отклонений. Соответственно в подобных случаях обобщенный метод наименьших квадратов называют взвешенным методом наименьших квадратов.

Подобная ситуация уже встречалась в примере 5.2.1. Там имели р = 2 и предполагали, что значения хй9 і = 1, п9 фиксированы и А2 =х]2.

J Замечание 6.1.2. При рассмотрении темы 5.3 предполагалось наличие автокоррелированности ряда ошибок в форме процесса авторегрессии 1-го порядка:

et=pet_x+8t9  t = 29...9n9

где р < 1, St91 = 29 п, — независимые в совокупности случайные

величины, имеющие одинаковое нормальное распределение

N(09 сг2), и St не зависит от st_s9 s > 0. Если предположить еще, что

ех имеет такое же распределение, как и    єп9 то Е(єх) = 0,

Die,) ^

При этом в преобразованном уравнении получаем:

У =ЛІ1~Р2 'Ух,   x*XJ=<Jl-p2 -xlJ9   j = l9...,p,

У* =yt~РУі-і>   x*j = xtj ~Pxt-j>   j = l,...,p,   t = 29...9n.

Это преобразование называют преобразованием Прайса —

Уинстена (Prais-Winsten transformation). Заметим: если использовать для оценивания преобразованные уравнения, начиная со второго (игнорируя первое уравнение), то это точно соответствует преобразованию, использованному при изложении темы 5.3 в связи с итерационной процедурой Кохрейна — Оркатта.

Если матрица V не известна априори, то часто ограничиваются моделями, в которых она параметризована, так что V= V(/3)9 где /5— векторный параметр, который приходится оценивать по имеющимся наблюдениям. При этом достаточно часто можно использовать стандартные выводы в асимптотическом плане, заменяя в выражении для GLS-оценш в* = (XTV~lX)~lXTV~ly неизвестную матрицу V- V(j30) (c2V(j30) — истинная ковариационная матрица вектора є) матрицей V(/3n), где /?„ — любая состоятельная оценка для Д. В таких случаях говорят о «доступном» обобщенном методе наименьших квадратов (feasible GLS). Так, для реализации преобразования Прайса — Уинстена достаточно получить состоятельную оценку для параметра /?, и такая оценка уже использовалась в разд. 4.5 при рассмотрении процедуры Кохрейна — Оркатта:

п

Yjetet- р=Ч—.

 

/=2

где еи    еп — остатки, получаемые при оценивании обычным методом наименьших квадратов исходной модели наблюдений.

Рассмотренные выше ситуации не охватывают, однако, многие важные для приложений модели временных рядов. Для их изучения необходимо освоить основные понятия и факты, касающиеся временных рядов, рассмотреть особенности регрессионного анализа временных рядов, что предусмотрено в следующей части учебника.

 

КОНТРОЛЬНЫЕ ВОПРОСЫ

Какие преимущества дают стандартные предположения о линейной нормальной модели?

К каким нежелательным последствиям может приводить отказ от предположения о детерминированности объясняющих переменных?

Какое дополнительное условие на случайные ошибки достаточно добавить к стандартным предположениям об ошибках в нормальной линейной модели, чтобы можно было на законных основаниях использовать стандартные /- и F-критерии?

Как следует поступать в случае, когда условное распределение случайного вектора є относительно матрицы X является «-мерным нормальным распределением N(0, a2V)c ковариационной матрицей V, отличающейся от единичной матрицы?

В чем состоит обобщенный метод наименьших квадратов? Как он реализуется на практике? і

Чем отличается оценка Прайса — Уинстена в модели с автокоррелированными ошибками от оценки, получаемой путем авторегрессионного преобразования переменных, используемого в процедуре Кохрейна — Оркатта?

 

            Тема 6.2         

метод инструментальных переменных

Заметим, что в ситуациях А,А'иС, рассмотренных в теме 6.1, общим является условие

Е(е,Х) = 0,   / = 1,..„л,

так что

Е(Єіху) = О для j = 1,        при всех і и к.

Но тогда

= О

И

Cov(si9xkj) = E{{st -E{st)){xkj -E(xkJ))) = Е(8{(хк] - E(xkJ)) = E(st xkJ) = 0

(конечно, при этом предполагаем, что математические ожидания E(xkj) существуют и конечны).

Таким образом, если ошибка в /-м уравнении коррелирована хотя бы с одной из случайных величин xkj9 то ни одно из условий А9А С не выполняется. Например, эти условия не выполняются, если в /-м уравнении какая-либо из объясняющих переменных коррелирована с ошибкой в этом уравнении. Последнее характерно для моделей с ошибками в измерении объясняющих переменных и моделей одновременных уравнений, о которых поговорим ниже. Пока же приведем пример, показывающий, к каким последствиям приводит нарушение условия некоррелированности объясняющих переменных с ошибками.

 

ПРИМЕР 6.2.1

Смоделированные данные соответствуют следующему процессу порождения данных:

DGP:j;. =а + /?дс1.+^/,   e^iLd. N(0,1),   / = 1,...,100, a=10, /?=2, jc^^-O.^,   / = 2,...,100,

при этом Corr(xi9 st) = 0.743.

Для параметра /3 получаем оценку /? = 2.553, имеющую весьма сильное смещение.

Предположим, что имеем в распоряжении значения уі9 хі9 і - 2, 100, но ничего не знаем о процессе порождения данных. Оценим на основе этих данных статистическую модель у. = а + J3x{ + st методом наименьших квадратов. Получим результаты, приведенные в табл. 6.1

Зафиксировав полученную реализацию х29 є1009 смоделируем еще 499 последовательностей [єІк...9є^}9 к = 2, 500, имитирующих реализации независимых случайных величин, имеющих стандартное нормальное распределение, и для каждой такой последовательности построим последовательность {у(2 ),..., ум} по формуле:

yk)=a + pxt+ek   / = 2          100.

Для каждого к = 2,500, по «данным» yf хі9 і = 2,100, оценим статистическую модель уФ = а + Рх{ + єФ и получим оценки коэффициентов а(к fik

В результате имеем последовательности оценок а(2    а{500) и /?(2),/?(500).

На рис. 6.1 приведены статистические характеристики полученной последовательности j3(2 р{500

 

Среднее значение практически совпадает с истинным значением параметра Д гипотеза нормальности распределения оценки /? не отвергается.

Поступим теперь другим образом. Для каждой из смоделированных последовательностей [є2к...9є^]9 к = 2, 500, сначала построим последовательность {х^),...,х1(о0)}, а затем — последовательность [у(2...9у{^} по формуле:

ук) = а + 0хк) + єк   / = 2   100.

В отличие от предыдущего способа здесь для различных значений к используются различные последовательности {*2^--->хіоо}> определяемые последовательностью {є2к),..., є$}.

После получения последовательностей х },..., jc}0q) и (у2 ..., >»ioo) при каждом к = 2, 500 произведем оценивание статистической модели у{к) = а + /?xf} + df* и получим оценки коэффициентов d*(k /?*(*}. В итоге

имеем последовательности оценок а*(2    а*(500) и /?*(2),/?*(500).

На рис. 6.2 приведены статистические характеристики последовательности

/Г<2>, ...,/?*<500>.

80

Series: SLOPE RANDOM Sample 2500 Observations 499

60 -

 

40 -

Mean

Median

Maximum

Minimum

Std. Dev.

Skewness

Kurtosis

2.552114 2.551333 2.588107 2.530200 0.007346 0.754039 4.608878

Подпись: ' Г 2.5620

 

 

2.53

III

2.54

 

 

2.55

 

 

і і і і і і і і і і

2.57     2.58     2.59 fi*

Jarque-Bera 101.1054 Probability 0.000000

Рис. 6.2

 

На этот раз среднее значение полученных значений fi*(k равное 2.552114, весьма сильно отличается от истинного значения параметра /? = 2, а наблюдаемое значение статистики Харке — Бера говорит о том, что распределение оценки наименьших квадратов параметра J5 - 2 не является нормальным.

Заметим также: положительная коррелированность х( и є( означает, что значениям хі9 превышающим их среднее значение в выборке, по большей части соответствуют и значения остатков, превышающие их среднее значение в выборке. Но последнее равно 0 при использовании метода наименьших квадратов, так что значения остатков, превышающие их среднее значение в выборке, суть просто положительные значения остатков. В итоге для первоначально смоделированных данных^, хі9 і = 2,100, это приводит к картине, изображенной на рис. 6.3. Здесь Linear (Y) — прямая, подобранная по этим данным методом наименьших квадратов, т.е. прямая у = 10.13984 + 2.553515х9 a YTHEOR — теоретическая прямая у = 10 +2х. Как видно на рис. 6.3, первая прямая повернута относительно второй прямой в направлении против часовой стрелки, так что для больших значений наблюдаемые значения у{ смещены вверх по отношению к прямой>> = 10 +2х.Ш

Модели, в которых есть объясняющие переменные, коррелированные с ошибкой

Модели с пропущенными переменными (missing variables). В разд. 3 говорилось о возможности смещения оценок в множественной линейной модели регрессии при невключении в правую часть уравнения некоторых существенных переменных. Рассмотрим модель порождения данных

DGP:^ =а + Pzt + yxt +£.,   / = 1,...,л,

со стохастическими объясняющими переменными z и х, в которой S{ ~ иЛ9 E(st) = О, D(st) = a2, Cov(xi9 st) = Cov(zt, £t) = 0. Предположим, что между переменными z и х имеется сильная корреляционная связь, которая проявляется при оценивании коэффициентов модели в форме опасной мультиколлинеар-ности, так что при применении /-критерия каждый из оцененных коэффициентов при этих переменных объявляется статистически незначимым, хотя гипотеза незначимости регрессии в целом отвергается.

Как говорилось в разд. З, в качестве одного из возможных выходов из такой ситуации часто используют исключение одной из сильно коррелированных между собой переменных из правой части уравнения. Если поступить таким образом и исключить из правой части оцененного уравнения переменную х, то оценивать станем статистическую модель

SMr.y,. =ar + fizf+ui9 а в этой модели ut = yxt + st. Но тогда

Cov(zi 9ut) = Cov(zf 9ухі+єі) = у Cov{zt, xt) * 0, что приводит к смещению оценки коэффициента при переменной z.

Модели с ошибками в измерении объясняющих переменных {errors-in-variables models). Рассмотрим модель порождения данных

DGP: у. = а + fizt + щ9   і = 1,100,

со стохастической объясняющей переменной z, для которой выполнены предположения:

Е(и,) = 0,   D(Ui) = ej2,   Е(и,г,) = 09

так что

E(yizt) = a + (3zi.

Предположим, что значение zt невозможно измерить точно, и в результате измерения вместо истинного значения zt наблюдается

 

где v; — ошибка измерения. Пусть при этом выполнены следующие условия: . £(v,.) = 0,D(v,.) = <rv2;

случайные величины ut и vz независимы:

случайная величина vt не зависит от истинного значения zt.

Выразим zt через xt и подставим xt - vt вместо zt в исходное уравнение. Получим:

у1=а + Ръ+е19

где et = ut - и

Cov(xs ,*,.) = Cov(zt + v,.,«,--/? v,.) = -р а].

Если Р > 0, то хі и £; имеют отрицательную корреляцию; если Р < 0, то х, и st имеют положительную корреляцию.

Покажем, что оценка наименьших квадратов /? не только имеет смещение при конечных п9 но и несостоятельна, т.е. даже при неограниченном увеличении количества наблюдений не сходится к истинному значению /? по вероятности. С этой целью в формулу для Р'.

п

 

Р=—п

2>,-*)2

1 = 1

подставим выражение для yt. Получим: х, - Рх + є, - єх, - х)      -еХх, -х)

р=-—:  =р+—

-2

1=1      1 = 1

так что

2

и-*»     D(xt)      ' crz2+crv2

Таким образом, /3 не стремитсА по вероятности к Д за исключением случая, когда сг2 = 0, т.е. когда ошибки измерения z, отсутствуют. Если отношение дисперсий <уЦ<у22 мало, то мало и асимптотическое смещение оценки наименьших квадратов. В противном случае асимптотическое смещение оказывается значительным.

Системы одновременных уравнений {simultaneous equations). Рассмотрим кейнсианскую модель потребления

Ct=a + fiYt+et9

где С, — реальное потребление на душу населения; Yt — реальный доход на душу населения;

Р — параметр (0 < /3 < 1), интерпретируется как склонность к потреблению (норма потребления).

Можно было бы на законных основаниях использовать для оценивания этого параметра метод наименьших квадратов, если бы не одно осложняющее обстоятельство. В случае модели замкнутой экономики без правительства в дополнение к указанному уравнению в этой модели имеется еще и соотношение

Yt=C,+I„

где 7, — реальные инвестиции на душу населения. Таким образом имеем систему уравнений

С, = a + pY,+s, Yt=Ct+It

О такой системе уравнений говорят как о структурной форме одновременных уравнений (structural form of simultaneous equations), подразумевая под этим, что такая форма представляет в явном виде взаимные связи между входящими в модель переменными, показывает, как эти переменные взаимодействуют друг с другом (в данном случае Yt воздействует на С„ а С, — на Yt). В структурной форме модели одновременных уравнений переменная, являющаяся объясняемой переменной в одном из уравнений, может входить в другое уравнение в качестве объясняющей переменной.

Выразив из этой системы С, и Yt через 1п получим приведенную форму

(reducedform of simultaneous equations) модели в виде:

а          Р    т 1

'     1-Д    1-Д  '    1-Д '

Vа       1      т 1

'   1-Д   1-Д '   l-p '

В такой форме взаимодействие между С, и Yt уже не представлено в явном виде, однако коэффициенты приведенной формы отражают итог взаимодействия этих переменных.

1-Д Р

Действительно, предположим, что в указанной системе значение переменной It увеличивается на 1. Это приведет к увеличению значения Yt также на 1. Но тогда согласно первому уравнению системы значение С, должно увеличиться на р. Это изменение приведет, в свою очередь, к увеличению значения Yt на Д а последнее — к увеличению значения С, на /?2, и т.д. В итоге получим последовательное возрастание значений Yt на 1, Д Д2, Д3, ... и последовательное возрастание значений С, на Д Д2, Д3, ... Просуммировав эти приращения, получим в результате возрастание значения Yt на

1 + Д + Д2+Д3+ 1 и возрастание значения С, на

Д + Д2+Д3 + ... И 1-Д

Но именно такие выражения имеют коэффициенты при переменной It в уравнениях приведенной формы.

Предположим теперь, что st - i.i.d., Е(єг) = О, D(6() = сг2 > 0 и для каждого / случайные величины It и et независимы. Тогда из второго уравнения приведенной формы находим:

Cov(Ynst) = j^Cov(snst) = ^^09

так что в исходном уравнении для С, объясняющая переменная Yt коррели-

рована с ошибкой. При этом для оценки Д коэффициента Д получаемой (по п наблюдениям) применением метода наименьших квадратов к исходному уравнению, имеем:

Cov(Ynst)

Ршр = р+-

и-»00 D(Yt)

где

2

/Him/? = /? + (!-/?)-     є-        

 

Поскольку а2є > О и в модели Кейнса 0 < /?< 1, то /? переоценивает значение нормы потребления.

/

V    Замечание 6.2.1. Приведенное выражение для р\тр подразумевает,

что значение D(It) не зависит от t и конечно. Однако такое предположение обычно не выполняется на практике.

В данном случае получить оценки параметров а и /? можно, минуя исходное уравнение и обращаясь только к уравнениям приведенной формы. В каждом из этих двух уравнений объясняющие переменные не коррелированы с ошибкой.

Первое уравнение приведенной формы можно записать в виде:

С, = a + plt +єп

где

a = a/(l-p), p = p/(l-P), Zt=st/(l-P), E(Zt) = 09

D(Zt) = *l=*2J(l-P)2.

Применив метод наименьших квадратов к данному уравнению, найдем оценки коэффициентов а и /? и оценку дисперсии о. После этого можно найти оценки для параметров исходного уравнения из соотношений:

 

Таким образом, структурная форма восстанавливается по первому уравнению приведенной формы. Второе уравнение оказывается в этом плане избыточным. Но, используя одно это уравнение, можно также восстановить структурную форму.

Действительно, это уравнение можно записать в виде:

Yt=y+SIt+sn

где y=a=a/(l-P), S=l/(l-P).

Применив метод наименьших квадратов к этому уравнению, найдем оценки коэффициентов у и S и оценку дисперсии а. После этого можно найти оценки для параметров исходного уравнения из соотношений:

0 = (S-l)/S, а = у/ё, а] = <тЦ82.

Возникает вопрос: будут ли совпадать результаты восстановления параметров структурной формы, полученные по двум различным уравнениям приведенной формы?

Если обратиться к выражениям для а9 Д и сг2 через параметры этих уравнений, то нетрудно заметить, что

r/s = a/(l + fi),   (S-l)/s =0/(1 + 0), аЦб2=аЦ( + 0)2.

Таким образом, зная истинные значения параметров уравнений приведенной формы, однозначно восстанавливаем по ним значения параметров структурной формы. Однако в данном случае истинные значения параметров уравнений приведенной формы нам не известны, и их приходится оценивать по имеющимся статистическим данным. При этом оценки параметров структурной формы, полученные с использованием оценок коэффициентов для разных уравнений приведенной формы, могут в общем случае отличаться друг от друга. Это связано с тем, что количество параметров приведенной формы больше минимально необходимого для восстановления значений параметров структурной формы.

 

Метод инструментальных переменных

Прежде чем перейти к описанию метода инструментальных переменных, обратимся к обычному методу наименьших квадратов, который применяется к простейшей линейной модели

yt = а + fa + єі9 є( ~ Ltd., E(st) = 0, D{si) = а2, і = 1,п.

В этом случае оценка наименьших квадратов для коэффициента /? удовлетворяет системе нормальных уравнений

£(Уі-а-0Хі) = О

і = J = l

выражающей ортогональность вектора остатков е = (el9     еп)Т9 где е{ = у{ -

- а - J3x( — остаток в і-м наблюдении, векторам 1 = (1,1)т их = (хи хп)т. Эти условия ортогональности, записанные в равносильных формах

1 п       1 п

-2>д = о, -2>л = о,

 

являются выборочными аналогами теоретических соотношений

Cov(st, 1) = 0,   Cov(st 9xt) = 0.

Первое из двух последних соотношений выполняется автоматически, а второе в силу предположения E(st) = 0 можно записать в виде E(st xt) = 0.

Раздел 6. Особенности регрессионного анализа для стохастических... переменных 253

.           ,          

1    п    1 п

Если Cov(si,xi) Ф О, то plim— YVoc^O и соотношение — У]е{х{=0

не является эмпирическим аналогом теоретического соотношения E(st xt) = 0. Можно было бы попытаться найти какую-то другую переменную z,-, для которой выполняется соотношение Cov(si9 Zj) = Е{е^) = 0, и заменить второе уравнение нормальной системы выборочным аналогом последнего соотношения, т.е. уравнением

 

Конечно, решение новой системы отличается от решения исходной системы, поэтому временно обозначим получаемые оценки коэффициентов как а* и /?*. Эти оценки удовлетворяют соотношениям

,-а -0'х,) = О,   £(Уі-а -/?**,)*,? =0,

/=1       1 = 1

из которых находим явное выражение для /?*:

п

^(Уі-У)(2і-2) і = 1

г п

 

i =

которое можно также записать в виде:

 

-fix + e, - sXz,-z) -s)(Zi-z)

            =0+^    .

X О/ - x)(zt - z)           - ^ (xt - x)(zt - z)

Здесь

p lim - У (et - s)(zt -z) = Cov(ei9zt) = 0, 1 n

 

так что, чтобы p\m J3*=fi, необходимо выполнение еще одного условия:

л-юо

Cov(xi9 zt) Ф 0.

Если для переменной zt выполнены оба условия:

Cov(st, zt) = 0,   Cov(xi9 zf) * 0,

то ее называют инструментальной переменной или просто инструментом

(instrumental variable, instrument). Наличие такой переменной позволяет получить состоятельную оценку коэффициента Р при переменной xt в ситуации, когда xt коррелирована с st. Инструментальная переменная является экзогенной переменной (exogenous variable) — в том смысле, что она определяется вне связи с рассматриваемым уравнением у. = а + Pxt + st. Переменная xt в рассматриваемом контексте является эндогенной переменной (endogenous variable) — она связана (коррелирована) с ошибкой в этом уравнении, так что значения Xj устанавливаются совместно (одновременно) с et. Следуя обычной практике, будем снабжать оценки коэффициентов, полученные с использованием инструментальных переменных, подстрочным (или надстрочным) индексом IV: dIV, PIV (или dIV, pIV), где IV — аббревиатура от Instrumental Variables (инструментальные переменные). Метод получения таких оценок называют методом инструментальных переменных (IV method — instrumental variables method).

Возвратимся к системе, включающей кейнсианскую функцию потребления:

(Ct=a + pYt+st9 [Yt=Ct+It.

При сделанных ранее предположениях относительно этой модели имеем:

 

Cov(Ynst) = —^"*0> так 4X0 Ъ — эндогенная переменная. В то же время

Cov(In st) = 0 (в силу предположения о независимости этих случайных величин), так что It — экзогенная переменная. Используя второе уравнение приведенной формы, найдем:

Cov( YnL) = Cov{-^— + ^—L +——єп А = -!■£>(/,)* 0,

'  '         [l-P   1-Р '   -р '   *)   -р '

так что переменную It можно применять в качестве инструмента для получения состоятельной оценки коэффициента р. Это приводит к оценке

£(с,-С)(/,-7)

 

t = l

Это же выражение для /F-оценки коэффициента /? можно получить следующим формальным образом. Возьмем ковариации обеих частей структурного уравнения С, = а + PYt + st с It. Это приведет к соотношению:

Cov(Ct Jt) = Cov(at Jt) + P Cov(Yt, /,) + Co v(st Jt).

При сделанных предположениях оно сводится к равенству

Cov(CnIt) = pCov(YnIt),

откуда находим:

Cov(CnIt) Cov(YnIt)'

Чтобы получить оценку для Р по п имеющимся наблюдениям, заменим теоретические ковариации в правой части их выборочными аналогами:

i£(C,-C)(/,-7) £(С,-С)(/,-/) «,=1 ,=i

t =

t =

 

ПРИМЕР 6.2.2

В табл. 6.2 приведены взятые из (Economic Report of the President, 2000, Appendix В) статистические данные (тыс. долл. 1996 г., в расчете на душу населения) о следующих макроэкономических показателях экономики США:

CONS — расходы на личное потребление (personal consumption expenditures);

Y — располагаемый личный доход (disposable personal income), а также вычисленные на их основе значения переменной

I=Y-CONS.

При оценивании по этим данным методом наименьших квадратов уравнения

CONSt=a + j3Yt+st

Рис. 6.5

получим график остатков, приведенный на рис. 6.4. Он говорит о наличии двух фаз в модели связи. Переломным здесь можно считать 1986 г. — год одного из глобальных нефтяных кризисов, выразившегося в обвальном снижении мировой цены нефти до 10 долл. за баррель. Чтобы не заниматься двухфазной моделью, ограничимся далее рассмотрением докризисного периода с 1959 по 1985 г. При оценивании на этом периоде того же уравнения получим график остатков, приведенный на рис. 6.5. Он уже не обнаруживает смены режима связи. Результаты оценивания даны в табл. 6.3.

Оценив уравнения приведенной формы, получим: CONSt = 4012.195 + 4.949It+et9 Г, =4012.195 + 5.949/,+£„ так что в принятых ранее обозначениях:

а = р = 4012.195,   0 = 4.949,   д = 5.949.

При использовании оценок коэффициентов первого уравнения получим следующие оценки для а и 0:

0 = -Дг = 0.832,   а = -Аг = 674.5;

+ Р     1 + 0

при сохранении в вычислениях большего количества десятичных знаков

0 = 0.831891 и а = 674.4849 соответственно.

Если использовать оценки коэффициентов второго уравнения, получим те же самые значения оценок:

 

0 =       = 0.831891,   а = 4 = 674.4849. д 8

Это вовсе не случайно и означает, что ситуация весьма благоприятная, когда, оценив коэффициенты уравнений приведенной формы, по ним можно однозначно находить оценки коэффициентов структурной формы. Тем самым реализуется косвенный метод наименьших квадратов (ILS — indirect least squares).

Заметим: если коэффициенты некоторого уравнения структурной формы однозначно восстанавливаются по оценкам коэффициентов приведенной формы, то говорят, что соответствующее уравнение структурной формы идентифицируемо точно.

Вычислив оценку коэффициента 0 с привлечением в качестве инструмента переменной/, найдем: С = 1737.04, 7 = 1561.04, Y= 13298.07, £(с,-сх/,-/)

Дк =iv = 0.831891. ■

£(yf-F)(/,-7)

 

Ту же самую оценку для /? можно получить, используя двухшаговую процедуру, ее идея состоит в построении искусственной инструментальной переменной У,, которой можно подменить эндогенную объясняющую переменную Yt в структурном уравнении.

На первом шаге обычным методом наименьших квадратов оценивается модель линейной зависимости эндогенной объясняющей переменной Yt от инструментальной переменной It (она соответствует второму уравнению

приведенной системы). Используя полученные оценки у и S, строим новую переменную

Yt=y + SIt9

которая интерпретируется как результат очистки переменной Yt от линейной корреляционной связи с єг Фактически при этом производится «расщепление» переменной Yt на две составляющие:

Y,=Y,+(Yt-Yt),

одна из которых затем отбрасывается.

На втором шаге обычным методом наименьших квадратов оценивается модель

CONSt =a + pft+st,

в которой прежняя объясняющая переменная Yt заменяется ее очищенным вариантом.

Такой метод оценивания параметров структурного уравнения CONSt = = а + j3Yt + st называется двухшаговым методом наименьших квадратов

(2SLS — two-stage least squares). Оценки cc2sls и P2sls-> получаемые этим методом, удовлетворяют соотношениям

ZiCONS,-d2SLS - P2SLSY,) = 0,   £(СО№,-а2Я£ - fi2SLSYt)It = 0,

t=l t=

т.е. являются /F-оценками.

При использовании метода инструментальных переменных в форме 2SLS в примере 6.2.2 на втором шаге получим результаты, приведенные в табл. 6.4.

В пакете Е Views предусмотрена специальная процедура, реализующая двухшаговый метод наименьших квадратов. Часть протокола применения этой процедуры для примера 6.2.2 приведена в табл. 6.5.

Замечание 6.2.2. В рассмотренном примере оценки параметров модели CONS, = а + j3Yt + st при использовании обычного метода наименьших квадратов оказались равными:

а = 546.7669 и /? = 0.841496,

соответственно. В то же время оценки, полученные косвенным методом наименьших квадратов, инструментальные оценки и оценки, полученные двухшаговым методом наименьших квадратов (совпавшие для всех этих методов из-за точной идентифицируемости структурного уравнения), несколько отличаются от них и равны

а = 674.4849 и /? = 0.831891,

соответственно.

 

Замечание 6.2.3. При использовании метода инструментальных переменных в случае наличия коррелированности некоторых объясняющих переменных с ошибками возникают определенные проблемы:

этот метод может обеспечить только состоятельность получаемых оценок и при определенных условиях асимптотическую нормальность этих оценок, но не обеспечивает несмещенность оценок при небольшом количестве наблюдений;

для применения метода при наличии нескольких эндогенных переменных требуется достаточное количество инструментальных переменных, с помощью которых можно было бы очистить эндогенные объясняющие переменные; найти такие переменные удается далеко не всегда.

Первое обстоятельство означает, что ориентироваться на оценки, полученные методом инструментальных переменных, можно только при достаточно большом количестве имеющихся наблюдений, так что приведенный пример можно рассматривать только как иллюстрацию. Если наблюдений мало, то /F-оценки могут иметь даже большее смещение, чем О/^-оценки.

Второе обстоятельство значительно затрудняет практическое использование метода инструментальных переменных. Из-за этого, например, на практике обычно игнорируется тот факт, что используемые статистические данные содержат ошибки измерений.

Кроме того, исследования показывают, что если выбранные инструментальные переменные являются «слабыми инструментами» (weak instruments), т.е. слабо коррелированы с эндогенными объясняющими переменными, то качество /F-оценок с такими инструментами может быть хуже, чем у О/^-оценок.

Обстоятельное рассмотрение методов оценивания систем одновременных уравнений и проблем, связанных с возможностью идентификации уравнений структурной системы, будет продолжено в третьей части учебника.

 

контрольные вопросы

Какие нежелательные последствия имеет наличие коррелированности между случайными ошибками в правых частях регрессионных уравнений и некоторыми объясняющими переменными?

Как отражается на оценках наименьших квадратов коэффициентов линейной модели наличие пропущенных переменных?

Как отражается на оценках наименьших квадратов коэффициентов линейной модели тот факт, что значения объясняющих переменных, включенных в уравнение регрессии, измерены неточно?

Чем отличается приведенная форма одновременных уравнений от структурной формы и как она получается на основании заданной структурной формы?

Что такое инструментальная переменная, какие на нее накладываются требования? Что дает использование инструментальных переменных?

Как можно получить оценки коэффициентов структурного уравнения методом инструментальных переменных?

В чем состоит двухшаговый метод наименьших квадратов?

 

Задания для семинарских занятий, работы в компьютерном классе и для самостоятельной работы

 

К разделу 1

А. Задания для семинарских занятий и работы в компьютерном классе

Задание 1. Оценка наименьших квадратов

п

^(Хі-хХУі-У)

Проверьте, что Р = 1=1         .

2>-*)2

1=1

Задание 2. Диаграмма рассеяния и коэффициент корреляции Наблюдались следующие пары значений переменных хиу:

(0,1), (1,3), (3,3), (4,1);

(-2, 4), (-1,1), (0,0), (1,1), (2, 4);

(0,1), (1,0), (3,4), (4,3);

(0,3), (1,4), (3,0), (4,1);

(1,1), (2,3), (3,2), (4, 4);

В каждом из вариантов самостоятельно («вручную») постройте диаграмму рассеяния и вычислите выборочный коэффициент корреляции между переменными хиу. Проинтерпретируйте полученные значения этого коэффициента и сопоставьте их с формой облака точек на диаграммах рассеяния. Измените масштаб по одной из переменной и вычислите коэффициент корреляции в новой ситуации. Изменилось ли значение коэффициента корреляции?

 

Задание 3. Прогнозные значения, коэффициент детерминации

Для тех же наблюдений вычислите ЯАГ-оценки коэффициентов линейной модели

зависимости у от х, а также значения TSS, ESS, RSS и R2. Нанесите на диаграмму

рассеяния прогнозные значения переменной>>. Сопоставьте значения R2, г2 , .

Задание 4. Влияние масштабов измерений Докажите, что jB = г'— •

 

Задание 5. Свойства выборочных характеристик

Выведите свойства выборочных средних, выборочных дисперсий и выборочных ковариаций, аналогичные свойствам их теоретических аналогов.

 

Задание 6. Оценки наименьших квадратов в агрегированной модели

Пусть ^ = у{ + у2. Пусть методом наименьших квадратов оцениваются модели:

Уи = аі+Ріхі + Єи> Уи = аі + Ріхі + \%> Уі = а + Рхі + єі9 і=9...9п.

Покажите, что а = ах + аІ9 (3 = Р2.

 

Задание 7. Связь коэффициента детерминации с коэффициентами корреляции

2          2       2 2          2        2 2

Докажите: r~y = R , г^у - гху , так что R = г~у = гху , и, следовательно, можно найти значение R2, не вычисляя «иД

Задание 8. Минимизация суммы квадратов отклонений

Докажите, что пара а, (3 действительно минимизирует сумму квадратов отклонений наблюдаемых значений у от подбираемой прямой.

 

Задание 9. Оценивание прямой и обратной моделей

Для модели у. = а + fixt + єі9 і = 1,4, вычислите оценки коэффициентов и коэффициент детерминации по наблюдениям (1, 1), (2, 3), (3, 2), (4, 4). (Это было сделано ранее.)

Используя результаты этих вычислений, найдите оценки коэффициентов обратной модели хіг = у л- 8у{ + ut.

«Вручную» постройте график, в котором по оси абсцисс откладываются значения xi9 а по оси ординат — значения yi9 yt и значения у*, вычисляемые для значений xt с использованием подобранной обратной модели.

 

Задание 10. Использование пакета Eviews

Возвратитесь к заданию 2 и используйте для анализа тех же данных средства пакета EViews.

Создайте рабочий файл.

Для каждого набора данных:

сгенерируйте ряды значений хиу;

образуйте группу, состоящую из рядов хиу;

постройте диаграмму рассеяния;

найдите коэффициент корреляции между рядами хиу;

оцените модель у. = а + fixt + є{ и получите ряд прогнозных значений у{ (используя Forecast);

создайте группу из рядов х, у и у. Постройте график зависимости у и у от х (диаграмма рассеяния с подобранной прямой). Проверьте, что тот же график получается при использовании scatter with regression в группе, состоящей из рядов х и у;

вычислите коэффициенты обратной модели и на их основе получите значения^*, вычисляемые для значений xt с использованием подобранной обратной модели;

создайте группу из рядов х, у, у и у*;

постройте график зависимости у, у и у* от х. Обратите внимание на раскрытые «ножницы».

Выполните задание двумя способами: используя экранное меню и используя командную строку.

Задание 11. Пакет ЕViews: использование экранного меню и командной строки

Создайте рабочий файл tabl_l с данными об уровнях безработицы среди белого и цветного населения США за период с марта 1968 г. по июль 1969 г., приведенными в табл. 1.1 (разд. 1).

Найдите средние значения, стандартные отклонения и выборочные дисперсии для обеих переменных.

Выполните действия, перечисленные в задании 10.

Постройте диаграмму рассеяния, в которой по оси ординат откладываются значения переменной BEL, а по оси абсцисс — прогнозные значения этой переменной. Вдоль какой прямой вытянуто облако точек? (Для объяснения

результата оцените уравнение BELi = у + 8BELi + ut.)

Постройте ряд остатков, вычислите RSS. Вычислите TSS, ESS, R1.

Убедитесь в том, что R2 = rjy = rly.

Выполните задание двумя способами: используя экранное меню и используя командную строку.

 

Задание 12. Итерационный подбор аппроксимирующей прямой

Используя те же данные, что и в задании 11, произведите итерационный подбор аппроксимирующей прямой. Для этой цели:

перейдите к рядам отклонений от средних и постройте для них диаграмму рассеяния;

посмотрите на построенную диаграмму рассеяния, выберите начальное значение /?0 коэффициента /? и нанесите на диаграмму рассеяния точки, соответствующие модели связи у - а + Р0х. Вычислите RSS0 — сумму квадратов (вертикальных) отклонений точек диаграммы рассеяния от этих точек;

измените немного значение д, получая значение д, которое представляется более подходящим к облаку точек. Повторите проделанное выше при значении д, используя теперь д вместо д, получая при этом значение RSSX. Сравните значение RSSX с RSS0;

если RSSX < RSS0, то выберите новое значение д, двигаясь в том же направлении (в смысле его увеличения или уменьшения), и повторите проделанное выше, заменив д на д. В противном случае выберите значение д, двигаясь в обратном направлении и переходя через значение д;

далее поступайте аналогичным образом до получения удовлетворительного результата.

Выполните задание как с использованием экранного меню, так и с помощью самостоятельно написанной программы, в которой последовательно задаются значения углового коэффициента подбираемой прямой.

 

Задание 13. Оценивание моделей наблюдений по реальным статистическим данным

Оцените модели наблюдений, рассмотренные в примерах 1.3.1 —1.3.5. Данные к этим примерам поместите в рабочие файлы: tabl_2, tabl_7, tabl_8, tabl_9, tabl_10.

Постройте диаграммы рассеяния с подобранными прямыми для номинальных и дефлированных данных.

 

Задание 14. Очистка переменных

Используя пакет EViews и привлекая статистические данные, использованные в примере 1.3.4 (tabl_9)

проанализируйте:

связь между переменными ЕиС (зависимая переменная Е); связь между переменными С и Я (зависимая переменная С);

оцените соответствующие модели наблюдений, вычислите для них коэффициенты детерминации и коэффициенты корреляции между входящими в модель переменными;

произведите очистку переменных от линейного тренда;

оцените модели связи между очищенными переменными, найдите значения коэффициентов детерминации для оцененных моделей и значения коэффициентов корреляции между очищенными переменными;

•           сравните результаты, полученные в моделях до и после очистки переменных.

 

Задание 15. Модель пропорциональной связи

Произведите оценивание моделей наблюдений, соответствующих модели САРМ, описанной в теме 1.3, для статистических данных, содержащихся в файле capm.wfl на сайте: http://www.econ.kuleuven.be/gme/. Создайте рабочий файл camp с этими данными. Вычислите суммы квадратов TSS, ESS, RSS, используя определения этих сумм, введенные для линейной модели связи. Проверьте, выполняется ли для них соотношение TSS = ESS + RSS. Вычислите обычный и нецен-трированный коэффициенты детерминации для оцененной модели.

При работе с объектом Equation в спецификацию модели не включайте константу. Обратите внимание на то, какое значение коэффициента детерминации указывается в протоколе оценивания.

Оцените линейную модель с константой, сравните полученные результаты.

 

Задание 16. Сравнение альтернативных моделей связи с различными объясняемыми переменными

Используя пакет EViews, по данным примера 1.3.1 (файл tabl_7), подберите модель зависимости спроса на куриные яйца от цены, линейную в логарифмах переменных (log-log модель). На основе этой модели постройте прогнозные значения для уровня спроса и вычислите соответствующее значение коэффициента детерминации (найдите TSS по результатам оценивания модели в уровнях). Сравните это значение со значением R2, полученным при оценивании модели, линейной в уровнях переменных.

 

Задание 17. Оценивание нелинейных зависимостей

Повторите исследование, проведенное при рассмотрении темы 1.4 для данных об уровнях безработицы и темпах инфляции в США (данные возьмите из табл. 1.5).

 

Б. Задания для самостоятельной работы

Задание С-1. Применение метода наименьших квадратов

для оценивания параметров модели линейной связи между двумя переменными {вычисления «вручную»)

Ниже приведены результаты 4 наблюдений значений пары переменных X и Y.

X 2 3 4 Г    1    3    2 4

Не прибегая ни к каким вычислительным средствам («вручную»):

постройте диаграмму рассеяния;

вычислите выборочный коэффициент корреляции между переменными XkY;

подберите модель линейной связи между переменными X и У, используя метод наименьших квадратов;

найдите коэффициент детерминации R2, используя 3 способа его вычисления; убедитесь в том, что все 3 способа приводят к одному и тому же результату.

Методические указания. Используя метод наименьших квадратов, оцените коэффициенты а и /? п

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |