Имя материала: Эконометрика.Конспект лекций

Автор: Ангелина Витальевна Яковлева

Лекция № 5. определение качества модели регрессии. проверка гипотез о значимости коэффициентов регрессии, корреляции и уравнения парной регрессии

 

Качество модели регрессии — адекватность построенной модели исходным (наблюдаемым) данным.

Качество парной линейной регрессии определяется с помощью парного линейного коэффициента корреляции:

xy — xy     Cov (x, y)

*   G (x )G (y)   G (x)G( y)'

где G(x) — среднеквадратическое отклонение независимого признака;

G(y) — среднеквадратическое отклонение зависимого признака. Коэффициент парной линейной корреляции можно рассчитать через МНК-оценку параметра уравнения регрессии в:

r =~0^. yx      G (y)

Парный коэффициент корреляции показывает тесноту связи между изучаемыми признаками. Он изменяется в пределах [ — 1; + 1]. Если ryx Є [0; + 1] то связь между признаками прямая. Если ryx Є [ — 1; 0], то связь между признаками обратная. Если ryx= 0, то связь между признаками отсутствует. Если ryx = 1 или C = —1,то связь между изучаемыми признаками является функциональной, т. е. характеризуется полным соответствием между x и y. Чем ближе xy к 1, тем более тесной считается связь между изучаемыми признаками.

Парный коэффициент корреляции определяется для количественных переменных.

Если парный линейный коэффициент корреляции ryx возвести в квадрат, то получим коэффициент детерминации r2yx. Данный коэффициент показывает, на сколько процентов вариация результативного признака объясняется вариацией факторного признака в общем объеме вариации.

Чтобы оценить качество линейной множественной модели регрессии, необходимо воспользоваться теоремой о разложении дисперсий.

Общая дисперсия зависимой переменной может быть разложена на две составляющие — объясненную и необъясненную построенным уравнением регрессии дисперсии:

G 2( у) = о у) + д у),

n

где       V(у _ у )2        — объясненная с помощью по-

2/"„■>_ i=1

строенного уравнения регрессии дисперсия переменной у;

n

— необъясненная или ос- Vе' таточная дисперсия пере- ^2 (у) = ;=1 менной у. n

С помощью данной теоремы можно рассчитать множественный коэффициент корреляции между результативным признаком у и несколькими факторными признаками x

 

у   G 2( у)

Множественный коэффициент корреляции показывает тесноту связи между результативным и факторными признаками. Трактовка его значений аналогична трактовке значений парного линейного коэффициента корреляции.

Квадрат множественного линейного коэффициента корреляции называется теоретическим коэффициентом детерминации:

 

у   G 2( у)

Этот коэффициент показывает, на сколько процентов вариация результативного признака объясняется вариацией факторных признаков x. Величина 1 _ Ну2 показывает ту долю вариации результативного признака, которую модель регрессии учесть не смогла.

Среднеквадратическая ошибка (Mean square error — MSE) уравнения регрессии схожа по построению с показателем сред-неквадратического отклонения:

Подпись: n

i=1
MSE

n _h

где h — число параметров уравнения регрессии.

Показатель средней ошибки аппроксимации рассчитывается по формуле:

Если MSEокажется меньше о(у), то построенную модель можно считать качественной. Показатель среднеквадратического отклонения наблюдаемых значений зависимой переменной от модельных значений, рассчитанных по уравнению регрессии, определяется как:

Максимально допустимым значением данного показателя считается 12—15\%. Если средняя ошибка аппроксимации составляет менее 6—7\%, то качество модели считается хорошим.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 |