Имя материала: Эконометрика.Конспект лекций

Автор: Ангелина Витальевна Яковлева

2. показатели частной корреляции для модели множественной регрессии с тремя и более факторами

В случае модели множественной регрессии с тремя факторами можно рассчитать частные коэффициенты корреляции как первого, так и второго порядка. Выявляется взаимосвязь между результативной переменной и одним из факторов при фиксированных значениях двух других факторов.

Коэффициенты частной корреляции второго порядка для модели множественной регрессии вида:

Уі = А + АХ1і + А Х2і + в3 Х3 i + Єі

строятся так:

Г (yXllХ2Х3 ) = Г (yX JX1X3 ) =

 

 

f2 (ХіХз/Х2 )) X (1 - f2 (ухзІХ2 ))'

Г {yX2l X1 ) ~r (yXJX1 ) X Г (X 2X з/X1 ) . j(1-r2 (Х2Хз/Х1 )) X   (1 -f 2 (УХДХ1 ))'

r (yXJ X1X 2 ) =

 

f (yXJX1 )  -f (yX2l X1 )  X f (X3X2/X1 )

^(1-f 2 (ХзXJXi )) X (1 -f 2 (yXJXl ))

Частные коэффициенты корреляции второго порядка построены через частные коэффициенты корреляции первого порядка.

Частный коэффициент корреляции порядка t может быть построен через частный коэффициент корреляции (t - 1) порядка. Формулы, построенные через указанную взаимосвязь, называются рекуррентными.

В случае модели множественной регрессии, содержащей n факторных признаков, частный коэффициент (n - 1) порядка можно рассчитать по общей формуле: г(yxjx, .., хп)=

'(Ж/*!, Х„-1 )-Г (yXJX1>      Х„-1 ) Х Г (X,XJX1> Х„-1 )

г2(X,XJX1,       X„-1 )) х ^([-г2(yXJX1,       X„-1 ))

Рассмотрим построение частных коэффициентов корреляции через показатель остаточной дисперсии.

Для модели парной линейной регрессии остаточная дисперсия вычисляется как:

 

где у (x1 ) — оценка уравнения парной регрессии с независимым фактором X1. Если в исходное уравнение парной регрессии добавить новый фактор х2, остаточная дисперсия модели регрессии с двумя факторными признаками будет равна величине:

 

,2 (       )     Е(У - У (Х1*2

д (у, *1, *2)=^           

 

где у (х1х2) — оценка уравнения регрессии с двумя независимыми факторами 1 и 2. При любом качестве построенной модели двухфакторной регрессии будет выполняться неравенство: д2 (у, х1 )>д2 (у, х1, х2). Тогда величина

 

д2 (у, *1)

будет означать долю сокращения остаточной дисперсии за счет включения в модель фактора х2. Чем больше эта доля, тем сильнее дополнительный фактор 2 влияет на результативный признак у, на качество модели регрессии в целом, тем, следовательно, сильнее связь между 2 и у при фиксированном значении 1.

Частный коэффициент корреляции между переменными х2 и у при фиксированном значении 1 через остаточную дисперсию

вычисляется:

Подпись: д (y, x1 )—д(y, xv x2) д2 (y, x.)

г {ух Jхх ) =

Для модели множественной регрессии с n факторными признаками частный коэффициент корреляции (n — 1) порядка между результативным признаком у и факторным признаком х1 при фиксированном значении остальных признаков можно рассчитать по формуле:

д2(y, ^ „., xn) — S2(y, xl, x2, .., xn) д2 (y, x2, „., xn) "

Остаточная регрессия результативного признака и коэффициент множественной детерминации связаны отношением:

д2( у) = 1 — R2 (у ).

Если в формуле частного коэффициента корреляции выразить остаточную дисперсию результативного признака через коэффициент множественной детерминации, то для модели множественной регрессии с n факторными признаками частный коэффициент корреляции в общем виде можно определить по формуле:

 

Частные коэффициенты корреляции, вычисленные по рекуррентным формулам, изменяются в пределах [ — 1; +1]. Частные коэффициенты корреляции, вычисленные через остаточную дисперсию или коэффициент множественной детерминации, изменяются в пределах [0; +1].

Частный коэффициент корреляции для модели множественной регрессии показывает степень тесноты связи между результативным признаком и одним из факторных признаков при фиксированном или постоянном значении остальных переменных, входящих в модель.

3. Показатель множественной корреляции. Обычный и скорректированный показатели множественной детерминации

Построение множественного коэффициента корреляции целесообразно только в том случае, когда частные коэффициенты корреляции оказались значимыми и связь между результативным признаком и факторами, включенными в модель, действительно существует. Множественный коэффициент корреляции позволяет оценить общее влияние всех факторных переменных на результативный признак в модели множественной регрессии.

В случае линейной модели множественной регрессии с n факторными признаками коэффициент множественной корреляции рассчитывается через стандартизированные частные коэффициенты регрессии и парные коэффициенты корреляции следующим образом:

R (і, x1,     xn )= j £ 0Гд xr (yxt),

где r(yxi) — парный (не частный) коэффициент корреляции между результативным признаком y и факторным признаком x, i = 1, n.

Коэффициент множественной корреляции изменяется в пределах [0; +1] и поэтому не предназначен для определения напра-в-ления связи между результативным и факторными признаками. Чем ближе множественный коэффициент корреляции к единице, тем сильнее взаимосвязь между зависимой и независимыми переменными, и, наоборот, чем ближе множественный коэффициент корреляции к нулю, тем слабее взаимосвязь между изучаемыми переменными.

Если возвести множественный коэффициент корреляции в квадрат, то получим коэффициент множественной детерминации:

n

R2 (y, хх,     xt )=^вГд xr (yx,)

i=1

Множественный коэффициент детерминации показывает, на сколько процентов построенная модель регрессии объясняет разброс значений зависимой переменной относительно среднего значения, т. е. какая доля общей дисперсии результативного признака объясняется вариацией факторных модельных признаков. Множественный коэффициент детерминации можно назвать количественной характеристикой, объясненной построенным уравнением регрессии дисперсии результативного признака. Чем больше значение данного показателя, тем лучше уравнение регрессии описывает выявленную взаимосвязь.

Для множественного коэффициента детерминации всегда справедливо неравенство:

R2 (y ^  -, xn—1 )  =S R2        xl,      xn )

т. е. включение в линейную регрессионную модель нового фак-

торного признака xn не снижает значения коэффициента множественной детерминации.

Коэффициент множественной детерминации можно рассчитать на основании теоремы о разложении сумм квадратов:

„2 /               ESS

Я2(y, x,     x ) = 1        ,

 

где ESS (Error Sum Square) — сумма квадратов остатков множественного уравнения регрессии с n переменными:

 

E(y — y (y,

i=1

 

TSS (Total Sum Square) — общая сумма квадратов множественного уравнения регрессии:

 

i=1

 

Влияние на качество модели дополнительно включенного в регрессионное уравнение фактора не всегда можно выявить с помощью обычного множественного коэффициента детерминации. Поэтому рассчитывают также и скорректированный коэффициент множественной детерминации, в котором учитывается количество факторных признаков в модели:

ESS

 

(n — 1)

где n — количество наблюдений в выборке;

h — число параметров в регрессионной модели.

При большом объеме выборки обычный и скорректированный (adjusted) коэффициенты множественной детерминации отличаться практически не будут.

После расчета всех частных коэффициентов корреляции множественного уравнения регрессии необходимо проверить их значимость.

Выдвигается гипотеза H0 о незначимости частных коэффициентов корреляции.

Альтернативной гипотезой является утверждение о значимости частного коэффициента корреляции: H0 / r (y xt/х1,    Xn1) ^ 0.

Гипотеза о значимости частных коэффициентов корреляции проверяется с помощью t — критерия Стьюдента. Наблюдаемое значение t-критерия tHa6/i вычисляется по формуле:

=   rОх/^ -, Х„-і) х г—^ 1- r.. ., хп-і)

где п — объем выборочной совокупности (число наблюдений); l — число оцениваемых по выборке параметров.

Критическое значение t-критерия tKpum находится по таблице распределения Стьюдента с уровнем значимости а/2 и степенью свободы (п - l - 1) / tKpum(a/2; п - l - 1).

Если модуль наблюдаемого значения t-критерия больше критического значения t-критерия, т. е. Ha6j > tKpum, то с вероятностью а основную гипотезу о незначимости частного коэффициента корреляции отвергают, т. е. между изучаемыми признаками xi и y существует корреляционная связь при фиксированных значениях остальных переменных, участвующих в модели.

Если модуль наблюдаемого значения t-критерия меньше или равен критическому значению t-критерия, т. е. Ha6j < tKpum,TO основная гипотеза i/0 о незначимости частного коэффициента корреляции принимается, т. е. между изучаемыми признаками xi и y при фиксированных значениях остальных переменных, участвующих в модели, корреляционная связь отсутствует и включение данно-

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 |