Имя материала: Эконометрика для начинающих (Дополнительные главы)

Автор: Носко Владимир Петрович

3.4. коэффициенты детерминации, разложение полной суммы квадратов

При анализе панельных данных возникают некоторые проблемы с определением коэффициента детерминации r2, так что во многих руководствах по эконометрике и монографиях, специально посвященных анализу панельных данных, вообще не упоминается о коэффициенте детерминации. В то же время в некоторых пакетах статистического анализа предусмотрено вычисление коэффициентов детерминации и для панельных данных.

Проблема с определением коэффициента детерминации в случае панельных данных связана с неопределенностью в отношении того, что считать полной суммой квадратов, подлежащей разложению на объясненную регрессией и остаточную суммы квадратов. Здесь мы имеем соотношение

1       NT       1       NT 1 N

SS (уг* - у )2 =^г SS (уг* - уг )2 + ~ S (уг - у)),

nt                  * nt         * n

=1*=1           =1*=1 =1

и в качестве полной суммы квадратов может использоваться каждая из входящих в это выражение трех сумм квадратов. Соответствующие этим полным суммам регрессионные модели объясняют:

отклонения наблюдаемых значений уй от их среднего по всем NT наблюдениям;

отклонения наблюдаемых значений у й  в группах от их средних по группе;

отклонения  средних  по  группам  от  среднего  по всем NT наблюдениям.

 

Если мы используем оценку "пул", то она получается в результате применения метода наименьших квадратов к уравнению

yt = а +px,t + ut, i =    N, t = 1,...,T .

При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными уit и

угt =а + в OLS Xit,

где eoLS - OLS-оценка коэффициента в в модели пула. Об этом

коэффициенте детерминации говорят как о " R2 -полном" (R2-overall),

RLraii = corr2 (yit,a + eoLS xit )= corr2 (yit,Pols xu). Если мы используем оценку "между", то она получается в результате применения метода наименьших квадратов к уравнению

y =М + вХ, +V , i =N . При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными уй и

 

где   вь   -  "между"-оценка  для  коэффициента   в .   Об этом

коэффициенте детерминации говорят как о " R2 -между" (R2-between),

RLween = СОГГ2 ifi + вЬ Xi , yi )= СОГГ2 (Pb Xi , yi ).

Если мы используем оценку "внутри", то она получается в результате применения метода наименьших квадратов к уравнению

Уш ~ Уг = Р{ХШ - Х, )+{ХШ - U, ), І =     N t = 1,K,T ■

В правой части последнего уравнению отсутствует константа. А при OLS-оценивании уравнений вида zг = pw г + vг коэффициент детерминации в общем случае не равен квадрату выборочного коэффициента корреляции между переменными zi = p wг и zг ■ Однако если переменные zг и wг центрированы, так что z = w = 0 , то такое равенство обеспечивается. В нашем случае переменные Уй - У г и xit - xi центрированы, так что коэффициент детерминации, получаемый при оценивании уравнения в отклонениях от средних по группам равен квадрату (выборочного) коэффициента корреляции между переменными у it = yit - у и

Угі =PCV (X,t - Хг К г=       ^ t = 1,K,T ,

где   pCV   - "внутри"-оценка для коэффициента  p ■  Об этом

коэффициенте детерминации говорят как о    " R2 -внутри" (R2-

wi thin),

Rw,th,n = СОГГ 2 [pCV іХгі - X г ), y,t - y, )^

Каждый из этих трех вариантов R2 является обычным коэффициентом детерминации в соответствующей модели регрессии. В то же время при анализе различных моделей панельных данных часто сообщаются вычисленные значения всех трех вариантов R2 , несмотря на то, что в модели с фиксированными эффектами используется оценка pCV, в модели со случайными

эффектами - оценка J3GLS , а в модели пула - оценка j3OLS ■

Более точно, при анализе панельных данных принято сообщать

под названиями   Rw,h,n , Rbeween , RLrall значения Rlith,n = СОГГ 2 (y,t - Уг , в (Хгі - X, )), RLtween = СОГГ 2       , в Хг ), Rlerall = СОГГ 2        , в Хгt ),

вне зависимости от того, каким образом была получена оценка в . Если в является p -мерным вектором, то, соответственно,

Rlithin = corr 2 ІУи - Уг , {Xit - xi У в), RLtween = СОГГ 2 (Уг , XI в), RleraU = СОГГ 2 (yu , XTt в).

При этом приводимое значение ІЇ^шп является коэффициентом детерминации в обычном смысле, если в = вмыып; приводимое значение Rbetween является коэффициентом детерминации в обычном смысле, если в = вышт '> приводимое значение ROvemu является коэффициентом детерминации в обычном смысле, если в = в oLS .

 

П р и м е р (продолжение)

Приведем результаты оценивания в пакете Stata8 моделей с фиксированными и случайными эффектами для данных о трех предприятиях. При этом заметим, что в рамках этого пакета приняты обозначения, отличающиеся от используемых нами: индивидуальные эффекты обозначаются как ui , а случайные ошибки - как ett. Чтобы избежать путаницы, в приводимые далее протоколы оценивания внесены соответствующие изменения.

 

Fixed-effects (within) regression

R-sq:            

within = 0.9478

between = 0.8567

overall = 0.9209

Проверка значимости регрессии в целом: F(1,26) = 472.26, Prob > F = 0.0000

Оцененное значение коэффициента индивидуальным эффектом и переменной x

корреляции

между

sigma_alfa

1.480319

sigma_u

1.745136

rho

.4184474 (fraction of variance due to a i)

 

F test that all alfa i=0:

F(2, 26) = 6.81, Prob > F = 0.0042

линейными

Последний критерий соответствует

постоянная

гипотезе с двумя

ограничениями:   поскольку      в   модель включена составляющая,  то  одно   линейное   ограничение накладывается заранее как идентифицирующее и не подлежащее проверке.

 

Random-effects GLS regression

R-sq:            

within=0.9478 between=0.8567

u i ~ Gaussian

overall= 0.9209

У

Coef.

Std. Err.

z

P>z

x

1.058959

.0586557

18.05

0.000

cons

-.7474755

.955953

-0.78

0.434

В то же время, если в рамках модели со случайными эффектами применить критерий Бройша-Пагана для проверки гипотезы об отсутствии таковых эффектов, т.е. гипотезы H0 :а2а = 0, то полученное значение статистики критерия равно 8.47. Этому значению соответствует рассчитанное по асимптотическому распределению хи-квадрат с 1 степенью свободы і5-значение 0.0036. Но это говорит против гипотезы H0. И опять это можно объяснить малым количеством наблюдений - ведь распределение хи-квадрат здесь только асимптотическое.

В пакете Stata8 есть возможность оценить модель со случайными эффектами, не прибегая к GLS-оцениванию, а используя метод максимального правдоподобия. Это дает следующие результаты:

Random-effects ML regression Random effects: a_i ~ Gaussian Log likelihood = -61.09837

 

Likelihood-ratio test of sigma alfa=0:           

chibar2(01) = 4.70,   Prob>=chibar2 = 0.015

По этому критерию гипотеза H0 :о2а = 0 отвергается.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 |