Имя материала: Эконометрика Книга первая Часть 1

Автор: Носко Владимир Петрович

Тема 3.2 использование f-статистики для редукции исходной эконометрической модели. проверка односторонних гипотез

 

Для рассмотренной выше F-статистики, используемой для проверки общей линейной гипотезы с q линейными ограничениями на коэффициенты, имеется и более простое выражение:

FJRSSHQ-RSS)/q RSS/(n-p) '

где RSS — остаточная сумма квадратов в модели наблюдений

М:у, =вххп+... + врхір+єі9   / = 1,...,л

(модель без ограничений — unrestricted model), a RSSH — остаточная сумма квадратов при оценивании модели, соответствующей гипотезе Я0, т.е. учитывающей ограничения Ав- с.

Для установления возможности такого представления F-статистики необходимо прежде всего получить явное выражение для оценки наименьших квадратов в модели с указанными ограничениями — будем снабжать эту

оценку подстрочным индексом #0, так что вщ — оценка наименьших

квадратов вектора в в модели с линейными ограничениями, заданными гипотезой Н0 (restricted least squared estimate). Такое выражение можно получить, минимизируя сумму квадратов

 

по всем наборам в' = (#,*,..., в*р)Т при линейном ограничении а в* = с, используя метод множителей Лагранжа. В результате получается выражение, которое можно записать в виде:

0Но=в- (хтху1 Ат(а(ХтХ)'1 Ат)а9-с) =

= {хтх)~х хту - (хТХУХ ат (а(ХтХ)~1 АтУ (а{Хт х)~1 хт у -с)= = \^хТХУххт -{хТХУХ ат(а(ХтХУ1 АтУ а(хТХУ1 хт^у +

+(хтху1аг(а(хтху1атУс.

Отсюда, во-первых, вытекает, что если выполнены стандартные предположения без требования нормальности ошибок, т.е. выполнены условия Гаусса — Маркова, и гипотеза Н0 :Ав=с верна, то

Е0Но) = Еф) - (ХТХУ1 аТ(Л(ХТХГ АтУ (аЕ(0) -с)=

= 0- (ХТХУ1 ат (а(ХтХ)~ 1 Ат)а9-с) = 0,

так что 0Но — несмещенная оценка вектора 0. Во-вторых, эта оценка имеет форму:

 

где В — неслучайная матрица; d — неслучайный вектор.

Оценка 6щ является наилучшей несмещенной оценкой такого вида, в

том смысле, что если 6 — какая-то другая несмещенная оценка вектора 69 имеющая вид 6 - By + J, то матрица, равная разности Cov(6) - Cov(0Ho), является неотрицательно определенной.

Поскольку оценка наименьших квадратов в модели без ограничений является несмещенной и имеет вид в = (ХтХухХту = Су, то в принадлежит классу несмещенных оценок вида в - By + d, в котором оценка вщ является наилучшей. Следовательно, матрица Cov(0) - Соу(вщ) является неотрицательно

определенной, и для у-х компонент векторов оценок в и вщ выполняется соотношение:

D(0j)>D(0HoJ),   j = l,...,p. Остаточная сумма квадратов в модели с ограничениями равна:

RSSHo =

У-Хвнй =(У-^щ)т(у-Х0Но),

тогда как остаточная сумма квадратов в модели без ограничений равна:

RSS = Можно показать, что

« 2

у-Х0 ={у-Х0)т{у-Х0).

 

Подпись: НоRSSHo -RSS =

У-Щ

у-Х0 =Х(0-0Но)

 

Есшу = Хв и ущ=Хвщ9 то последнее равенство записывается в виде:

I     -   І2   і     -і2   I-   - I2

у-ун0 =у-у +У-Ун0 >

и это означает просто, что векторы у -у и у ~Ун0 взаимно ортогональны.

Замечание 3.2.1. Можно было ожидать, что аналогично последнему соотношению и соотношению 2 = у2 +|.у-.у|2 справедливо и соотношение    2 =[р#0| +|>;~>,Яо| • Однако если с Ф О, то это не так.

I - I2 Ун

При этом отношение -—y~ может принимать значения, большие 1.

н

В этом можно убедиться (задание для самостоятельной работы), рассматривая гипотезу Я0 : вх + в2 = 1 в линейной модели наблюдений^ = Х6+ є с /? = 2, л = 3,

 

 

(2)

 

Го

21

У =

2

, х =

і

3

 

,v

 

 

 

Итак,

RSSHo - RSS = X0 - вНо )2=0-ёНо)ТХТХ0- вНо) =

= [(*ГЛТ' ат (а(ХтХ)~1 Ат )'1 (а в - с)J Т х

х Хтх[(ХГХу1 Аг(а(ХтХУ 1 ат y (а в - с)J =

= (А0- с)т(а(ХтХ)~1 АтУ а(ХТХУ1 ХГХ(ХТХУ1 х х ат (а(ХгХУ1 Ат )'а в-с) = (Ав- с)т (а(ХтХУ1 Ат )~а в - с), что приводит к соотношению

FJRSSHo-RSS)/q RSS/(n-p)

В пакетах программ эконометрического анализа среди прочих результатов оценивания нормальной линейной модели множественной регрессии

УІ=віхп+... + ЄрхІр+єі9   і = 1,..., и,

с хп = 1 приводятся значения .Р-статистики, предназначенной для проверки гипотезы

Я0: в2 =в3=... = вр=0

(гипотеза значимости регрессии в целом — hypothesis of overall significance of a regression, hypothesis that all of the slope coefficients, excluding the constant, or intercept in a regression are zero).

Это частный случай общей линейной гипотезы, так что соответствующий статистический критерий основывается на F-статистике

FJRSSHQ-RSS)/(p-l) RSS/(n-p)

где RSS — остаточная сумма квадратов, получаемая при оценивании полной модели (с р объясняющими переменными, включая тождественную единицу);

RSSHq— остаточная сумма квадратов, получаемая при оценивании модели с наложенными гипотезой Н0 ограничениями на параметры.

Но последняя (редуцированная) модель здесь имеет вид

Уі=0х+єі9   / = 1,...,и, и применение к ней метода наименьших квадратов приводит к оценке

 

так что

 

/=1 /=1

Следовательно,

р = (TSS - RSS)/(p -1) = ESS/jp ~ 1) RSS/(n-p) RSS/(n-p)'

В некоторых пакетах статистического анализа (например, в Excel) в распечатках результатов приводятся значения числителя и знаменателя этой статистики (в графе «Средние квадраты» — mean squares).

Если єІ9єп ~ lid. N(0, <т2), то указанная F-статистика, рассматриваемая как случайная величина, имеет при гипотезе Н0 (т.е. когда действительно в2 = ... = вр - 0) распределение F(p - 1, п - р т.е. F-распределение Фишера с (р - 1) и (п -р) степенями свободы.

Чем больше отношение ESS/RSS, тем больше есть оснований говорить о том, что совокупность переменных^, ...,Хр действительно помогает в объяснении изменчивости объясняемой переменной Y.

В соответствии с этим гипотеза

Я0: в2 = въ =... = вр = О

отвергается при «слишком больших» значениях F-статистики, скорее, указывающих на невыполнение этой гипотезы. Соответствующее пороговое значение определяется как квантиль уровня (1-а) распределения F(p - 1, п - р), обозначаемая символом Fx_a(p -,п-р).

Итак, гипотеза Н0 отвергается, если выполняется неравенство

_,   ESS/ip-X)   _   .    , ч

 

При этом вероятность ошибочного отвержения гипотезы Я0, когда она

верна (ошибка 1-го рода), равна а.

Статистические пакеты, выполняющие регрессионный анализ, приводят помимо вычисленного значения F указанной F-статистики и соответствующее ему Р-значение (P-value, observed level of significance), т.е. вероятность

Р-значение = P{F(p -1, n-p)> F].

Правило отвержения гипотезы Я0 при превышении F-статистикой порогового уровня Fx_a(p - 1, п -р) соответствует отвержению этой гипотезы при выполнении неравенства

Р-значение < а.

В частности, в рассмотренном выше примере с импортом товаров и услуг во Францию вычисленное (наблюдаемое) значение F-статистики очень велико: F= 97.75, в то время как критическое (пороговое) значение F095(2, 9) = 4.26.

Соответственно Р-значение крайне мало — в распечатке результатов приведено значение 0.000000. Значит, здесь есть весьма убедительные основания отвергнуть совместную гипотезу #0 : в2 = 03 = 0, хотя каждая из частных гипотез

Н02:в2=0, Н03:в3=0,

рассматриваемая сама по себе, в отрыве от второй, не отвергается.

Подобное положение встречается не так уж и редко и связано с проблемой мультиколлинеарности данных. Определенное внимание этой проблеме уделим при рассмотрении темы 3.3.

Для рассмотренных выше примеров результаты использования F-статис-тики таковы.

 

ПРИМЕР 3.2.1

Анализ данных об уровнях безработицы среди белого и цветного населения США приводит к следующим результатам:

R2 = 0.212,   F = 4.0446,   Р-значение = 0.0626,

так что при выборе а = 0.05 гипотеза Н0 не отвергается, а при выборе а = 0.10 отвергается. ■

ПРИМЕР 3.2.2

Анализ зависимости спроса на куриные яйца от их цены приводит к следующим результатам:

R2 = 0.513,   F= 13.7241,   Р-значение =0.0026,

так что гипотеза Н0 отвергается, а регрессия признается статистически значимой. ■

 

ПРИМЕР 3.2.3

При анализе зависимости производства электроэнергии в США от мирового рекорда по прыжкам в высоту с шестом получены следующие результаты:

R2 = 0.900,   F = 71.96,   Р-значение =0.0000, регрессия признается статистически значимой. ■

 

ПРИМЕР 3.2.4

Анализ потребления свинины в США в зависимости от оптовых цен приводит к следующим результатам:

R2 = 0.054,   F= 0.6915,   Р-значение =0.4219,

так что гипотеза Я0 не отвергается даже при выборе а- 0.10.И

 

Отметим, наконец, еще одно обстоятельство. Во всех 4 рассмотренных примерах регрессионного анализа модели простой (парной) линейной регрессии (р = 2) вычисленные Р-значения F-статистик совпадают с Р-значениями ^-статистик, используемых для проверки гипотезы 02 = 0. Объяснение такого совпадения будет дано чуть позже.

 

ПРИМЕР 3.2.5

В табл. 3.9 приведены данные по следующим макроэкономическим показателям США:

DPI — годовой совокупный располагаемый личный доход;

С    — годовые совокупные потребительские расходы;

А    — финансовые активы населения на начало календарного года.

Рассмотрим модель наблюдений:

Мг : С, =   + 02DPIt +d3At+ 6ADPIt_x + єі9   / = 1,...,11,

где индексу t соответствует (1965 + 0-й год. Это модель с 4 объясняющими переменными:

X,=l,  X2=DPI,  ХЪ=А, XA=DPI{-),

где DPI(-) — переменная, значения которой запаздывают на одну единицу времени относительно значений переменной DPI, DPI0 = 1367.4.

Оценивание этой модели дает следующие результаты: §2 = 0.904,     Р-значение = 0.0028; <93 = -0.029,   Р-значение = 0.8387; 04 = -0.024,   Р-значение = 0.9337;

 

RSS = 2095.3,   TSS = 268 835,   R2 =1        = 0.9922.

TSS

F-статистика критерия проверки значимости регрессии в целом: F = 297.^04,   Р-значение = 0.0000.

Регрессия имеет очень высокую статистическую значимость. Вместе с тем оценки каждого коэффициента при двух последних переменных статистически незначимы, так что, в частности, не следует придавать особого значения отрицательности оценок этих коэффициентов.

Используя ^-критерий, можно попробовать удалить из модели одну из двух последних переменных и, если оставшиеся переменные окажутся значимыми, остановиться на модели с 3 объясняющими переменными. Если же и в новой модели окажутся статистически незначимые переменные — произвести еще одну редукцию модели.

Рассмотрим в связи с этим модель:

М2 : Ct=0l+e2DPIt+e3At+ei9   / = 1 11,

с удаленной переменной DPI(-l). Для нее получим:

в2 = 0.893,    Р-значение = 0.0001;

<93 = -0.039, Р-значение = 0.6486; Ш = 2098.31,  R2 = 0.9922. F-статистика критерия проверки значимости регрессии в этой модели

F = 508.47,   Р-значение = 0.0000.

Поскольку здесь остается статистически незначимой оценка коэффициента при переменной Ап можно произвести дальнейшую редукцию, перейдя к модели

М3 :Ct=ex+e2DPIt+€i9   / = 1,...,11.

Для этой модели

в2 = 0.843,    Р-значение = 0.0000; RSS = 2143.57,   R2 = 0.9920. F-статистика критерия проверки значимости регрессии в этой модели F= 1119.7,   Р-значение = 0.0000,

и эту модель в данном контексте можно принять за окончательную.

Вместе с тем, обнаружив при анализе модели Mj (посредством применения ^-критериев) статистическую незначимость оценок коэффициентов при двух последних переменных, можно попробовать выяснить возможность одновременного исключения из этой модели указанных объясняющих переменных, используя соответствующий Р-критерий.

Исключение двух последних переменных из модели Ых соответствует гипотезе

Н0: въ =#4 =0,

при которой модель Mj редуцируется сразу к модели М3. Критерий проверки гипотезы Н0 основывается на статистике

г (RSSHo-RSS)/q RSS/(n-p) '

где RSS — остаточная сумма квадратов в модели М,; RSSH— остаточная сумма квадратов в модели М3;

q = 2 — количество зануляемых параметров; «-^=11-4 = 7.

Для наших данных получаем

р = (2143.57 -2095.3)/2 ^0Qg

2095.3/7          ' '

это значение следует сравнить с критическим F095 (2, 7) = 4.74. Поскольку F < F095(2, 7), не отвергаем гипотезу Я0 : в3 = вА = 0 и можем сразу перейти от модели М! кМ3.1

 

Замечание 3.2.2. В рассмотренном примере мы действовали двумя способами:

дважды использовали F-критерии (эквивалентные ^-критерию), сначала не отвергнув гипотезу Я0 : вА - 0 в рамках модели Мх, а затем не отвергнув гипотезу Я0 : въ = 0 в рамках модели М2;

однократно использовали F-критерий, не отвергнув гипотезу Я0 : въ = в4 = 0 в рамках модели Мх.

Выводы при этих двух альтернативных подходах оказались одинаковыми. Однако в общем случае из выбора модели М3 в подобной последовательной процедуре, вообще говоря, не следует, что такой же выбор будет обязательно сделан и при применении F-критерия, сравнивающего первую и последнюю модели1. Заметим в связи с этим, что вероятность ошибочного отвержения гипотезы Н0 : въ = вА = 0 в результате применения последовательной процедуры тестирования с уровнями значимости а не равна а. В рамках рассмотренной процедуры приходится, по крайней мере, сначала проверять гипотезу Нх : в4 = 0 в рамках модели Мх, а затем, если она не отвергается, проверять гипотезу Н2 : в3 = 0 в рамках модели М2. Пусть каждая из этих гипотез в отдельности проверяется на уровне значимости а. Тогда:

Р {ошибочно отвергается Н0} =

= Р {ошибочно отвергается хотя бы одна из гипотез НХ,Н2}> а (происходит накопление вероятности ошибки первого рода),

Р {ошибочно отвергается Я0} =

= Р {ошибочно отвергается хотя бы одна из гипотез НХ,Н2) < < Р {ошибочно отвергается Нх} + Р {ошибочно отвергается Я2} = = а + а-2а.

 

Вопрос о сравнении получаемых альтернативных моделей с точки зрения выбора среди них «наилучшей» модели обсудим в теме 3.3.

Следовательно, если для такой последовательной процедуры зададим результирующий уровень значимости а*, то можем обеспе-

а* ^

чить его, положив а - —. (Соответственно если последовательная процедура проверок предполагает наличие К шагов, то уровень зна-

ос

чимости яг* обеспечивается, если положить а- —.) Например,

К

если а* = 0.05, то в нашей потенциально двухшаговой процедуре достаточно взять а= 0.025. Это гарантирует вероятность ошибочного отвержения гипотезы Н0 в пределах от 0.025 до 0.05. Реальная вероятность ошибочного отвержения гипотезы Н0 может быть ближе к нижнему пределу, так что указанная процедура оказывается консервативной: гипотеза Н0 отвергается при а = 0.025 с вероятностью меньшей, чем заданный уровень значимости 0.05 («более редко»).

Остановимся отдельно на ситуации, когда q = 1, но линейная гипотеза затрагивает более одного коэффициента, например, когда

Н q : в2 + $з = 1. Мы уже знаем представление

FJRSSHo-RSS)/g = (Ав-с)Т[А (Хт Х)~х Ат уАв - с) RSS/(n-p) qS2 Пусть линейная гипотеза имеет вид Я0 : AQ- с, где А = (ап,     аХр), т.е.

q = 1. Тогда {АО - с) и [А(ХТХ)~1АТ] — скалярные величины, поэтому выражение для F-статистики можно записать в виде:

(Ав-с)2

F =

S2[A (ХТХУ1АТ]'

Иначе говоря, в рассматриваемом случае F-статистика равна квадрату статистики:

,=       (АО-с)

S[A (XTXyxATf2 "

Последняя же имеет при гипотезе Н0 : АО - с, q = I (и при выполнении стандартных предположений нормальной линейной модели), ^-распределение Стьюдента с(п-р) степенями свободы.

Таким образом, в случае q - 1 для проверки линейных гипотез можно наряду с F-критерием использовать ^-критерий, основанный на приведенной ^-статистике. Это обстоятельство оказывается важным в ситуациях, когда приходится иметь дело с односторонними гипотезами. Об этом будет сказано в примере 3.2.7.

Теперь вернемся к наблюдавшимся совпадениям Р-значений при проверке гипотезы значимости регрессии в модели парной регрессии. Там как раз 9=1, так что если наблюдается некоторое значение Ґ Г-статистики, используемой для проверки гипотезы Р = 0, и этому значению соответствует Р-зна-чение Р*, вычисленное по распределению Стьюдента с (п - 2) степенями свободы, то при этом будет наблюдаться значение F = Ґ2 F-статистики, используемой для проверки гипотезы значимости регрессии, и вычисленное для него по распределению      п - 2) Р-значение совпадает с Р*.

 

Проверка односторонних гипотез о значениях коэффициентов: односторонние критерии

Вспомним пример с потреблением текстиля. Мы подобрали линейную модель в десятичных логарифмах (с постоянными эластичностями)1

lgr = 1.3739 - 0.8289 lgP +1.1432 lgDPI,

где Т   — расходы на личное потребление текстиля; Р   — относительная цена текстиля; DPI — располагаемый доход.

В рамках этой модели представляют, в частности, интерес гипотезы Щ : в2 = -1 и #0: въ = 1 о единичной эластичности расходов на потребление текстиля по доходу и по цене.

Построить критерии с уровнем значимости а для проверки этих гипотез можно по той же схеме, по которой строятся критерии проверки гипотез Я0: 6j = 0. Только теперь для проверки гипотезы Я0: вг = -1 следует использовать ґ-статистику

4-н)_ 4+1

 

а для проверки гипотезы Н0: въ = 1 — ^-статистику

0,-1

Каждая из этих статистик в случае справедливости соответствующей нулевой гипотезы (и, конечно, при выполнении стандартных предположений о модели) имеет распределение t(n-p) = t(l4). При использовании обычного уровня значимости а = 0.05 нулевая гипотеза отвергается, если значение ґ-статистики превышает по абсолютной величине критическое значе-

 

Здесь оставляем у оценок 4 десятичных знака, а не 3 (как ранее).

ние t <Д14) = t0975 (14) = 2.145 . Если нулевая гипотеза верна, то, исполь-

2

зуя это правило, можно ошибочно отвергнуть ее с вероятностью 0.05, допустив ошибку 1-го рода. В нашем примере:

4+1   -0.8289 + 1   АПАГк „ЛЛС

-±         =          = 4.740 > 2.145,

S* 0.0361

^I=11432-l=091g<2145

s, 0.1560

Таким образом, отклонение значения 02 от гипотетического значения в2 = -1 статистически значимо — гипотеза Я0 : в2 = -1 отвергается. В то же время отклонение значения 03 от гипотетического значения 0Ъ = 1 не является статистически значимым, и гипотеза Я0 : 03 = 1 не отвергается.

 

J Замечание 3.2.3. Как видим, важны не только абсолютные значения отклонений оценок 0. от гипотетических значений параметров 0J9 но

и точности оценок 0.9 измеряемые их дисперсиями D(0j) и оцениваемые величинами s§.. Действительно, абсолютные величины отклонений в рассмотренном примере равны:

|-0.8289+ 1| = 0.1711   и   11.1432- 1| = 0.1432 соответственно, т.е. отличаются не очень существенно. Однако s§2 примерно в 4.3 раза меньше, чем s§ 9 yl именно такое большое отличие s§2 от s#3 и приводит, в конечном счете, к противоположным решениям в отношении гипотез Н0 : 02 = -1 и Н0 : 03 = 1.

 

Итак, на основании построенной процедуры гипотеза Н0 : 02 = -1 отвергается. А что же тогда принимается?

Формально альтернативой для Я0 : 02 = -1 в построенном критерии является гипотеза Н0 : 02Ф-9 поскольку критическое множество содержит в равной степени как большие положительные, так и большие (по абсолютной

величине) отрицательные значения ^-статистики —       . В то же время значе-

 

0+1

ние —       = 4.740, соответствующее отклонению 02 - (-1) = 0.1711, скорее,

 

говорит в пользу того, что в действительности 02>-.

В связи с этим естественным представляется более определенный выбор альтернативной гипотезы, а именно сопоставление нулевой гипотезе Я0 : в2 = -1 односторонней альтернативы НА : в2 > -1 (односторонняя альтернатива — в отличие от двусторонней альтернативы Я0 : в2 Ф -1). При такой постановке задачи отвержение нулевой гипотезы Я0 : в2 = -1 в пользу альтернативы НА : в2 > -1 производится только при больших положительных отклонениях в2 - (-1), т.е. при больших положительных значениях /-статистики. Если к последним отнесем значения, превышающие /,_а(14) = /095(14) = 1.761, получим статистический критерий, у которого ошибка 1-го рода (уровень значимости) равна 0.05. Его критическое множество определяется соотноше-

0 + 1

нием —— > 1.761; справа теперь — значение 1.761, а не 2.145, как было при

 

0 +1

двусторонней альтернативе. Поскольку у нас —      = 4.740, отвергаем гипо-

 

тезу Я0 : в2 = -1 в пользу гипотезы НА : в2>-.

Построим аналогичную процедуру для параметра в2. А именно построим критерий уровня 0.05 для проверки гипотезы Я0 : въ - 1 против односторонней альтернативы Я0 : въ > 1. Критическое множество такого критерия должно состоять из значений /-статистики, превышающих f0>95(14) = 1.761. У нас

0 — 1

значение —          = 0.918 < 1.761 опять меньше порогового, так что гипотеза

\%

Я0 : #з = 1 не отвергается в пользу Я0 : въ > 1.

Обратим внимание на то, что при рассмотрении пары конкурирующих гипотез

Н0:в3 = 1, НА:в3>1

в гипотезу Я0 выделяется только одно частное значение въ = 1, хотя, по существу, проблема состоит, скорее, в выборе между гипотезами

ЯО:О<03<1, НЛ:въ>.

Последняя ситуация коренным образом отличается от предыдущей: Я0 оказывается сложной гипотезой (composite hypothesis), т.е. гипотезой, допускающей более одного значения параметра, в данном случае — даже бесконечно много значений параметра в3. В противоположность этому в предыдущей ситуации гипотеза Я0 была простой (simple hypothesis).

Какие трудности возникают при использовании сложной нулевой гипотезы?

Возьмем для примера частную гипотезу Н0 : въ = 0.5. Мы отвергли бы ее в пользу НА : #з > 1 при

Ad^>,   (И) = i.76i.

\%

В то же время частную гипотезу Я0 : в3 - 1 отвергаем в пользу той же НА : в3 > 1 при

^>/а95(14) = 1.761.

\%

Иначе говоря, при различных частных гипотезах, входящих в состав сложной нулевой гипотезы #0 : 0 < въ < 1, получаем различные критические множества, обеспечивающие заданный уровень значимости (ошибку 1-го рода) 0.05. При построении каждого такого множества непосредственно используется конкретное гипотетическое значение в3 = #з°, тогда как в рамках гипотезы Н0 : 0 < въ < 1 отдельное гипотетическое значение параметра въ не конкретизируется.

Возникающее затруднение можно преодолеть следующим образом. Так как нельзя построить единое для всех 0 < въ < 1 критическое множество, вероятность попадания в которое равна а = 0.05 при справедливости каждой отдельной частной гипотезы, следует попытаться построить единое для всех 0 < в3 < 1 критическое множество, вероятность попадания в которое при выполнении каждой отдельной частной гипотезы была бы не больше а = 0.05. Такая задача решается путем использования критического множества, соответствующего граничному значению односторонней гипотезы, в данном случае въ - 1.

в —1

Действительно, пусть выбрано критическое множество —— > 1.761, соот-

 

ветствующее граничной частной гипотезе в3 = 1, так что

 

= 0.05.

 

Тогда если в действительности верна частная гипотеза в3 = 0.5, то

^—!■> 1.7611 0з=О.5

^>1.761+М|(,3=0.5 \% 'і,

> <

 

^——>1.761| 03 =0.5^ = 0.05.

 

Вообще, какая бы частная гипотеза 0Ъ = #3° (0 < #30 < 1) ни была верна, вероятность отвергнуть ее в рамках указанной процедуры не превысит 0.05.

В этом контексте а = 0.05 по-прежнему называется уровнем значимости критерия, тогда как понятие ошибки 1-го рода уже теряет смысл для критерия в целом. Уровень значимости ограничивает сверху ошибки 1-го рода, соответствующие частным гипотезам, входящим в состав сложной нулевой гипотезы.

Из сказанного можно сделать основной вывод: при указанном подходе к построению критериев проверки сложных нулевых гипотез вида

#0 : 6j < -1 (гипотеза эластичности при 0j < 0),

Я0 : -1 < 0j < 0 (гипотеза неэластичности при 0j < 0),

Я0 : 0 < 0j < 1 (гипотеза неэластичности при 0j > 0),

#0 : 0j > 1 (гипотеза эластичности при 0j > 0)

против соответствующих односторонних альтернатив можно пользоваться критериями уровня а, построенными для работы с теми же альтернативами, но при простых гипотезах 6}f = -1, 0j = -l, 0j=, 0j,= 1 соответственно.

у/ Замечание 3.2.4. То же относится и к другим аналогичным парам гипотез, в которых вместо значений 1 или -1 берутся иные фиксированные граничные значения.

 

Некоторые проблемы, связанные с проверкой гипотез о значениях коэффициентов

Итак, фактически уже построен критерий для проверки гипотезы

#о : 02<-

против альтернативы

НА:-1<02< 0.

Это тот же критерий с уровнем значимости 0.05, который был предназначен для проверки гипотезы Я0 : 02 = -1 против альтернативы НА : 02 > -1. Такой критерий отвергает гипотезу Я0 при

An >,.«,,

 

что и имеет место в нашем примере. Соответственно нулевая гипотеза эластичности потребления текстиля по цене отвергается.

Также фактически построен критерий для проверки гипотезы

Ял : 0 < А < 1

против альтернативы

НА:в3>1.

Это тот же критерий с уровнем значимости 0.05, который был предназначен для проверки гипотезы Я0 : въ - 1 против альтернативы НА : въ > 1. Такой критерий отвергает гипотезу Я0 при

^1>1.7б1.

\%

что не выполняется в нашем примере. Соответственно нулевая гипотеза неэластичности потребления текстиля по доходу не отвергается.

Представляет, однако, интерес то, какие решения будут приняты, если поменять местами нулевую и альтернативную гипотезы.

В отношении эластичности по цене возьмем теперь пару гипотез

Я0:-1<#2<0, НА:в2<-1.

При построении соответствующего критерия достаточно обратиться к критерию для пары

Н0-&2 = ~Ь   НА   @2 < ~1> который отвергает гипотезу Я0 при

^</в(14) = Г0.05(14) = -1.7б1

 

(на левом «хвосте» распределения 7(14)). Но у нас

 

так что гипотеза Я0 : в2 = -1, а значит, и Я0 : -1 < в2 < 0, не отвергаются в пользу НА : в2 < -1.

Итак, здесь нулевая гипотеза о неэластичности потребления по цене не отвергается, и это решение согласуется с отклонением нулевой гипотезы об эластичности потребления по цене.

Рассмотрим, наконец, пару гипотез

Яо:03>1, Я,:О<03<1. Здесь исходим из критерия, предназначенного для пары

Н0 : #з = 1,   НА : в3 < 1, и отвергаем гипотезу Я0 : въ > 1 при

^<^(14) = 7005(14) = -1.761.

В нашем случае

^—- = 0.918 >-1.761,

 

так что гипотеза Я0 : в3 > 1 не отвергается.

Итак, здесь нулевая гипотеза об эластичности потребления по доходу не отвергается. Однако ранее было установлено, что и нулевая гипотеза о неэластичности потребления по доходу также не отвергается. Таким образом, имеем конфликт критериев (conflict among testing procedures).

Из рассмотренного примера можно сделать важнейший вывод.

 

Решения об отклонении или неотклонении одной из двух соперничающих гипотез могут быть различными в зависимости от того, какая из двух гипотез принимается за основную (нулевую).

 

При решении вопроса о характере зависимости потребления текстиля от его относительной цены оба варианта выбора нулевой гипотезы дали согласованные результаты: нулевая гипотеза неэластичности не отвергается, а нулевая гипотеза эластичности отвергается.

Однако при решении вопроса о характере зависимости потребления текстиля от располагаемого дохода не отвергаются ни нулевая гипотеза эластичности, ни нулевая гипотеза неэластичности. В такой ситуации каждый из исследователей, придерживающихся противоположных априорных позиций относительно эластичности или неэластичности потребления текстиля по доходу, может считать, что имеющиеся статистические данные «подтверждают» именно его гипотезу, хотя правильнее заключить, что имеющиеся статистические данные «не противоречат» его гипотезе в рамках соответствующего статистического критерия.

Необходимо сделать еще одно важнейшее замечание. Пусть

Н0 : dj < #0,   НА: 6j> в0. Тогда /-статистика критерия равна:

 

Гипотеза #0 отвергается в пользу НА, если

в.-в0

-J—°->tl_a(n-p).

\%

Но tx_a(n -р)>0 при а < 0.5, и это означает, что если в; < #0, то гипотеза #0 не может быть отвергнута в пользу НА.

Следовательно, если сначала оценить по имеющимся статистическим данным коэффициент 6j и только после этого выбрать указанную пару гипотез

для некоторого значения в0 >     то в такой ситуации построенный по тем же данным указанный /-критерий никогда не отвергнет гипотезу Я0 в пользу НА. Аналогично если, оценив 0J9 формулируем пару гипотез

Я0 : dj > #0,   НА:    < в0.

для некоторого в0 < 6>, то соответствующий односторонний /-критерий, построенный по тем же данным, никогда не отвергнет гипотезу Я0 в пользу НА. В случае двустороннего /-критерия

вгв,

>Ч-а(П~Р)

 

формулирование гипотезы Я0 : 9}• - 0О с в0 = 0.9 где #у — оцененное значение параметра 0J9 приводит к тому, что эта гипотеза заведомо не будет отвергнута (/-статистика принимает нулевое значение).

Логическая ошибка в последних трех случаях состоит в том, что теория статистических критериев строится в предположении, что гипотезы Я0 и НА фиксируются до обращения к статистической обработке данных.

При таком предположении нельзя абсолютно точно сказать априори, будет

значение 0j больше или меньше заранее выбранного гипотетического значения #л.

 

ПРИМЕР 3.2.6

Пусть С — совокупные расходы на личное потребление в США, Y — совокупный располагаемый доход (1970—1979 гг., млрд долл. в ценах 1972 г.). Ранее для этих данных получена модель

С = -67.655 + 0.9797.

Уже зная, что в2 = 0.979, бессмысленно (или нечестно) ставить задачу проверки гипотезы Я0 : в2 < 1 против альтернативы НА : в2 > 1, поскольку на основании имеющихся наблюдений гипотеза Я0 заведомо не будет отвергнута. Она отвергается лишь при больших положительных значениях /-ста-

4-1

тистики ——, а у нас числитель последнего отношения принимает отрица-

 

тельное значение. Другое дело, что сформулировать такую гипотезу еще до анализа статистических данных вполне разумно. Впрочем, последнее вовсе

не означает, что в2 будет всегда меньше 1, даже если истинное в2 < 1.

Проверим теперь гипотезу Я0 : в2 = 0.9 против односторонней альтернативы Я0 : в2 > 0.9 в той же ситуации, но на основании данных за период с 1970 по 1981 г., п= 12 лет.

В этом случае в2 - 0.952, s§ = 0.0261, так что /-статистика

/ = -

4-0.9 0.052

= 1.99.

0.0261

Если для проверки гипотезы Я0 использовать двусторонний /-критерий с уровнем значимости а = 0.05, то будем отвергать Я0, когда

M>U=W10) = 2.228.

Если же использовать односторонний /-критерий с уровнем значимости а = 0.05, то будем отвергать Я0, когда

>>U=W10) = 1.812.

В обоих случаях вероятность ошибочного отклонения гипотезы Я0 равна 0.05. Представим теперь, что в действительности в2 = 0.95. Тогда распределение Стьюдента /(10) имеет статистика

4-0.95

\%

Какова вероятность того, что гипотеза Н0 будет отвергнута? При использовании двустороннего критерия:

Подпись: в2-0.9

р{|/|>2.228|02 =0.95 }=/»■

> 2.228 в2 = 0.951 =

= Р{в2-0.9 > 2.228| 02=О.95} =рвг - 0.9 <-2.228 или #2-0.9>2.228^ | в2 =0.95J =р{в2-0.95 + 0.05<-2.228^

или в, -0.95 + 0.05 > 2.228^ I ft = 0.95} = р $1  095 < -2.228

0.05

 

Подпись: 0.05или

в-, -0.95

> 2.228—— в2 =0.95

 

= Р{?(10)<-4.14

или t() > 0.312} = Р{ t(l0) < -4.14}+Р{ t(l0) > 0.312} =

 

= 0.001006 + (1 - 0.619276) = 0.3817.

А при использовании одностороннего критерия эта вероятность будет равна:

/>{/>1.812|02 =0.95 }=Р<

fbJ*l > 1.812 в2 =0.95

 

= РJ ^ZL«^5 >К812_      I ^ =0.95І = ^{Кі0)^-0Л04} =

I    Ъ    ^ J

= 1 - Р{ f (l 0) < -0.104} = 1 - 0.4596 = 0.5404.

Таким образом, вероятность отвергнуть ошибочную гипотезу Я0 : в2 = 0.9 в случае, когда в действительности в2 - 0.95, равна:

0.3817 — при использовании двустороннего критерия, 0.5404 — при использовании одностороннего критерия.

Две последние величины представляют собой мощности соответствующих критериев при частной альтернативе в2 = 0.95.

Односторонний критерий имеет более высокую мощность (0.5404 против 0.3817 у двустороннего критерия) при той же вероятности ошибочного отклонения нулевой гипотезы, равной 0.05. Такое же положение будет, если в действительности в2 = в и значение в входит в множество значений параметра #2, составляющих альтернативную гипотезу НА : в2 > 0.9 (т.е. в > 0.9). Это говорит о предпочтительности одностороннего критерия по сравнению с двусторонним при использовании в качестве альтернативной гипотезы НА:в2> 0.9.И

 

Рассмотренные выше односторонние гипотезы были связаны со значениями только одного из коэффициентов. Между тем в ряде случаев возникает задача проверки односторонних гипотез, связанных сразу с несколькими коэффициентами.

Мы уже обращались к производственной функции Кобба — Дугласа

Y = AKaLfi9

где а — эластичность выпуска по капиталу; Р — эластичность выпуска по труду.

Если а + Р > 1, то имеется эффект масштаба, выражающийся в наличии дополнительной отдачи от возрастания масштабов производства. Для выяснения наличия такого эффекта приходится иметь дело с парой односторонних гипотез

#0 :« + /?< 1,  НА а + р> 1, затрагивающих пару параметров а и Д и с двойственной к ней парой

#0 :а + Р> 1,   НА : а + р< 1. Пусть модель наблюдений имеет вид:

у і = 0хп + • • • + QpXip + є і*  / = 1,...,л,  Єі-іЛЛ N(0,cr2),

есть только одно линейное ограничение на коэффициенты (q = 1), но линейная гипотеза затрагивает более одного коэффициента, например:

Я0 : в2 + въ - 1.

Пусть эта линейная гипотеза имеет вид Н0:Ав = с, где А = (ахх,аХр). Ранее уже говорилось, что в таком случае статистика

,= (Ав-с)

s[a(xtx)-1at]i

имеет при гипотезе Н0: А в = с, q = 1 (и при выполнении стандартных предположений нормальной линейной модели), ^-распределение Стьюдента с (п - р) степенями свободы. Но тогда можно обычным образом использовать эту статистику для проверки односторонних гипотез в парах

Н0:Ав<с, НА:Ав>с,

или

Я0 :Ав>с,   НА :Ав<с,

 

ПРИМЕР 3.2.7

Рассмотрим данные о производстве продукции сельского хозяйства в Тайване в период с 1960 по 1972 г. (табл. 3.10). Здесь Y— объем произведенной продукции (млн новых тайваньских долл.); К — затраты капитала; L — количество отработанных человеко-дней (млн).

Используем производственную функцию Кобба — Дугласа и перейдем к логарифмам задействованных в ней переменных, получим модель наблюдений в виде:

In/;. =ln^-halnA:/-r-^lnL/+^,   i = l,..., 13. Оценивание этой модели приводит к следующим результатам (табл. 3.11).

В пакете Econometric Views можно получить значение F-статистики для проверки гипотезы Я0 : а + /? = 1, оно равно F = 13.90. Это означает, что абсолютная величина /-статистики для проверки этой же гипотезы равна л/13.90 =3.728. Поскольку а + (5 - 1 > 0, то и значение самой /-статистики равно t - 3.728. Это значение существенно превышает квантиль уровня 0.95 /-распределения с (13 - 3) = 10 степенями свободы — /095(10) = 1.812 и квантиль уровня 0.99 этого распределения — /095(10) = 2.764, так что нулевая гипотеза Н0 : а + Р < 1 отвергается в пользу альтернативной гипотезы Н0 : а + Р > 1 даже на 1\%-м уровне значимости. Тем самым приходим к выводу о наличии эффекта масштаба в сельском хозяйстве Тайваня (по крайней мере, на рассматриваемом периоде). ■

КОНТРОЛЬНЫЕ ВОПРОСЫ

Какова формула для оценки наименьших квадратов вектора коэффициентов линейной эконометрической модели при наличии линейных ограничений на эти коэффициенты? Какими свойствами обладает эта оценка?

Как выражается F-статистика для проверки линейной гипотезы о коэффициентах линейной эконометрической модели через остаточные суммы квадратов в исходной модели и в модели, учитывающей ограничения, накладываемые линейной гипотезой?

Как формулируется гипотеза о значимости регрессии в целом? Как проверяется такая гипотеза?

Чему равна оценка наименьших квадратов постоянной составляющей эконометрической модели при отсутствии в модели других объясняющих переменных?

Как применяется F-критерий для редукции исходной эконометрической модели?

Как связаны между собой F- и /-критерии для проверки гипотезы о выполнении единственного линейного ограничения на коэффициенты линейной эконометрической модели?

Какие проблемы возникают при установлении уровня значимости последовательной процедуры проверки гипотезы о равенстве нулю нескольких коэффициентов модели?

Как формулируются и как проверяются односторонние гипотезы о значении отдельного коэффициента линейной эконометрической модели?

В чем может состоять конфликт критериев при проверке односторонних гипотез против односторонних альтернатив?

Почему статистическая гипотеза о значениях коэффициентов эконометрической модели должна формулироваться до оценивания этих коэффициентов?

Как проверяются односторонние гипотезы, затрагивающие значения сразу нескольких коэффициентов линейной эконометрической модели?

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |