Имя материала: Эконометрика

Автор: А.И. Новиков

3.3. проверка гипотез, относящихся к коэффициентам регрессии (а, ь)

 

ПРОВЕРКА ГИПОТЕЗЫ Н0: Р = р0

Пусть в теоретической зависимости Y= а + $Х+ є

случайный член є распределен нормально с неизвестной дисперсией а2.

Хотя величина р и неизвестна, имеется основание предполагать, что она равна заданной величине р0. Выдвигаются гипотезы

|#0: Р = Р„, [Я,: р*р0.

Задача заключается в проверке гипотезы Н0 на основании выборочных данных.

Пусть по выборочным данным получена оценка Ь.

В качестве критерия проверки гипотезы Н0 принимают случайную величину

*~Ро

 

которая имеет распределение Стьюдента с v = п - 2 степенями свободы.

Вычисляется наблюдаемое значение критерия /. По таблице критических точек распределения Стьюдента по заданному уровню значимости а и числу степеней свободы v = п - 2 находят критическую точку /кр.

Сравнивая наблюдаемое значение критерия с критическим, можно принять или отвергнуть нулевую гипотезу.

Результаты оценивания регрессии совместимы не только с конкретной гипотезой Я0: Р = Ро, но и с некоторым их множеством.

Любое значение р, совместимое с оценкой Ь, удовлетворяет условию

б-р

р-6

</кр,  или _?кр<_—</кр.

 

Разрешив это неравенство относительно р, получим b-tKpSb<$<b + tKpSb,

т.е. доверительный интервал для величины (3.

Посредине интервала лежит величина Ъ. Границы интервала одинаково отстоят от Ь, зависят от выбора уровня значимости и являются случайными числами.

Доверительный интервал покрывает значение параметра р с заданной вероятностью (1-а), т.е.

P(b - tKpSb < р < * + tKpSb) = 1 - а.

 

ПРОВЕРКА ГИПОТЕЗЫ Н0: р = О

Пусть по выборке получена оценка коэффициента регрессии Ъ.

Гипотеза #0: Р = 0 используется для установления значимости коэффициента регрессии Ъ.

Соответствующая ґ-статистика есть оценка коэффициента регрессии, деленная на ее стандартную ошибку, т.е.

-Ь~°- А

 

Величина / имеет распределение Стьюдента с v = п - 2 степенями свободы.

Наблюдаемому (расчетному) значению критерия / соответствует определенная значимость t, которую можно вычислить в Excel с помощью функции

Значимость t = СТЬЮДРАСП(t;  V; 2).

Из сравнения значимости t с заданным стандартным уровнем значимости получаем:

если значимость t больше стандартного уровня, то А незначим;

если значимость t меньше стандартного уровня, то Ь значим.

Пример 3.5. Зависимость расходов на питание у от личного дохода х по данным примера 2.5 имеет вид

у = -1,75+ 0,775*

(1,65) (0,143)

(в скобках указаны стандартные ошибки). 48

Оценим значимость коэффициента регрессии b = 0,775 и построим доверительный интервал для (3 при 5\%-ном уровне значимости.

*    0.775   е л

Наблюдаемое значение критерия t - — =   = 5,4.

Sfo 0,143

Значимость t = 0,0124, соответствующую расчетному значению критерия / = 5,4, определяем с помощью функции Значимость t = СТЫОДРАСП (t; V; 2), где v = 3. Поскольку значимость t - 0,0124 < 0,05, то коэффициент регрессии Ъ = 0,775 значим.

При а = 0,05 критическое значение критерия /кр = 3,18 определяем с помощью функции tKp = СТЬЮДРАСПОБР (а; V). Доверительный интервал для Р

0,775 - 3,18 • 0,143 < р < 0,775 + 3,18 • 0,143, или 0,32 < р < 1,23. ПАКЕТ АНАЛИЗА EXCEL (ПРОГРАММА «РЕГРЕССИЯ»)

Построение линейной регрессии, оценивание ее параметров и их значимости можно выполнить значительно быстрее при использовании пакета анализа Excel (программа «Регрессия»),

Пример 3.6. Имеются данные о расходах на питание у и душевом доходе х для девяти групп семей (усл. ед.):

 

X

63

158

260

370

480

593

728

935

1880

v

            ;            :            1

43

62

90

111

130

149

165

191

241

Рассмотрим интерпретацию полученных результатов в общем случае (к объясняющих переменных) по данным примера 3.6.

 

Регрессионная статистика

Множественный R

0,940

Я-хвадрат

0,884

Нормированный Д-квадрат

0,868

Стандартная ошибка

22,87

Наблюдения

9

В таблице Регрессионная статистика приводятся значения:

Множественный R — коэффициент множественной корреляции R - Ц{*.

Д-квадрат — коэффициент детерминации R1.

 

4-2337

Нормированный і?-квадрат — скорректированный R2 с поправкой на число степеней свободы.

Стандартная ошибка — стандартная ошибка регрессии S.

Наблюдения — число наблюдений п.

В таблице Дисперсионный анализ приведены:

Столбец df — число степеней свободы, равное:

df- к    для строки Регрессия;

1(у-у)2 Ъ(у-у)2

3. Столбец MS MS = SS/df.

факторная

остаточная

df- п-к- 1      для строки Остаток;

df= п-l для строки Итого.

Столбец SS — сумма квадратов отклонений, равная:

"^{y-yj1          для строки Регрессия;

для строки Остаток;

для строки Итого.

дисперсии, определяемые по формуле

для строки Регрессия; для строки Остаток.

Столбец F — расчетное значение .F-критерия, вычисляемое по формуле

F = MS (регрессия)/MS(остаток).

Столбец Значимость F — значение уровня значимости, соответствующее вычисленной /"-статистике:

Значимость F = FPACII (F-статистика; df (регрессия),• df (остаток)).

Если значимость f меньше стандартного уровня значимости, то R1 статистически значим.

В этой таблице указаны:

Коэффициенты — значения коэффициентов а, Ъ.

Стандартная ошибка — стандартные ошибки коэффициентов регрессии Sa, Sb.

t-статистиха — расчетные значения /-критерия, вычисляемые по формуле

t-статистика = Коэффициенты/Стандартная ошибка.

Р-значение (значимость t) — это значение уровня значимости, соответствующее вычисленной /-статистике:

Р-значение = СТЬЮДРАСП(t-статистика; df(остаток)).

Если Р-значение меньше стандартного уровня значимости, то соответствующий коэффициент статистически значим.

Нижние 95\% и Верхние 95\% — нижние и верхние границы 95\%-ных доверительных интервалов для коэффициентов теоретического уравнения линейной регрессии.

 

Вывод остатка

Наблюдение

Предсказанное у

Остатки е

1

72,70

-29,70

2

82,91

-20,91

3

94,53

-4,53

4

105,72

5,27

5

117,56

12,44

6

129,70

19,29

7

144,22

20,77

8

166,49

24,50

9

268,13

-27,13

В таблице Вывод остатка указаны:

Наблюдение — номер наблюдения.

Предсказанное у—расчетные значения зависимой переменной.

Остатки е — разница между наблюдаемыми и расчетными значениями зависимой переменной.

Используя результаты работы пакета анализа Excel (программа «Регрессия»), проанализируем зависимость расходов на питание от величины душевого дохода.

 

4*2337

Результаты регрессионного анализа принято записывать в виде

у = 65,92+ 0,107 .-с,   Я2 = 0,884

(1174) (0,014)

(в скобках указаны стандартные ошибки коэффициентов регрессии).

Коэффициенты регрессии а = 65,92 и Ъ = 0,107. Направление связи между у и х определяет знак коэффициента регрессии b = 0,107, т.е. связь является прямой и положительной. Коэффициент b - 0,107 показывает, что при увеличении душевого дохода на 1 усл. ед. расходы на питание увеличиваются на 0,107 усл. ед.

Оценим значимость коэффициентов полученной модели. Значимость коэффициентов (а, Ь) проверяется по ґ-тесту:

Р-значение (а) = 0,00080 < 0,01 < 0,05; Р-значение (Ь) = 0,00016 < 0,01 < 0,05.

Следовательно, коэффициенты {а, Ь) значимы при 1\%-ном уровне, а тем более при 5\%-ном уровне значимости. Таким образом, коэффициенты регрессии значимы и модель адекватна исходным данным.

Результаты оценивания регрессии совместимы не только с полученными значениями коэффициентов регрессии, но и с некоторым их множеством (доверительным интервалом). С вероятностью У5\% доверительные интервалы для коэффициентов есть (38,10-93,68) для а и (0,0728-0,142) для Ъ.

Качество модели оценивается коэффициентом детерминации Я2. Величина R2 = 0,884 означает, что фактором душевого дохода можно объяснить 88,4\% вариации (разброса) расходов на питание.

Значимость R2 проверяется по F-тесту: Значимость F= 0,00016 < 0,01 < 0,05.

Следовательно, R2 значим при 1\%-ном уровне, а тем более при 5\%-ном уровне значимости.

В случае парной линейной регрессии коэффициент корреляции можно определить как/- = IR2 = 0,94. Полученное значение коэффициента корреляции свидетельствует, что связь между расходами на питание и душевым доходом очень тесная.

ВЗАИМОЗАВИСИМОСТЬ КРИТЕРИЕВ

В парном регрессионном анализе эквивалентны /-критерий для Нй р = 0;  /-критерий для Н0: р = 0;  f-критерий для R2:

Подпись:
Связь между критериями выражается равенством

tb = tr = 4f,

причем для критических значений критериев при любом уровне значимости

v'i/Kp     v'r/кр -jrKp'

и эти критерии дают один и тот же результат.

Вывод. Проверки значимости коэффициента b в парной линейной регрессии, коэффициента корреляции г и коэффициента детерминации R2 эквивалентны.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 |