Имя материала: Введение в эконометрику

Автор: Кристофер Доугерти

Иллюстрация, основанная на эксперименте по методу монте-карло

 

В эксперименте по методу Монте-Карло, описанном в разделе 6.2, исследователь переоценил влияние образования на доход из-за того, что он не учел зависимости дохода в данной стране от величины IQ и того обстоятельства, что величина 5 там отчасти играла роль замещающей переменной для IQ в неправильно специфицированном уравнении парной регрессии. Будем помнить об этом и предположим, что наш исследователь, являющийся уже экспертом в данном вопросе, приглашен в качестве консультанта для проведения аналогичного исследования в соседней стране.

Может оказаться, что в новой стране подход более формален, чем в первой, и доход здесь определяется только образованием (и удачей) без учета способностей как таковых. Пусть базовый доход здесь снова равен 10 ООО, с добавлением 2000 за каждый год учебы сверх минимальных 10 лет, плюс (или минус) некоторая величина, зависящая от фактора удачи. Истинным соотношением поэтому будет:

у = 10 000 + 2000 (5- 10) + и = -10 000 + 20005 + и. (6.18)

Исследователь снова делает выборку из 20 человек, и по удивительному совпадению все они имеют одинаковые характеристики, показанные в первой части табл. 5.2. В этом случае имеются также данные о величине IQ. Считая, что включение величины IQ в уравнение регрессии не причинит вреда, исследователь проводит эту операцию и получает следующее соотношение (стандартные ошибки указаны в скобках):

у= -13 336 + 21405+ 18/(3. (6.19) (4155)    (151) (43)

Результат действительно неплохой. 95-процентный доверительный интервал для константы включает в себя ее истинное значение —10 000, и аналогичный интервал для S включает значение 2000. Таким образом, полученные оценки незначимо отличаются от истинных величин с 5-процентным уровнем значимости. Точно так же коэффициент IQ незначимо отличается от нуля.

Если бы при этом была использована правильная спецификация, то результатом было бы:

у= -11 782 + 21635 (6.20) (со.)  (1851) (137)

Оценка константы здесь лучше, однако оценка коэффициента при переменной S недостаточно хороша (влияние фактора удачи оказалось относительно незначительным).

И вновь здесь нельзя слишком полагаться на результаты одного эксперимента.

В табл. 6.6 сведены вместе результаты повторения еще девяти таких же экспериментов с изменением в каждой выборке только значений случайной составляющей. Из табл. 6.6 можно сделать следующие выводы.

Результаты исследователя не выглядят смещенными, даже если спецификация является неправильной. Оценка константы колеблется около —10 000, а оценка коэффициента величины S— около 2000. (Естественно, что результаты оценивания правильной спецификации тоже будут несмещенными.)

Результаты оценивания правильной спецификации в целом более точны, поскольку эта спецификация оказывается более эффективной. Но данное утверждение не всегда верно, и в ряде случаев неправильная спецификация дает результат ближе к истине. Причиной этого является то, что относительная неэффективность спецификации исследователя зависит от корреляции между S и IQ, а корреляция оказывается не достаточно тесной (в выборке из табл. 6.1), чтобы вызвать большие расхождения с истинными значениями.

Более высокая эффективность правильной спецификации должна отражаться в меньших стандартных ошибках, и это в целом действительно подтверждается.

Оценки коэффициентов при IQ в спецификации исследователя в целом незначительно отличны от нуля. В эксперименте 4 имеется единственное отклонение, когда истинная гипотеза о нулевом значении отвергается при 5-процентном уровне значимости. Это является хорошим примером ошибки I рода (см. Обзор).

Упражнения

6.9. Социолог считает, что уровень активности в «теневой» экономике (Yt) зависит либо положительно от уровня налогового бремени (Xt), либо отрицательно от активности государства в стремлении сделать невыгодной деятельность в сфере «теневой» экономики (Zt). Величина Yf может зависеть также от Xt и Zt одновременно. Имеются годовые данные временного ряда за 20 лет, где величины Yr, Xt и Zt измерены в одних и тех же единицах. Социолог строит регрессионные зависимости: 1) Yt только от величины Xt 2) Yt только от величины Zt 3) Yt от обеих величин Xt и Z/5 применительно к каждому городу со следующими результатами (в скобках даны стандартные ошибки).

Произведя соответствующую статистическую проверку, напишите краткий отчет с рекомендацией социологу о том, как интерпретировать эти результаты.

6.10. Проведите эксперимент по методу Монте-Карло, по аналогии с экспериментами данного и предыдущего разделов, исследовав сначала эффекты невключения переменной, которая должна быть включена в уравнение, а затем со включением переменной, которой там не должно быть. При желании используйте модель «доход—образование—IQ», изменяя при этом коэффициенты, но при достаточном воображении можно изменить и саму модель. (Данное упражнение, вероятно, потребует определенной помощи со стороны преподавателя.) 6.4. Замещающие переменные

Часто бывает, что вы не можете найти данных по переменной, которую хотелось бы включить в уравнение регрессии. Некоторые переменные, относящиеся к социально-экономическому положению или к качеству образования, имеют такое расплывчатое определение, что их в принципе даже невозможно измерить. Другие могут поддаваться измерению, но оно требует столько времени и энергии, что на практике их приходится отбрасывать. Иногда вы можете быть расстроены тем, что пользуетесь какими-то данными, собранными другим человеком, в которых (с вашей точки зрения) опущена важная переменная.

Независимо от причины обычно бывает полезно вместо отсутствующей переменной использовать некоторый ее заменитель (proxy), а не пренебрегать ею совершенно. В качестве показателя общего социально-экономического положения вы можете использовать его заменитель — показатель дохода, если данные о нем имеются. В качестве показателя качества образования можно использовать отношение числа преподавателей и сотрудников к числу студентов или расходы на одного студента. Вместо переменной, опущенной в каком-либо обзоре, вы можете обратиться к другим, уже фактически собранным данным, если в них имеется подходящая замещающая переменная.

Имеются две причины для поиска такой переменной. Во-первых, если вы просто опустите важную переменную, то регрессия может пострадать от смещения оценок, описанного в разделе 6.2, и статистическая проверка будет неполноценной. Во-вторых, результаты оценки регрессии с включением замещающей переменной могут дать косвенную информацию о той переменной, которая замещена данной переменной.

 

Пример 1. Время как замещающая переменная для показателя технического прогресса

Мы уже встречались с замещающей переменной в разделе 5.5, где время использовалось для описания роста выпуска вследствие технического прогресса. В рассматривавшемся там периоде рост производительности, связанный с техническим прогрессом, оказался относительно малозначительным фактором. В последующие годы технический прогресс стал значительно более важным фактором, и при полном его исключении из спецификации производственной функции очевидно, что результаты оценки регрессии оказались бы сильно искаженными.

Когда на основе совокупных данных по экономике США за период 19491978 гг., подготовленных Дж. Кендриком и Э. Гроссменом (Kendrick, Grossman, 1980), была построена производственная функция Кобба—Дугласа и получено следующее уравнение (в скобках даны стандартные ошибки):

log У= -1,03 + 0,17 log* + 0,93 logI +0,024/;     /*2 = 0,99; (6.21) (2,33)  (0,66)      (0,17)        (0,016)     F = 1297,

где К— индекс объема выпуска внутреннего частного сектора; К — индекс затрат капитала; L — индекс затрат труда; / — время, равное единице в 1948 г., двум — в 1949 г., и т.д., все эти индексы были взяты в реальном выражении (1967= 100).

Если не считать весьма высокой эластичности выпуска по труду, то полученный результат вполне правдоподобен. Правда, ни оценка эластичности выпуска по капиталу, ни оценка темпов роста, связанных с техническим прогрессом, не отличаются значимо от нуля, но это может быть отнесено на счет муль-тиколлинеарности.

Если бы время не было использовано в качестве замещающей переменной для показателя технического прогресса, то оцененное уравнение выглядело бы следующим образом:

log Г= -4,50+ 1,19 logtf+ 0,77 log!;     Я2 = 0,99; (6.22)

(со.)   (0,57)  (0,10)       (0,15)            /' = 2012.

В уравнении (6.22) видно, что роль замещающей переменной для показателя технического прогресса играет log К. Коэффициент при log К неправдоподобно велик с двух точек зрения. Во-первых, он указывает, что увеличение затрат капитала должно привести к еще большему (пропорционально) увеличению выпуска при сохранении затрат труда постоянными. На практике же при неизменности других факторов можно ожидать снижения отдачи данного фактора. Во-вторых, если предположить, что рынки имеют конкурентный характер, то полученный результат означал бы, что доля дохода, приходящегося на капитал, превышает единицу, что, естественно, является абсурдом.

При добавлении в уравнение переменной t коэффициент при log АГуже больше не смещается под действием того, что log # играл роль замещающей переменной для показателя технического прогресса; так что этот коэффициент становится более обоснованным в обоих отношениях. Естественно, фактор времени может заключать в себе и другие факторы, относящиеся ко времени и влияющие на выпуск помимо технического прогресса. Но это только усиливает аргумент в пользу включения его в уравнение, хотя все это означает, что в интерпретации значения его коэффициента следует быть осторожным.

 

Пример 2. Замещающая переменная для показателя дохода в функции спроса

В качестве второго примера, который хотя и не контролируется подобно эксперименту по методу Монте-Карло, но тем не менее позволяет судить об успехе той или иной замещающей переменной, рассмотрим еще раз модель, связывающую расходы потребителя на питание (у) с располагаемым личным доходом (х) и с относительной ценой продовольствия (/?):

log у = а + (3,log х + (32log р + w, (6.23)

и предположим, что по какой-то причине мы не имеем доступа к данным о располагаемом личном доходе. Допустим, что нам, тем не менее, хотелось бы получить оценку ценовой эластичности спроса.

Как мы видели в разделе 6.2, парная регрессия между logy и logр дает смещенную оценку величины р2, при этом тестовые статистики оказываются не-

 

корректными. Пусть, однако, мы считаем (и считаем правильно), что log* имеет ярко выраженный временной тренд. В этом случае мы могли бы частично решить проблему путем использования времени в качестве замещающей переменной для х, построив регрессию:

В табл. 6.7 даны результаты, полученные: 1) для правильно специфицированной регрессии между log у, log х и log р 2) для неправильно специфицированной парной регрессии только между log у и log р 3) для множественной регрессии при использовании / в качестве замещающей переменной для log х (с указанием стандартных ошибок в скобках).

Во второй регрессии при невключении в уравнение logx оценка ценовой эластичности спроса настолько сильно смещается вверх, что становится положительной, а уровень коэффициента R2 значительно ниже, чем в первой регрессии. В третьей регрессии введение / явно устраняет смещение в оценке ценовой эластичности, а коэффициент R2 восстанавливается до предшествующего высокого уровня. Устранение смещения вызывается тем, что / в этом случае берет на себя роль замещающей переменной для отсутствующего log х, оставляя для logр выполнение только собственных функций. Почти полное восстановление коэффициента Л2 до предыдущего уровня можно объяснить тем, что величина / значительно лучше выполняет роль замещающей переменной для отсутствующего показателя log х, чем log р.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 |