Имя материала: Введение в эконометрику

Автор: Кристофер Доугерти

4.1. базисная процедура

Одним из недостатков линейного регрессионного анализа, как это следует из самого названия, является то, что он может быть применен только к линейным уравнениям. В случае простого регрессионного анализа речь идет об уравнениях вида

у = а + $1х1, (4.1)

состоящих из постоянной величины (которая может и отсутствовать), независимой переменной, умноженной на некоторый коэффициент, и из случайного остаточного члена возмущения, которым мы можем временно пренебречь. В общем случае линейное уравнение выглядит так, что каждый объясняющий элемент, за исключением постоянной величины, записан в виде произведения переменной и коэффициента:

у = а + $1х1 + р2х2+... (4.2)

Уравнения вида

у = а + ^ (4.3) х

у = OUT

(4.4)

являются нелинейными. Выбрав значения для ос и р и построив графики, мы обнаружим, что оба они представлены кривыми.

Зависимости (4.3) и (4.4) считаются приемлемыми для описания кривых Энгеля, характеризующих соотношение между спросом на определенный товар (у) и общей суммой дохода (х). Как можно определить параметры ос и Р в каждом уравнении, зная значения у и х?

В конечном счете в обоих случаях можно применить линейный регрессионный анализ, для этого потребуется лишь небольшая подготовка. Во-первых, заметим, что уравнения (4.1) и (4.2) являются линейными в двух смыслах. Правая часть линейна по переменным, если определить их в представленном виде, а не как функции. Следовательно, она состоит из взвешенной суммы переменных, а параметры являются весами. Например, в уравнении (4.1) имеется просто xv а не log (jct). Правая часть также линейна по параметрам, так как она состоит из взвешенной суммы параметров, а переменные х в данном случае являются весами.

Для целей линейного регрессионного анализа важное значение имеет только второй тип линейности. Нелинейность по переменным всегда можно обойти путем использования соответствующих определений. Например, предположим, что соотношение имеет вид:

y = a + $lxf + р2>/*2~+.-- (4.5)

Если определить z{ =Х[2, Z2= fii к т.д., то соотношение примет следующий вид:

д> = а+рЛ +Р2г2 + ..., (4.6)

и теперь оно является линейным как по переменным, так и по параметрам. Такой тип преобразований является лишь косметическим, и обычно уравнения регрессии записываются с нелинейными выражениями относительно переменных. Это позволяет избежать лишних обозначений.

С другой стороны, уравнение типа (4.4) является нелинейным как по параметрам, так и по переменным, и его нельзя преобразовать только путем замены определений. (Не следует думать, что его можно преобразовать в линейное, если определить z = х? и подставить хР вместо z поскольку р неизвестно, мы не сможем рассчитать выборочное значение z.) Проблема преобразования нелинейных по параметрам соотношений будет рассмотрена в следующем разделе.

В случае (4.3), однако, единственное, что нам нужно сделать, — это определить z = OA). Тогда уравнение (4.3) примет вид:

y = oi + $z, (4.7)

и оно будет линейным, в этом случае мы без всяких проблем оценим регрессию между у и z. Постоянный член в уравнении регрессии будет представлять собой оценку а, а коэффициент при z — оценку р.

 

Пример

Допустим, вы исследуете соотношение между ежегодным потреблением бананов и годовым доходом, и наблюдения приведены в табл. 4.1, где собраны наблюдения для 10 семей (забудем пока о z)-

На рис. 4.1 представлено облако точек, соответствующих наблюдениям, а также график уравнения регрессии между у и х:

£=5,09 + 0,73*; R2 = 0,64. (со.) (1,23) (0,20)

(4.8)

Положительные или отрицательные, большие или малые остатки должны чередоваться случайным образом. Здесь же, как видно из таблицы, сначала остатки отрицательны, затем они становятся положительными, достигают максимума, а потом снова уменьшаются и становятся отрицательными: это представляется достаточно сомнительным.

В данном примере значения >> и х были получены с помощью метода Монте-Карло, истинное соотношение имеет вид:

у = 12 - ^ + Случайный член, (4.9) х принимает целые значения от 1 до 10, а значения случайного члена получают

Из рис. 4.1 видно, что график уравнения регрессии не вполне соответствует точкам наблюдений, несмотря на то что коэффициент при х существенно отличается от нуля при однопроцентном уровне значимости. Очевидно, что точки наблюдений лежат на кривой, тогда как уравнение регрессии характеризуется прямой. В данном случае нетрудно заметить, что функциональная зависимость между у и х определена неправильно. В том случае, если вы не можете представить зависимость в графическом виде (например, если вы используете множественный регрессионный анализ), понять, что где-то допущена ошибка, можно с помощью анализа остатков. В данном случае значения остатков приведены в табл. 4.2.

с помощью нормально распределенных случайных чисел со средним значением 0 и среднеквадратичным отклонением 0,1.

Если мы знаем это и определим z = 1/х, то уравнение примет линейный вид (4.7). Значение z для каждой семьи уже подсчитано в табл. 4.1. Оценив регрессию между у и z, получим:

9= 12,08- 10,08г;  R2 = 0,9989. (4.10) (со.) (0,04) (0,12)

Подставив z = 1/х, имеем:

р= 12,08 -Ш.. (4.11)

С учетом высокого качества оцененного уравнения (4.10) неудивительно, что соотношение (4.11) близко к истинному уравнению (4.9). На рис. 4.2А и 4.2Б показаны регрессионная зависимость и точки наблюдений для>>, х и z- Улучшение качества уравнения, измеряемого с помощью коэффициента R2, отражено в более полном соответствии графиков. Сравните рис. 4.1 и 4.2Б.

4.2. Логарифмические преобразования

Рассмотрим далее функции вида (4.4), которые являются нелинейными как по параметрам, так и по переменным:

у = ах*. (4.4)

Мы обнаружим, что соотношение (4.4) может быть преобразовано в линейное уравнение путем использования логарифмов, безусловно, знакомых вам из курса математики. Возможно, при изучении этого курса вам казалось, что логарифмы имеют чисто академический интерес и неприменимы на практике. В эконометрике, однако, они просто необходимы, поэтому если вы не уверены в своих знаниях, то вам следует их освежить в памяти. Далее приведена таблица основных свойств логарифмов, которая вам поможет. Если вы не имеете достаточного опыта работы с логарифмами, не волнуйтесь, вы легко приобретете нужные навыки.

 

Применение логарифмов

Основные правила гласят:

Если у = xz, то log у = log л: + log z-

Если у = x/z, то log у = log л: — log z.

Если у = хп, то log у — yi log х

Эти правила могут применяться вместе для преобразования более сложных выражений. Например, возьмем уравнение (4.4). Если у = со**, то по правилу 7:

log у = log а + log х$ и по правилу 3

= log ос + р log х.

До сих пор мы не определили, по какому основанию берем логарифм — е или 10. В данной работе мы будем использовать в качестве основания число е, т. е. натуральные логарифмы. Теперь это считается стандартом в эконометрике. Некоторые обозначают натуральный логарифм с помощью символа In, а не log, однако в этом уже нет необходимости. Никто больше не использует логарифмы по основанию 10. Таблицы десятичных логарифмов широко использовались для умножения или деления больших чисел до начала 1970-х гг. Однако с изобретением карманных калькуляторов они стали не нужны. Для натуральных логарифмов справедливо еще одно правило:

Если у = eY, то log у = х.

Выражение ех которое часто записывается как exp (jc), известно также как антилогарифм х.{ Можно сказать, что log (е*) является логарифмом антилогарифма х, и так как логарифм и антилогарифм взаимно уничтожаются, неудивительно, что log (е*) превращается просто в х.

 

Используя приведенные выше правила, уравнение (4.4) можно преобразовать в линейное путем логарифмирования его обеих частей. Если соотношение (4.4) верно, то

logy = logout = loga + р log*. (4.12)

Если обозначить у'= log у, z = log х и a'= log а, то уравнение (4.12) можно переписать в следующем виде:

/=а'+рг. (4.13)

1 Операция перехода от х к ехр (х) часто называется потенцированием. (Прим. ред.) 120

Процедура оценивания регрессии теперь будет следующей. Сначала вычисти у1 и z для каждого наблюдения путем взятия логарифмов от исходных значений. Вы можете сделать это на компьютере с помощью имеющейся статистической программы. Затем оценим регрессионную зависимость>>'от z. Коэффициент при z будет представлять собой непосредственно оценку р. Постоянный член является оценкой а', т. е. log а. Для получения оценки а необходимо взять антилогарифм, т. е. вычислить ехр (а').

 

Моделирование эластичности

 

Функции вида (4.4) часто встречаются в экономике. Когда вы видите такую функцию, то можете сразу сказать, что эластичность у по х равна р. Например, в разделе 4.1 отмечалось, что это общая форма кривых Энгеля, у представляет собой спрос на товар, х — доход, а Р — эластичность спроса по доходу.

Докажем указанное свойство эластичности. Независимо от математической связи между у и х или определения величин у и х, эластичность^ пох рассчитывается как относительное изменение^ на единицу относительного изменения х:

~          dy І у

Эластичность = —т—.

ах / х

Таким образом, если, например, у — это спрос, ах — доход, то данное выражение определяет эластичность спроса на данный товар по доходу.

Выражение для эластичности можно переписать в следующем виде: (dy/dx)/(y/x). Для примера с функцией спроса его можно представить как отношение предельной склонности к потреблению товара к средней склонности к потреблению данного товара.

Если соотношение между у и х имеет вид (4.4), то

^          dy I dy    By / х 0

ЭлаСТИЧНОСТЬ  =  ;           =          ;— = р.

у I х      у IX

Таким образом, например, если имеется кривая Энгеля вида

у = 0,01х0'30,

то это означает, что эластичность спроса по доходу равна 0,3. Если вы хотите объяснить это кому-нибудь, кто не знаком с экономической терминологией, то наиболее просто будет сказать, что изменение х (дохода) на 1\% вызывает изменение у (спроса) на 0,3\%.

Функция вида (4.4) может также применяться к кривым спроса, где у — это спрос на товар, х — цена товара, ар — это эластичность спроса по цене. (На практике обычно такая функция спроса объединяется с кривой Энгеля, в результате чего получается зависимость спроса одновременно от дохода и цены. Мы вернемся к этому вопросу, когда будем рассматривать модели множественной регрессии в главе 5.)

Что произойдет, если математическая связь между у их: не соответствует уравнению (4.4)? Что можно в этом случае сказать об эластичности? Это можно понять на основе базовых принципов. Предположим, имеется обычное линейное уравнение:

у = а + рх.

В данном случае dy/dx равно Р; следовательно, эластичность определяется следующим образом:

dy/dx      р рх

ЭлаСТИЧНОСТЬ  =  ;           =          ;— =    •

у I х     у I х у

В этом случае значение эластичности в любой точке будет зависеть не только от значения р, но также и от значений у и х в данной точке.

Таким образом, два основных достоинства математической формы (4.4) состоят в следующем:

Если эластичность^ похпостоянна, то это единственная математическая форма, которая обладает данным свойством. Это, безусловно, означает, что если вы считаете, что эластичность не постоянна, то данное соотношение не следует моделировать с помощью уравнения (4.4).

Вы можете получить прямую регрессионную оценку эластичности путем оценивания зависимости ogy от logx. Эта оценка, конечно, будет достоверна только в том случае, если зависимость определяется уравнением (4.4). Если зависимость линейна, то правильная процедура будет состоять в оценивании линейной регрессии между у и х и последующем вычислении $х/у.

 

Показательные функции

 

Показательные (или экспоненциальные) функции — это функции вида:

у = шР*. (4.14)

Наиболее общим их приложением является случай, когда предполагается, что переменная у имеет постоянный темп прироста во времени, в этом случае вместо х обычно используется время (г), а вместо Р — постоянный темп прироста W:

y = aert. (4.15)

Моделирование экспоненциальных временных трендов

Если зависимость у ort задана уравнением вида (4.15), то абсолютный прирост у за единицу времени (dy/df), определяется как

dy rt

— = гае   = гу.

dt

Следовательно, относительный прирост у за единицу времени можно записать как

dy / dt = ry= r У У

Следует помнить, что оценка г, которую вы получаете при оценивании регрессии (4.17), представляет собой оценку темпа прироста в абсолютном выражении. Обычно говорят о процентных темпах прироста, что означает умножение полученной оценки на 100. Следовательно, если оценка составляет 0,053, это означает, что темп прироста в процентах будет 5,3\% за период.

 

Если имеются значения у для нескольких временных периодов (1, Г), то параметры а и г можно оценить, если прологарифмировать (по основанию е) обе части уравнения (4.15):

log у = log а + log (е") = log а + rt. (4.16)

Заметим, что log (е") — это просто следовательно, мы просто берем логарифм антилогарифма rt. Если определить у' = log у и а' = log а, то из соотношения (4.16) получим:

y'=a'+rt. (4.17)

Таким образом, оценивая регрессию между логарифмом у и t, мы непосредственно получаем оценку темпа прироста г. Обычно оценка а имеет второстепенное значение, но если она представляет для вас интерес, то можно получить ее, потенцируя оценку а' (т. е. беря ее антилогарифм).

 

Пример

Кривая Энгеля была построена для расходов на питание в США за период с 1959 по 1983 г. с использованием тех же данных, что и в уравнении (2.42), однако вместо линейной функции в данном случае использовалась нелинейная (4.4), приведенная к линейному виду, как в соотношении (4.12), путем взятия логарифмов. Преобразованное выражение имело вид:

log у= 1,20 + 0,55 log х. (4.18)

Выполнив обратные преобразования, получим:

 

Если уравнение (4.4) представляет собой правильную формулу зависимости (в действительности, это, безусловно, сильно упрощено), то полученный результат предполагает, что эластичность спроса на продукты питания по доходу составляет 0,55, что означает, что увеличение личного располагаемого дохода на 1\% приведет к увеличению расходов на питание на 0,55\%. Коэффициент 3,32 не имеет простого толкования. Он помогает прогнозировать значения у при заданных значениях х, приводя их к единому масштабу.

Те же данные о расходах на питание были использованы для оценивания экспоненциального временного тренда типа (4.15), также приведенного к линейному виду путем взятия логарифмов [см. уравнение (4.16)]. Оцененная зависимость имеет вид:

log у = 4,58 + 0,020 /. (4.20) Выполнив обратные преобразования, получим:

р = ^4,58^0,020/= 97$5 ^0,020/. (421)

Уравнение показывает, что расходы на продукты питания в течение выборочного периода росли с темпом 2\% в год. В этом случае постоянный множитель имеет толкование, так как он «прогнозирует», что в момент /=0, т. е. в 1958 г. общие расходы на питание составили 97,5 млрд. долл. Такой прогноз, безусловно, не имеет важного значения, так как мы легко можем найти в справочниках действительные расходы на питание в 1958 г.

 

Упражнения

Данные о расходах на оплату жилья в упражнении 2.2 были связаны (1) с располагаемым личным доходом и (2) с экспоненциальным временным трендом в соответствии с моделями (4.4) и (4.15), что дало следующие результаты:

log у = -3,48 + 1,230 log л:;

logy = 4,08 + 0,045/.

Дайте интерпретацию этих двух уравнений.

Оцените аналогичные регрессии для товара, выбранного вами в упражнении 2.4, и дайте интерпретацию полученных коэффициентов.

Выведите выражение для эластичности спроса по доходу для кривой Энгеля, используя (4.3) в качестве модели, и покажите, что при отрицательном р эта эластичность уменьшается с увеличением х. Считаете ли вы, что такая ситуация может быть реальной? Если да, то для какого вида товара возможна такая функциональная форма?

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 |