Имя материала: Введение в эконометрику

Автор: Кристофер Доугерти

5.1. иллюстрация: модель с двумя независимыми переменными

Множественный регрессионный анализ является развитием парного регрессионного анализа применительно к случаям, когда зависимая переменная гипотетически связана с более чем одной независимой переменной. Большая часть анализа будет непосредственным расширением парной регрессионной модели, но здесь мы сталкиваемся с двумя новыми проблемами. Во-первых, при оценке влияния данной независимой переменной на зависимую переменную нам придется решать проблему разграничения ее воздействия и воздействий других независимых переменных. Во-вторых, мы должны будем решить проблему спецификации модели. Часто предполагается, что несколько переменных могут оказывать влияние на зависимую переменную, с другой стороны, некоторые переменные могут не подходить для модели. Мы должны решить, какие из них следует включить в уравнение регрессии, а какие — исключить из него. Вторая проблема будет рассмотрена в главе 6. В данной главе мы полагаем, что спецификация модели правильна. В большинстве ситуаций мы ограничимся основным случаем, где используются только две независимые переменные.

Начнем с рассмотрения примера, в котором определяются факторы совокупного спроса на продукты питания. Расширим первоначальную модель, включив учет влияния ценовых изменений на спрос, и допустим, что истинную зависимость можно выразить следующим образом:

y = a + p1x + P2p + w, (5.1)

где у — общая величина расходов на питание, х — располагаемый личный доход, а р — цена продуктов питания. Это, разумеется, является значительным упрощением как с точки зрения состава независимых переменных, включенных в зависимость, так и с точки зрения математической формулы связи. Кроме того, мы неявно предполагаем наличие лишь прямой связи за счет допущения о том, что расходы на питание не влияют на доход и цену. Это могло бы быть в том случае, если бы цены определялись на мировом рынке, но в большинстве ситуаций более реально допустить, что расходы на продукты и их цены определяются совместно в результате взаимодействия предложения и спроса. Проблемы, которые возникают в таких моделях, будут рассмотрены в главе 11.

Для геометрической иллюстрации этой зависимости необходима трехмерная диаграмма с отдельными осями для у, хир (рис. 5.1). Основание диаграммы содержит оси для х и р, и если пренебречь текущим влиянием случайного члена, то наклонная плоскость над ним показывает величину у, соответствующую любому сочетанию хир, измеренную расстоянием по вертикали от данной точки до этой плоскости. Так как расходы на питание могут увеличиваться с ростом доходов и уменьшаться с увеличением цены, изображение на диаграмме было построено на основе допущения о том, что величина pt является положительной, а р2 — отрицательной. Конечно, нереально было бы предполагать, что одна из величин хир могла бы быть равной нулю, и структуру диаграммы можно описать следующим образом. Если бы обе величины хир оказались равными нулю, то величина у равнялась бы а. При сохранении р = О уравнение (5.1) означает, что для любого положительного дохода величина у будет равна (а + р,х), и на рисунке приращение р,х обозначено как «чистый эффект дохода». При сохранении х = О уравнение означает, что для любой положительной цены величина у будет равной (а + р^), приращение на рисунке обозначено как «чистый эффект цены». Поскольку р2 на практике является отрицательной величиной, отрицательным будет и этот эффект. Показан также комбинированный эффект дохода и цены (Р,х + Р2/?).

Подпись: #4a + M + P2P
a

Подпись:  Подпись:
Рис. 5.1. Истинная модель с двумя независимыми переменными: расход как функция дохода и цены

Итак, до сих пор мы пренебрегали случайным членом. Если он отсутствует на данный момент в уравнении (5.1), то значения у в выборке наблюдений для у,хир будут находиться точно на наклонной плоскости и будет довольно просто вывести точные значения р, и Р2 (это не так просто сделать геометрически, если вы не имеете достаточно большого опыта построения трехмерных моделей, однако это довольно просто сделать алгебраическим путем).

Учет случайного члена приводит к тому, что фактические значения у будут лежать несколько выше или несколько ниже значений, соответствующих наклонной плоскости. Следовательно, теперь мы имеем трехмерный аналог для двухмерной задачи, показанной на рис. 2.2. Вместо нахождения линии, соответствующей двухмерному рассеянию точек, мы теперь должны расположить плоскость так, чтобы она соответствовала трехмерному рассеянию. Уравнение для выбранной плоскости будет иметь вид:

y = a + blx + b2p, (5.2)

и ее расположение будет зависеть от выбора величин а, Ьх и Ь2, являющихся, соответственно, оценками ос, Р, и Р2.

Используя данные для США за 1959-1983 гг. из табл. Б.1 и Б.2 по затратам на питание, располагаемому личному доходу и ценам, мы получим уравнение регрессии:

3>= 116,7 + 0,112*- 0,739р;     Д2 = 0,99, (5.3) (со.) (9,6)    (0,003) (0,114)

где у и х измерены в долларах США в постоянных ценах 1972 г., а р является индексом относительной цены, вычисленным путем деления неявного дефлятора цен продуктов питания на неявный дефлятор общих расходов (равный 100 в 1972 г.) и умноженным на 100.

Полученное уравнение следует интерпретировать следующим образом. При каждом увеличении располагаемого личного дохода на 1 млрд. долл. (при сохранении постоянных цен) расходы на питание увеличатся на 112 млн. долл. На каждую единицу увеличения индекса цен (при сохранении постоянных доходов) эти расходы уменьшатся на 739 млн. долл. Чистый эффект в любой момент времени будет зависеть не только от этих коэффициентов, но также от размеров изменений х и р.

Например, в период 1975—1980 гг. располагаемый личный доход увеличился на 145,8 млрд. долл., и, согласно уравнению (5.3), это привело к увеличению расходов на питание на 16,3 млрд. долл. В течение указанного периода индекс цен упал со 111,9 до 109,7, т.е. на 2,2 пункта, и это привело к дальнейшему увеличению у на 1,6 млрд. долл. Совместный эффект, прогнозируемый уравнением (5.3), таким образом, составил увеличение затрат на питание в размере 17,9 млрд. долл. Как видно из табл. Б.1, фактическое увеличение оказалось несколько больше, а именно 20,3 млрд. долл.

Даже если бы спецификация модели оказалась правильной (разумеется, это является большим упрощением), то между прогнозируемым изменением и полученным результатом будет наблюдаться расхождение. Прежде всего оценки Р, и р2 подвержены влиянию ошибки выборки. Кроме того, фактические уровни затрат на питание в 1975 и 1980 гг. определялись не только экономической зависимостью, но и случайным членом и в тот и другой годы, а следовательно, измеренное приращение в течение этого периода имеет, наряду с экономической составляющей, также и случайную составляющую.

 

Упражнение

 

5.1. Вам необходимо рассчитать индекс относительных цен для выбранного вами товара для использования в упражнении 5.3, которое является продолжением упражнения 2.4. Рассчитайте его путем деления дефлятора цен для вашего товара из табл. Б.2 на дефлятор общих расходов и умножения на 100. Постройте график рассчитанного индекса. Можете ли вы дать экономическое объяснение изменений относительного индекса цен в течение указанного периода?

 

5.2. Вывод и интерпретация коэффициентов множественной регрессии

Как и в случае парной регрессии, мы так выбираем значения коэффициентов регрессии, чтобы обеспечить наилучшее соответствие наблюдениям в надежде получить оптимальные оценки для неизвестных истинных значений параметров. Как и прежде, оценка оптимальности соответствия определяется минимизацией S, т. е. суммы квадратов отклонений:

5=е?(5.4)

где е, является остатком в наблюдении /, разницей между фактическим значением >> в этом наблюдении и значением;), прогнозируемым по уравнению регрессии:

\% = a + А,х„ + b^2i (5.5)

еі =Уі ~Уі =У~а- bxi ~ *Л/- (5-6) Используя уравнение (5.6), мы можем записать:

S = I<?2 = z(y, -a- Vi/ - *Л/)2- (5.7)

Необходимые условия первого порядка для минимума, то есть dS/da = 0, dS/db{ = 0 и dS/db2 = 0, дают следующие уравнения:

dS/Ъа = -2 I (у, - а - bxxu - Ьл) = 0; (5.8) dS/db{ = -21 хи(Уі - я - ЬххХ1 - Ь&,) = 0; (5.9)

dS/ЪЬ, = -21 х2/(у,. - а - bxxXi - b^) = 0.      (5.10)

Следовательно, мы имеем три уравнения с тремя неизвестными: а, Ьх и bv Первое уравнение можно легко перегруппировать для выражения величины а через Ь{9 Ь2 и данные наблюдений для хи у:

а = у-bix -^2x2. (5.11)

Используя это выражение и два других уравнения, путем некоторых преобразований можно получить следующее выражение для Ьх:

b = Соу(хд,у)Уаг(х2) - Со(х2,у)Со(хьх2)

1          Var(x, )Уаг(х2) - {CovOq, x2 )}2      (5*1 2>

Аналогичное выражение для b2 можно получить путем перестановки х{ и х2 в уравнении (5.12).

Цель данного обсуждения состоит в выделении двух основных моментов. Во-первых, принципы, лежащие в основе вычисления коэффициентов регрессии, в случаях множественной и парной регрессии не различаются. Во-вторых, используемые при этом формулы будут разными, поэтому не следует пытаться использовать выражения, выведенные для парной регрессии, в случае множественной регрессии. Отметим также, что вычисление формул регрессии при двух независимых переменных является более трудоемкой задачей, чем при одной переменной, и вам придется использовать компьютер.

 

Общая модель

 

В предыдущем примере мы имели только две независимые переменные. В тех случаях, когда этих переменных более двух, уже невозможно дать геометрическое представление того, что происходит, но развитие алгебраических выкладок в принципе вполне очевидно. Допустим, что переменная у связана с к независимыми переменными х{, хк неизвестной истинной зависимостью:

у = а + рЛ + ...+рЛ + «. (5.13)

Оценим уравнение для данного множества п наблюдений для у, jc,, ... , хк по методу наименьших квадратов:

Р = д+ 4,Хі + -+ *Л- (5.14)

Это вновь означает минимизацию суммы квадратов разностей, а отклонение в наблюдении / выражается как

*/ =Уі 'Уі =У~а~ *Л/- - -*Л/- (5-15)

Уравнение (5.15) является обобщением уравнения (5.6). Теперь мы выбираем а у bv ... , bk так, чтобы свести к минимуму S — сумму квадратов отклонений Іе,.2. Мы получаем (к+ 1) условий первого порядка Э5/Эя = 0, dS/db^ 0, dS/dbk = 0, что дает (к+ 1) уравнение для нахождения (£+ 1) неизвестных. Можно легко показать, что первое из этих уравнений позволяет получить аналог для уравнения (5.11), относящегося к случаю с двумя независимыми переменными:

а = у-Ь{х -Ь2х2 -*..-Ькхк. (5.16)

Выражения для А,, Ь2,Ьк становятся очень сложными, и математика не будет здесь представлена в явном виде. Вычисления целесообразнее сделать с помощью матричной алгебры, но для этого в книге не приводится теоретических или практических приложений. Для практических примеров вычисления вручную неприемлемы, и для нахождения решений следует использовать компьютер.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 |