Имя материала: Эконометрика для начинающих (Дополнительные главы)

Автор: Носко Владимир Петрович

1.6. модели, в которых объясняемая переменная принимает несколько различных значений

 

1.6.1. Порядковая пробит-модель

В том же примере с наличием или отсутствием у семьи собственного автомобиля значение у, = 1 говорило только о том, что i-я семья имеет собственный автомобиль, но не говорило о том, сколько в действительности автомобилей имеет семья - один, два или, быть может, еще больше. Обращаясь к процессу порождения данных, ориентирующемуся на значения функции полезности и сравнение ее с пороговыми значениями, можно предположить наличие не одного, а двух пороговых значений для каждой семьи, так что при превышении первого порога семья имеет в наличии один автомобиль, а при превышении второго (более высокого) порога - два или более автомобилей.

Обобщая эту ситуацию, рассмотрим процесс порождения данных, в котором имеется некоторая ненаблюдаемая (латентная)

переменная у*, значения которой связаны со значениями x;1,..., xip

объясняющих переменных для -го субъекта исследования следующим образом:

У] =p1x,1 + ■■■ + ppx,p +£t,  j =1 "•,n .

Здесь et - случайная ошибка, отражающая влияние на значение у*

неучтенных дополнительных факторов. Вместе со значениями xa,...,xip наблюдаются также значения переменной уt, которая

может принимать K различных значений, в соответствии со следующей схемой:

1,   если у, <yhi, у, = к,   если уік-і < у < yik

 

К,   если у* > у,,к-і,

где Jix < "' < Jik < "' < Уі,к-1 ~ пороговые значения, вообще говоря, ненаблюдаемые.

Предполагая, что ошибки є1,...,єп - независимые в совокупности (и независимые от xij, j = 1,..., p ) случайные величины, имеющие одинаковое нормальное распределение Єі ~ N (о, о2), мы получаем порядковую пробит-модель.

Рассмотрим частный случай, когда К = 3 и пороговые значения одинаковы для всех субъектов исследования, так что  у 1 = у,

 

1,   если у* <у, yi = I 2,    если у1 < у* < у2, 3,   если у* >у2.

i

При этом

 

= Р{є< (у1 -в) - (в2 Xi2 + " + PpXip ) Xi} =

 

Ф

о

о

 

P[y, = 2 x, }= p{yi < y*<72x, }=

= РІП <рХг + - + fipX,p + Єг < Гі X, }= =       ІГі-в )     (filX, 2 + -" + fipXip ) ^ _

_ ф (П _fi )   X,2 + - + fipX,p )'

(а                  а у

p{y, = 3X,} = p{y* >7iX,}= p{fiA1 +- + fipX pp +Є>УіX,}=

= P{^> (72 _ A) _ filX,2 + - + fipX,p ) X, }=

= 1 _^ (72-fii ) X 2 +■ ■ ■ + fipX,p )^ _

Пусть  мы  имеем в  наличии только  значения   yp,   xxip,

і = 1,...,n . Применяя метод максимального правдоподобия, мы, как и в случае пробит-модели с двумя исходами, не можем однозначно восстановить значения параметров  fi1,...,fip, если не известны

значения а, П и у2. Поэтому и здесь для однозначной идентификации  коэффициентов   J31,...,j3p   необходима какая-то

нормализация. В стандартной модели предполагается, что а = 1 и П = 0, хотя возможны и другие нормализации.

Используя стандартную нормализацию и обозначая у2 = 7, мы получаем в модели с тремя исходами:

р {у, = 1 x і }= р {у * < о X, }= Ф (_ XT fi) ,

Р{у, = 2 x}= Р{0 < у*<П x,}= ф(п_xTfi)_ф(_xTfi), Р{у, = 3 x}= Р{у* >П x, }= 1 _ф(п_ xTfi). При этом коэффициент fij  допускает двойное истолкование. В

соответствии с моделью для у*, положительное значение этого коэффициента   означает,   что      переменная   у*   возрастает с

возрастанием j-й объясняющей переменной. В соответствии с приведенными выражениями для вероятностей получения значений уі = 1,   уі = 2   и   уі = 3,   последнее   приводит  к возрастанию

вероятности P{yt = 3 xi} и к убыванию вероятности P{yt = 1 xi}. Что

же касается вероятности  P{yt = 2| xi}, то  здесь возможно как

возрастание, так и убывание этой вероятности, в зависимости от конкретной ситуации.

Прогнозирование по оцененной модели производится в соответствии со следующим соглашением. Прогнозное значение уі

полагается равным k0 , если Р{уі = k01 xt} = max Pуі = к xt}.

к=1,k,K

П р и м е р

Рассмотрим теперь выборку, состоящую из 1000 семей со среднедушевым месячным доходом от 100 до 2100 условных единиц (у.е.), среди которых 499 семей не имеет собственного автомобиля, 369 семей имеет один автомобиль, 132 семьи имеют два автомобиля. Выборка получена посредством моделирования; при этом был использован процесс порождения данных в виде

у* = x, +є,,  i = 1,к,1000,

где єі - независимые в совокупности (и независимые от xi) случайные величины, имеющие одинаковое нормальное распределение єі~N(0,3002), т.е. а = 300. Здесь К = 3 и границы у1 и y2 были выбраны равными, соответственно, у1 = 1100 и у1 = 1850, так что в результате получаем порядковую пробит-модель

[1,   если у* <y,

если y < у* <Y2,

если у* > Y2 , где y1 = 1, если i -я семья не имеет автомобиля, y1 = 2, если i -я семья имеет один автомобиль, и y1 = 3, если i -я семья имеет два (или более) автомобиля. На следующем графике показана зависимость полученных значений у* от xt

 

Горизонтальные линии соответствуют разделительным порогам LEVEL1=1100 и LEVEL2=1850.

Наблюдения с у* < 1100 встречаются в группе семей с доходами

от 200 до 1600 у.е. Наблюдения с 1100 < у* < 1850 встречаются в

группе семей с доходами от    548 до 2094 у.е. Наблюдения с

у* > 1850 встречаются в группе семей с доходами от 1318 у.е. и

выше. Важно отметить, что эти группы пересекаются, и это связано как раз с наличием случайной составляющей в уравнении полезности. Если бы этой составляющей не было, то мы имели следующую картину.

2500 -і

Подпись:

2000 і

 

1500 і

 

1000 -Г

 

0 -

x

 

И тогда мы получили бы разбиение на три непересекающиеся группы. Для всех семей с доходами, не превышающими 1100 у.е., yi = 1. Для всех семей с доходами, превышающими 1100 у.е., но не превышающими 1850 у.е., у, = 2. Для всех семей с доходами, превышающими 1850 у.е., yi = 3 .

Представим теперь, что мы имеем в распоряжении только выборочные данные, т.е. пары (xi,yi), i = 1,...,1000. Оценивание методом максимального правдоподобия порядковой пробит-модели с нормализацией о = 1, а = 0 (именно такая нормализация используется в пакете EVIEWS), дает следующие результаты:

yi = 0.00336Ц. + и,, где ut ~ N(0,1), и

1,   если у* < 3.693723, уг = і 2,   если 3.693723 < у* < 6.306692,

3,   если у* > 6.306692.

Если учесть, что мы сами смоделировали выборку и поэтому знаем значение о, то переход к модели с о = 300 соответствует оцененной модели

у* = 300• 0.003361 x, + 300• и, = 1.0083 x, +є,,

где є, ~ N (0,3002), и

Y = 300 • 3.693723 = 1108.1169, Y2 = 300 • 6.306692 = 1892.0076.

Как видим, параметры оцененной модели очень близки к параметрам истинной модели. Результаты прогнозов по оцененной модели приведены в следующей таблице.

 

 

Кол-во набл.

у,

Кол-во набл.

Ошибка

у, - у,

1

499

1

500

-1

2

369

2

387

-18

3

132

3

113

19

Содержимое таблицы отражает следующая диаграмма.

Объемы групп с y=k

600 500 400 300 200 100

0

12 3

k

 

Для сравнения приведем результаты прогнозов по тривиальной модели, не учитывающей в уравнении для у* влияние доходов і-й семьи:

Ошибка

 

уі

Кол-во набл.

у,

Кол-во набл.

у, - у і

1

499

1

1000

-501

2

369

2

0

369

3

132

3

0

132

Приведем также сводную таблицу количеств правильных и неправильных прогнозов для значений уі = 1,2,3 .

 

У г =1

У г =2

У г =3

У, =1

438

61

0

Уг =2

62

265

42

У, =3

0

61

71

Таким образом, из 1000 прогнозов правильными оказались 774, т.е. 77.4\%. При этом значения Уг = 1 правильно прогнозируются в 438 случаях из 499, т.е. в 87.8\% случаев; значения Уг = 2 правильно прогнозируются в 71.8\% случаев; значения Уг = 3 правильно прогнозируются в 53.8\% случаев.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 |