Имя материала: Эконометрика Книга вторая Часть 3

Автор: Носко Владимир Петрович

Тема 4.2 модели, в которых объясняемая переменная принимает несколько различных значений

 

Порядковая пробит-модель

В примере с наличием или отсутствием у семьи собственного автомобиля значение у і = 1 говорило о том, что 1-я семья имеет собственный автомобиль, но не уточняло, сколько в действительности автомобилей имеет семья — один, два или, быть может, еще больше. Обращаясь к процессу порождения данных, ориентирующемуся на значения функции полезности и сравнение ее с пороговыми значениями, можно предположить наличие не одного, а двух пороговых значений для каждой семьи, так что при превышении первого порога семья имеет в наличии один автомобиль, а при превышении второго (более высокого) порога — два автомобиля или более.

Обобщая эту ситуацию, рассмотрим процесс порождения данных, в котором имеется некоторая ненаблюдаемая (латентная) переменная у*, значения

которой связаны со значениями хП9 хір объясняющих переменных для /-го субъекта исследования следующим образом:

у] =filXil+ — + PpXip+€i9     1 = 1,...,/!,

где є і — случайная ошибка, отражающая влияние на значение у* неучтенных дополнительных факторов.

Вместе со значениями л:,,, xip наблюдается также переменнаяyt, которая может принимать К различных значений в соответствии со следующей схемой:

1,      ЄСЛИ >>* </,•!,

у і =k,   ecmyik_x <у]<уІЛ,

К,  если у* >уик_{,

где ftj < ... < Уіуь< • •• < Y,,K- — пороговые значения, вообще говоря, ненаблюдаемые.

Предполагая, что ошибки єх, є„ — независимые в совокупности (и независимые отXy,j = 1, ...,/?) случайные величины, имеющие одинаковое нормальное распределение et ~ N(0, сг2), получаем порядковую пробит-модель {ordered probit model).

Рассмотрим частный случай, когда К = 3 и пороговые значения одинаковы для всех субъектов исследования, так что yiX = ух, yi2 = у2 и

1, еслиу*<у19 Уі=2,  если/, <у* <у2, 3, есту*>у2.

При этом

Р{Уі =\xi} = P{y'<ylxi} = P{Pxxn +- + /Зрхір +£i<yxXi} = = Р{єі<(ух-Px)-(P2xn +- + Ppxip)Xi} =

_фГГі~А      fail +- + РР*ІРЛ

[a a Р{У:=2Х1} = Р{ух <У;<у2Хі} = Р{ух <pxxiX +- + /Зрхір+єі<у2хі} =

Ф

Гг-Р    Рг*п +- + РрхіР 1 _ фГ Г і "А _ Рг*і2+- +ftp**

 

Р{уі=3хі} = Р{у*<у2хі} = Р{/ЗххіХ + - + ррхір+єі>у2хі} = Р{є< >{у2-Рх)-(Р2хі2 +■■■ + Ррхір)Хі} =

ҐУ2-Р     Р2*І2+-- + РР*ІРЛ

= 1-ф

Пусть в наличии имеются только значения j,, хП9 хір9 і = 1, п. Применив метод максимального правдоподобия, как и в случае пробит-модели с двумя исходами, нельзя однозначно восстановить значения параметров РХ9 Рр9 если не известны о9 ух и у2. Поэтому и здесь для однозначной идентификации коэффициентов /319 Рр необходима какая-то нормализация. В стандартной модели предполагается, что а= I и ух =09 хотя возможны и другие нормализации.

Используя стандартную нормализацию и обозначив у2 = у, получим в модели с тремя исходами:

Р{уі=\хі} = Р{уі Щхі} = Ф(-х]Р)9

Р{Уі = 2Хі} = Р{0<у* < yxt} = Ф(у-xjfi)-Ф(-х]р)9

Р{Уі =Ъх,} = Р{у* >уxt} = 1 -Ф(у-xjfi).

При этом коэффициент Pj допускает двойное истолкование. В соответствии с моделью для у* положительное значение этого коэффициента означает, что переменная у* возрастает с возрастаниему-й объясняющей переменной. В соответствии с приведенными выражениями для вероятностей получения значений = 1, уt = 2 и уі, = 3 последнее приводит к возрастанию вероятности Р{у{ = 3Xj} и к убыванию вероятности Р{у{ = lxt}. Что же касается вероятности P{yt = 2|xf}, то здесь возможно как возрастание, так и убывание этой вероятности в зависимости от конкретной ситуации.

Прогнозирование по оцененной модели производится в соответствии со следующим соглашением. Прогнозное значение yt полагается равным к09 если

 

к—,..., К

 

ПРИМЕР 4.2.1

Рассмотрим выборку, состоящую из 1000 семей со среднедушевым месячным доходом от 100 до 2100 у.е., среди которых 499 семей не имеют собственного автомобиля, 369 семей имеет один автомобиль, 132 семьи — два автомобиля. Выборка получена посредством моделирования. При этом был использован процесс порождения данных в виде:

y*=xt + si9 /= 1,..., 1000,

где є і — независимые в совокупности (и независимые от xt) случайные величины, имеющие одинаковое нормальное распределение ~7V(0, 3002), т.е. сг=300.

Здесь К = 3 и границы ух и у2 были выбраны равными соответственно: ух = 1100 и ^2 = 1850.

В результате получаем порядковую пробит-модель:

 

Уі

 

если^. <ух,

если^ <у* <у2,

если у] > у2,

где ух = 1, если /-я семья не имеет автомобиля; ух = 2, если /-я семья имеет один автомобиль; ух = 3, если /-я семья имеет два (или более) автомобиля.

На рис. 4.7 показана зависимость полученных значений у* от х;. Горизонтальные линии соответствуют разделительным порогам LEVELX = 1100 w LEVEL! = 1850.

Наблюдения с >>* < 1100 встречаются в группе семей с доходами от 200 до 1600 у.е.; наблюдения с 1100 <у* < 1850 — в группе семей с доходами от 548 до 2094 у.е.; наблюдения с у] > 1850 — в группе семей с доходами от 1318 у.е. и выше. Важно отметить, что эти группы пересекаются, и это связано как раз с наличием случайной составляющей в уравнении полезности. Если бы этой составляющей не было, получилась бы картина, изображенная на рис. 4.8.

В таком случае произошло бы разбиение на три непересекающиеся группы.

для всех семей с доходами, не превышающими 1100 у.е. (yi = 1);

для всех семей с доходами, превышающими 1100 у.е., но не превышающими 1850 у.е. (уі = 2);

для всех семей с доходами, превышающими 1850 у.е. (у7 = 3).

Представим теперь, что имеем только выборочные данные, т.е. пары (xi9 yt)9 і = 1, 1000. Оценивание методом максимального правдоподобия порядковой пробит-модели с нормализацией <т= 1 (именно такая нормализация используется в пакете EViews) дает результаты, представленные в табл. 4.11.

Иначе говоря, нормализованная модель оценивается как

у* = 0.003361х,-+*/,.,

где ut~N{Q9 1), и

1,   если у* < 3.693723, yt=29  если3.693723 <у. <6.306692, 3,   если у* > 6.306692.

Если учесть, что мы сами смоделировали выборку и поэтому знаем значение а9 то переход к модели с а= 300 соответствует оцененной модели

у* = 300 • 0.003361 х, + 300 щ = 1.0083 xt + є,,

где Sj-NiO, 3002), и

ух =300-3.693723 = 1108.1169,

у2 =300-6.306692 = 1892.0076,

Как видно, параметры оцененной модели очень близки к параметрам истинной модели. Результаты прогнозов по оцененной модели приведены в табл. 4.12. Диаграмма на рис. 4.9 иллюстрирует эти результаты.

Для сравнения в табл. 4.13 приведены результаты прогнозов по тривиальной модели, не учитывающей в уравнении для у] влияние доходов /-й семьи.

Таким образом, из 1000 прогнозов правильными оказались 774, т.е. 77.4\%. При этом значения yt = 1 правильно прогнозируются в 438 случаях из 499, т.е. в 87.8\% случаев, значения yt = 2 — в 71.8\% случаев, значения yt = 3 — в 53.8\% случаев.■

 

Мультиномиальная модель

В целом ряде случаев не существует естественного упорядочения альтернатив, благодаря которому и возникает монотонная связь между непрерывной латентной переменной и наблюдаемой переменной, принимающей конечное количество значений.

Пусть имеем К таких альтернатив (занумеруем их в произвольном порядке числами 1, К) и пусть /-й субъект исследования приписывает к-и альтернативе полезность uik9 так что

uik=PXi,k+-- + PpxiP,k +єік=хІР + £ік>   i = l..-,n,   к = 9...9К9

где xik = (xnk9 ..., xiPtk)T;

єік — независимые в совокупности (и независимые от хік) случайные величины, имеющие одинаковое распределение.

Предположим, что і-й субъект выбирает альтернативу к9 если для него эта альтернатива имеет максимальную полезность. В этом случае полагаем уі = к. Тогда (условная при заданных значениях хік9 к = 1, К) вероятность того, что /-й субъект выберет альтернативу к9 равна:

Р{уі=к} = риЛ=тахиЛ = Рх]кА      max   (xJ/? + ^)

[           j=l,...,K   J)      l j=,...,K,j*k

Выразить такую вероятность в явном виде весьма проблематично. Однако если предположить, что общим для всех случайных величин \% является стандартное распределение экстремальных значений (максимума) I типа с функцией распределения

G(z) = exp(-e~z),   -оо < z < оо,

Р{Уі=к} =

(это распределение часто называют также распределением Гумбеля), то формула для вычисления вероятности P{yt = к} принимает достаточно простой вид:

exp(4l)

exp(х]хР) + exp(4/?) + • • • + exp(xTiKP)'

Заметим, однако, что если и числитель, и знаменатель правой части последнего выражения разделить на ехр(х]хР), то получим

pi   =k =          ехр(хІР-хІР)  

l + exp(xf2y5-x^) + ... + exp(x^-x^)'

Следовательно, каким бы ни было значение линейной комбинации хТар, вероятность P{yt = к} будет зависеть только от разностей (х]2Р - *лА)> (xTiKp - хТпР). Это обстоятельство приводит к естественной нормализации, при которой полагают

х]хр = 09 i=l,...,n,

тогда

Р{у =k} =       ехр(х^)           

l + exp(4/?) + .- + exp(xi/?)

Такую модель разные авторы называют по-разному. Так, в книгах (Ver-Ьеек9 2000) и (Amemiya, 1985) об этой модели говорится как о мультиномиальной логит-модели (multinomial logit model). В книгах (Greene, 2003) и (Davidson, MacKinnon, 1993) она называется условной логит-моделью (conditional logit model), а под мультиномиальной логит-моделью подразумевается модель

Р{у =k} =       ехр(х?/?*)      

)   ехр (х]рх) + ехр (х]р2) + • • • + ехр (х]рК)9

в которой объясняющие переменные специфичны только в отношении самих субъектов исследования (но не в отношении альтернатив), а специфичными в отношении альтернатив являются коэффициенты модели. Соответственно здесь рк = (J3ltk9 Ррк)т — вектор коэффициентов при объясняющих переменных в представлении функции полезности для к-й альтернативы:

"* = Ад хп + - + А,,* хіР + єік = хІРк +        / = 1,п.

Последняя модель под названием мультиномиальной логит-модели появляется и в пакете EViews. Поскольку в этой модели xt не зависят от альтернативы, являясь собственными атрибутами субъекта, то

р1у =к} =        ехр(хГ(Д*-Д'))           

l + expCxfC^-^^ + .-. + expCxfC^-^))'

так что эта вероятность зависит только от разностей Д2 - Д1, fik - Д1, а для нормализации можно положить вектор Д1 равным нулевому вектору. При такой нормализации

Р{уі=к}=        г«р(^)   т к .

1 + ехр(х[Д2) + -.- + ехр(х,гД*)

В этом случае (условная при фиксированных xij9j = 1,   / = 1, п)

совместная вероятность получения конкретного набора наблюдений^, ...9уп (конкретного набора значений 1,     К) равна произведению:

ехр(х,г/?*)

1 + ехр (jc,r р2 ) + ••• + ехр {х]рк)

 

ппи»=*}ґ'=пп

/=1 к= і= к=

где

если

lk    [О,   если у і * к.

Правая часть этого выражения при фиксированных хі9 і= 1, п9 является функцией от вектора неизвестных параметров Д, Д = (Д1, РК)Т:

ехр(х/Д*)

L(P) = L(Pxl,...,x„) = YYl

l + exp(x^2) + ... + exp(^)y

i= к=

К (       ,..Т ak^ d'k

и эта функция как функция правдоподобия является объектом максимизации по Д. Результатом такой максимизации являются оценки максимального правдоподобия для векторов коэффициентов /Г = (Д1Д, ..., fiPtk)T9 к - 1,..., К.

 

ПРИМЕР 4.2.2

Рассмотрим смоделированную ситуацию, в которой, как и в последней модели, переменные специфичны только в отношении самих субъектов исследования.

Пусть хп = 1, ха — типичное количество посещений продуктового магазина в неделю і-й семьей (от 1 до 7), хв — среднемесячный доход на одного члена /-и семьи (от 50 до 250 у.е.). Выбранная модель порождения данных имитирует поведение 1000 семей, проживающих в одном и том же многоэтажном доме и приобретающих продукты в трех продуктовых магазинах,

ближайших к этому дому. Каждая семья отдает предпочтение одному из трех магазинов, так что здесь имеем 3 альтернативы. Магазины различаются тремя сравнительными характеристиками: ассортиментом (богатый, бедный, промежуточный), удаленностью от дома (наибольшая, наименьшая, средняя) и уровнем цен (максимальный, минимальный, средний). Альтернативы были занумерованы 1, 2, 3 произвольным образом (табл. 4.15).

Предполагается, что /-я семья приписывает к-й альтернативе полезность щк: Щк=РкХп+Рк2Хц+РкъХн+£1к>   / = 1,...,Ю00,   * = 1,2,3,

где єік — независимые в совокупности (и независимые от xtj) случайные величины, имеющие одинаковое распределение с функцией распределения

G(z) = ехр (-е~2),   - оо < z < оо, При этом используем нормализацию

Аі=0, Д2=0, Дз=0. Остальные коэффициенты выбраны следующим образом: >#21=-0.8, Аз = 1.0, J323 = -0.0032, ^=-0.4, Д2 = 0.3, Д3 = 0.0032, так что функции полезности для трех альтернатив имеют вид:

ui - Єі->

ui2 = -0.8 + jc/2 - 0.0032x/3 + eu,

ui3 = -0.4хп + 0.3jc/2 + 0.0032x/3 + єв.

Поведение этих функций иллюстрирует рис. 4.10.

В соответствии с моделью порождения данных і-я семья выбирает альтернативу к, если для этой семьи альтернатива к имеет максимальную полезность. В этом случае полагаем^ = к.

Результаты оценивания методом максимального правдоподобия приведены в табл. 4.16. Все оцененные коэффициенты, за исключением /?23, имеют высокую статистическую значимость.

Сравним истинные и оцененные значения коэффициентов (табл. 4.17).

Истинные и оцененные значения коэффициентов

Оценивание методом максимального правдоподобия

Знаки оцененных коэффициентов соответствуют знакам истинных коэффициентов. Кроме того, соблюдается упорядочение значений соответственных коэффициентов, имеющих одинаковые знаки:

Pi <Ръ  и Рг <Ръ\>

 

На основании полученных оценок коэффициентов можно вычислить прогнозные значения вероятностей Р{у{ = к} предпочтения альтернатив к - 1, 2, 3, полагая

 

р{Уі=к}=-

1 + ехр(х^2) + ехр(х/^)

и используя эти прогнозные значения, дать предсказание номера альтернативы, которую предпочтет семья из рассматриваемого дома с заданной частотой посещения продуктового магазина и заданным уровнем месячного дохода на одного члена семьи. Можно, например, предсказывать для /-й семьи в качестве предпочтительной альтернативу к, если

Р{Уі=к}>Р{Уі=1}, Ык.

Применив такое правило к нашему примеру, получим результаты, приведенные в табл. 4.18.

Здесь под группой к подразумевается группа семей (среди рассматриваемых 1000 семей), отдающих предпочтение альтернативе к.

Диаграмма на рис. 4.11 иллюстрирует данные табл. 4.18.

Предсказанные объемы групп правильно воспроизводят упорядочение между наблюдаемыми размерами групп: в обоих случаях максимальное количество семей предпочитает альтернативу 2 и минимальное количество семей — альтернативу 1.

Несмотря на то что индивидуальные прогнозы не являются главной целью в подобных исследованиях, все же приведем сводную таблицу количества правильных и неправильных прогнозов для значений^ = 1, 2, 3 (табл. 4.19).

 

Объем группы

И Истинные

Таким образом, из 1000 прогнозов правильными оказались 719, т.е. 71.9\%. При этом значения yt = 1 правильно прогнозируются в 48 случаях из 146, т.е. только в 32.9\% случаев, тогда как значения yi - 2 правильно прогнозируются в 91.2\% случаев, значения у{ = 3 правильно прогнозируются в 48.2\% случаев. ■

 

ПРИМЕР 4.2.3

В следующей ситуации (в отличие от предыдущих примеров) одна из переменных специфична только в отношении альтернатив, а другая зависит и от альтернативы, и от субъекта.

Пусть storesк — количество магазинов в А>м торговом центре, distik — расстояние от места проживания /-й семьи до £-го торгового центра. Выбранная модель порождения данных имитирует поведение 1000 семей, предпочитающих совершать покупки в трех торговых центрах, каждая семья отдает предпочтение одному из них, так что имеем 3 альтернативы. Альтернативы были занумерованы 1, 2, 3 произвольным образом.

Здесь переменная storesk специфична только в отношении альтернатив, тогда как значения переменной distik зависят и от альтернативы, и от конкретной семьи.

Предполагается, что z-я семья приписывает k-й альтернативе полезность uik:

uik = /3xstoresk + (52distik + єік9   і = 1,..., 1 ООО,   к = 1,2,3,

где єік — независимые в совокупности (и независимые от storesk и от distik) случайные величины, имеющие одинаковое распределение с функцией распределения G(z) = exp(-e"z), -оо < z < оо.

Коэффициенты выбраны следующим образом:

Л =0.6, А =-1Д так что функции полезности для трех альтернатив имеют вид:

uiX =0.6storesl -distiX + єП9 ui2 = 0.6stores2 -disti2 +£i2-> ui3 = 0.6stores3 -disti3 +єі3.

В соответствии с моделью порождения данных і-я семья выбирает альтернативу к, если для этой семьи альтернатива к имеет максимальную полезность. В этом случае полагаем^ = к.

Результаты оценивания методом максимального правдоподобия приведены в табл. 4.20.

Будем опять предсказывать для /-й семьи в качестве предпочтительной альтернативу к, если

Р{Уі=к}>Р{уі=1}9 1*к.

Применив такое правило к нашему примеру, получим результаты, приведенные в табл. 4.21.

И Истинные | Прогнозные

J Замечание 4.2.1. Как было отмечено выше, в рассмотренной мультиномиальной логит-модели, в которой объясняющие переменные специфичны только в отношении самих субъектов исследования,

Подпись: 1 + ехр(*,г(/?2 -/?' )) + ••• + ехр(*,г(£* -/?'))P{yt=k}=

ехр(х,г (/?*-/?■))

Отсюда вытекает, что

Р{у,- = к} _ехр(*,г(/?*

Р{Уі=т)   exp(*f (/Г-/?'))

= ехр(*Г(/?*-/Г)),

т.е. отношение вероятностей выбора альтернатив к и т определяется только параметрами уравнений для полезностей этих двух альтернатив и собственными атрибутами /-го субъекта и не зависит от параметров уравнений для полезностей остальных (К - 2) альтернатив.

J Замечание 4.2.2. Если рассматривается условная логит-модель (с постоянными значениями коэффициентов во всех К уравнениях полезности), в которой объясняющие переменные специфичны в отношении альтернатив, то, как говорилось выше, в такой ситуации

Р{Уі=к} =

exp(*ttl)

ехр(*л/?) + "- + ехр(х£/?)

так что здесь

 

Р{Уі=к} _ехр(4^) Р{Уі=т) exp(xlfl)

т.е. отношение вероятностей выбора альтернатив кит определяется только общим параметром уравнений для полезностей различных альтернатив и значениями в /-м наблюдении объясняющих переменных, соответствующих к-й и т-й альтернативам. Это отношение не зависит от значений в /-м наблюдении объясняющих переменных, соответствующих остальным (К - 2) альтернативам. Такое свойство независимости оказывается нежелательным во многих ситуациях.

J Замечание 4.2.3. Пусть среди объясняющих переменных в условной логит-модели (с постоянными значениями коэффициентов во всех К уравнениях полезности) имеются переменные, специфичные только в отношении субъектов (т.е. значения этих переменных ДЛЯ /-ГО субъекта не зависят от альтернативы). Пусть соответственно

 

где vjk — вектор значений для /-го субъекта переменных, которые зависят от альтернативы; wj — вектор значений для /-го субъекта переменных, которые не зависят от альтернативы.

Соответственно разбивается и вектор коэффициентов:

f=(rT,sT).

Тогда

exp(v£/ + wf£)

Р{Уі=к)

ехр (уіу + wf S) + • • • + exp (vfK у + wf 5) exp(v^/)

exp(v^) + ..- + exp(v£/)'

так что эта вероятность не зависит от значений переменных, специфичных только в отношении субъектов.

Чтобы (в рамках модели с постоянным вектором коэффициентов) учесть возможное влияние таких переменных на вероятности Р{у( = к}, модель надо модифицировать. Одним из возможных способов модификации является создание группы дамми-переменных для альтернатив (DUMMY для альтернативы к принимает значение 1, если^ = к, и значение 0 — в противном случае) и умножение каждой из них на переменные, не зависящие от альтернатив. Тем самым достигается изменение коэффициентов при этих переменных в зависимости от альтернатив.

КОНТРОЛЬНЫЕ ВОПРОСЫ

Каким образом линейная модель с латентной объясняющей переменной приводит к порядковой пробит-модели?

Каким методом оценивается порядковая пробит-модель? Что необходимо для однозначной идентификации коэффициентов латентной модели, лежащей в основе пробит-модели? Как производится прогнозирование по оцененной модели?

Что понимается под мультиномиальной логит-моделью? В каких ситуациях используется мультиномиальная модель? Каким образом оцениваются параметры мультиномиальной логит-модели? Как производится прогнозирование по оцененной модели?

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |