Имя материала: Эконометрика для начинающих (Дополнительные главы)

Автор: Носко Владимир Петрович

3.12. модели бинарного выбора

 

Мы уже рассматривали модели такого рода в Главе 1, но только для данных, относящихся к одному-единственному моменту (периоду) времени (cross-section data - данные в сечениях). Если исследование затрагивало n субъектов, то мы отмечали факт наличия или отсутствия некоторого интересующего нас признака у i -го субъекта при помощи индикаторной (бинарной) переменной y, которая принимает в i -м наблюдении значение yi. При этом yi = 1 при наличии рассматриваемого признака у i -го субъекта и yi = 0 - при отсутствии рассматриваемого признака у i -го субъекта.

Если пытаться объяснить наличие или отсутствие рассматриваемого признака значениями (точнее, сочетанием значений) некоторых факторов (объясняющих переменных), то, следуя идеологии классической линейной модели, мы могли бы расмотреть модель наблюдений

Уі =#Л-1 + ••• + 0pXip + ег, i = 1,...,n ,

в которой xi1, к, xip - значения p объясняющих переменных в i -м

наблюдении,    01,...,0p - неизвестные параметры, а е1,к,еп -

случайные ошибки, отражающие влияние на наличие или отсутствие рассматриваемого признака у   i -го субъекта каких-то неучтенных дополнительных   факторов.       При   обычных предположениях регрессионного анализа в такой модели получаем: ^ІУі = 1 x,]=01    + ^ + 0pxv ,

т. е. должно выполняться соотношение 0 <0Лі +— + 6pxip < i.

Это первая из трудностей, с которыми мы сталкиваемся при обращении к таким моделям.

Далее, случайная величина et имеет условную дисперсию

D(etxt) = xT9-(i-xTe) .

Таким образом, здесь возникает также проблема гетероскедастичности, осложненная еще и тем, что в выражения для дисперсий et входит и (неизвестный) вектор параметров в .

Кроме того, если, скажем,

y, = a + px, +є,, i = i, —,n ,

то

E (y,x,) = P{y, = i x,]=a + PxI, так что если значение x   увеличить на единицу, то вероятность

наличия  представляющего  интерес  признака у   I -го субъекта увеличится на величину, равную (a + p(x, + i))-(a + Px, ) = P, независимо от того, сколь большим или малым является значение xI.

Более подробное рассмотрение этой ситуации привело нас к необходимости использования нелинейных моделей вероятности вида

P{yt = i xt }= G(eixfl + ^ + evxlv), где G(z) - S-образная функция распределения, имеющего плотность g (z ) = G '(z), что соответствует нелинейной модели регрессии

Уі = G(ei x,i + — + epx,p )+£г ,     ^ i, —, n .

Предположим, что при фиксированных значениях объясняющих переменных в n наблюдениях, что соответствует фиксированным значениям векторов xI, случайные ошибки   є1,...,єп статистически

независимы.    Тогда   при    фиксированных    xi статистически

независимы   и   случайные   величины    G(e1хй +         + (pxip ,

i = 1,n , т.е. статистически независимы J^,...,yn . В силу этого (условная при фиксированных xi, i = 1,...,n) совместная вероятность получения конкретного набора наблюдений yl5...,yn (конкретного набора нулей и единиц) равна произведению

П И»=1 х Т Иу = 0 х, Tyi = Г1 (G[xje)Yi (i - o[xT4-yi .

Правая часть этого выражения является при фиксированных xi, i = 1,. „, n , функцией от вектора неизвестных параметров в,

Ь(в) = L(ex1xn) = ПШв))Уі (1 -G(xTв))1'y

i=1

и интерпретируется как функция правдоподобия параметров в1,...,вр . Дело в том, что при различных наборах значений в1,...,вр

получаются различные L()), т.е. при фиксированных xi, i = 1,...,n , вероятность наблюдать конкретный набор значений y1,..., yn может быть более высокой или более низкой, в зависимости от значения в . Метод максимального правдоподобия предлагает в качестве оценки

] = max

в     N ' в

i=1

вектора параметров в использовать значение в = в, максимизирующее функцию правдоподобия, так что

1-yi

= max      = max П (Ш в))Уі (1 - g(xt в))1

Использование свойства монотонного возрастания функции ln(z),

позволяет найти то же самое значение (в, максимизируя логарифмическую функцию правдоподобия lnL(0). В нашем случае

lnL(() = ±yt lnG(xTe(+ ]^(1 -y, )ln(1 -G(xTв().

i=1

i=1

 

Если не имеет место чистая мультиколлинеарность объясняющих переменных (т.е. если матрица X = (xiJ-) значений p объясняющих

переменных в n наблюдениях имеет ранг p, так что ее столбцы линейно независимы), то тогда функция L(6) имеет единственный локальный максимум, являющийся и глобальным максимумом, что гарантирует сходимость соответствующих итерационных процедур к оценке максимального правдоподобия.

Модель бинарного выбора обычно связывается с наличием

некоторой ненаблюдаемой (латентной) переменной у*, часто трактуемой как "полезность" интересующего нас признака для i -го субъекта, и такой, что

У = j1,    если   у* > у,

[0 — в противном случае. Если эта "полезность" определяется соотношением

у] = Pix,i + •" + Ppxip +£і ,  i = 1 -,n , и случайные ошибки имеют нормальное распределение, то

Р[у, = 1 x, }= G(xT р) = Ф(ві    + ^ + JBpXip). В стандартной модели полагается у = 0 .

Нарушение предположения об одинаковой распределенности случайных ошибок et в процессе порождения данных приводит к

гетероскедастичной модели и к несостоятельности оценок максимального правдоподобия, получаемых на основании стандартной модели.

Перейдем теперь к панельным данным. И здесь модель бинарного выбора обычно связывается с наличием некоторой ненаблюдаемой (латентной) переменной у*и и наблюдаемой индикаторной переменной уи такой, что

 

Например, уй может указывать на то, работает ли i -й индивид в период t или нет. Типичной является модель, в которой

= x,

it '

где xTt - вектор-строка значений объясняющих переменных для i -го субъекта в период t .

Предположим,  что  случайные  ошибки   ей   независимы и

одинаково распределены в обоих направлениях и имеют симметричное распределение с функцией распределения G и что

объясняющие переменные строго экзогенны.

Если трактовать ц как фиксированные неизвестные параметры,

то это соответствует включению в модель N дамми-переменных.

Логарифмическая функция правдоподобия принимает тогда вид: ln L(fi,(Xi, k,«n ) =

= X У и ln G(a + xjt в) + X (1 — У и )ln(l — G(a, + xjt в)).

И здесь возникает ситуация, когда оценка максимального правдоподобия для J3 и а{ даже при выполнении стандартных предположений состоятельна только если T —> °°, а при конечном Т и N — °° она несостоятельна. Мы встречались уже с такой ситуацией в рамках OLS-оценивания линейной модели с фиксированными эффектами. Только там при несостоятельности оценок для ц. оценка для J3 оставалась все же состоятельной, тогда

как здесь несостоятельность оценок для ц в общем случае переносится и на оценку для J3 . Одним из исключений является линейная модель вероятности, в которой вероятность P{yit = l| xjt} моделируется как линейная функция от объясняющих переменных.

Конечно, по подобию проделанного раньше, возникает желание

вымести       аі            непосредственно       из уравнения

у * = xTt в + а t + є it . Однако это не дает практической пользы, поскольку, например, если выметание производится путем перехода в этом уравнении к разностям у * — у *t—1, то не удается указать

переход к наблюдаемым переменным типа yit — yi t—1.

Альтернативный подход состоит в использовании условного максимального правдоподобия (conditional FE).

В этом случае рассматривается функция правдоподобия, условная относительно некоторого множества статистик ti , которое

достаточно для а. Это означает, что при заданных значениях этих статистик вклад i -го субъекта в правдоподобие уже не зависит от   а.  Таким  образом,  если   f (уй,...,yjTat,в)  - совместная

вероятность значений индикаторной переменной для -го субъекта, то

 

Соответственно, мы можем получить состоятельную оценку для в , максимизируя условную функцию правдоподобия, основанную на

f {yi1,к, угтг,в).

Наличие указанных достаточных статистик зависит от вида распределения єй. В линейной модели вероятности с нормальными ошибками такой достаточной статистикой является у.     Максимизация     соответствующей     условной функции

правдоподобия приводит к FE-оценке для а. Однако, например, в

случае пробит-модели, в которой нормальными являются ошибки в уравнении

уи = xT в + а + є, достаточной статистики для  а{  просто не существует. А это

означает, что мы не можем состоятельно оценить пробит-модель с фиксированными эффектами при конечном Т.

 

3.12.1. Логит-модель с фиксированными эффектами

 

Такой модели соответствует латентное уравнение Уі = xlв + а, + єи , в     котором      ей      имеют     логистическое распределение

^ z

G( z) = A(z ) =            . При этом

1 + ez

nj   її     із   exPix« в+а}

1+exp{xlt в+а}

nj   пі     /Л і   expFTв+а} і

Р{уи = 0 хй ,а,в}=1 -  + FLjTe+    І = Т+     1 т в+    }.

Рассмотрим для иллюстрации логит-модель с Т = 2. Заметим, что в этом случае сумма У 1 + У 2 есть просто общее количество периодов безработицы (суммарная продолжительность пребывания в состоянии безработицы) для i -го субъекта, и что для каждого субъекта есть 4 возможных последовательности состояний (ул, у{2): (0,0), (0,1), (1,0), (1,1). Соответственно, сумма yi1 + yi2 может принимать только 3 возможных значения: 0,1,2 (у i -го субъекта не было периодов безработицы, был один период безработицы, был безработным в течение обоих периодов).

Вычислим условные вероятности указанных четырех последовательностей при различных значениях суммы yi1 + yi2.

Если yi1 + yi2 = 0, то возможна только последовательность (0,0) , так что p{(0,0)| ул + у, 2 = о,а ,/}= і,

а условные вероятности трех других последовательностей при

у,1 + у,2 = 0 равны 0.

Если уі1 + уі2 = 2 , то возможна только последовательность (1,1), так что

р{(1,1)| у,1 + у, 2 = 1,а ,/}= 1,

а условные вероятности трех других последовательностей при у,1 + у, 2 = 1 равны 0.

Если же уі1 + уі 2 = 1, то возможны две последовательности (0,1) и (1,0) , и они имеют условные вероятности, отличные от 0 и 1, тогда как условные вероятности последовательностей (0,0) и (1,1) равны 0. При этом

Р{(01)|      +  1 /}         Р{(0,1)|x, ,аі , в}

Р{(0,1) у,1 + уі2 = 1 Xit, аі , в}= Р      +       1          в} =

Р{у1 + у 2 = 1 Xit,а , в}

=                   р{у,1 = 0 хй, а, в}рк = 1 x и, а, в}

р{у,1 = 0 х„ ,а ,в}р{уг2 = 1 ,а ,в}+ р{ул = 1x, ,а ,в}р{уг 2 = 0|х, ,а, в

 

1                   _    ЄХР{х{2 в + а-}

 

1                   .    exp{x{2 в + а}         exp{x{1в + а, }   . 1

1 + exp{xje + a,} 1 + exp^Z + aJ  1 + exp{x{e + a} 1 + exp^Z + aJ

 

=                   exp{x{2e + a} exp{x,{2e}

exp{x{ в + а }+ exp{x{2 в + ^ }     exp{x{e}+ exp{xf2e}'

так что индивидуальные эффекты выметаются, и

p{(0,1)|у.+ у,, = 1,x,,a,,/}= 1exp{(f(' ~Xi ^,.

1 + expj(x,2 — xи ) /З]

Соответственно,

p{(1,0)| y л + y ,2 = 1, x lt, а ,д}= 1 _ p{(0,1)| y л + ya = 1, x й, а, д}=

= 1               

 

Таким образом, все условные вероятности

-KG^ y,2 ) = (r, s)|y,1 + y,2 = h XU ,а ,Д},

где r, s = 0,1, / = 0,1,2 , не зависят от индивидуальных эффектов, так что продолжительность периодов безработицы является достаточной статистикой для а, и использование условного правдоподобия приводит к состоятельной оценке для д .

Полученные результаты означают, что при T = 2 мы можем оценивать логит-модель с фиксированными эффектами, используя стандартную логит модель, в которой в качестве объясняющей переменной выступает xi2 _ xi1, а в качестве наблюдаемой бинарной переменной - переменная, отражающая изменение значения переменной yit при переходе от первого ко второму наблюдению (1 - при возрастании yit , 0 - при убывании yit ). Соответственно, функцию правдоподобия можно записать в виде:

L = ПФ, 0) -М(0,1) -М(1,0) -MCI 1) •}=

i=1

где Srs = 1, если yi1 = r, yi2 = s, и Srs = 0 в противном случае. Мы видим, что субъекты, для которых yi1 = yi2 = 0 или yi1 = yi 2 = 1, не вносят дополнительный вклад в функцию правдоподобия и фактически игнорируются при оценивании. Для оценивания д существенны  только те  субъекты,  которые  хотя  бы однажды изменяют свой статус в отношении yit .

Параметр   /   идентифицируется  здесь  по  одному только

^шіт"-измерению данных. Вклад в оценивание вносят только те субъекты, которые изменили свой статус. При значениях T > 2 вычисление условных вероятностей более хлопотно, но также возможно.

Проверку гипотезы H0 об отсутствии индивидуальных эффектов можно осуществить с помощью критерия типа Хаусмана, основанного на разности между оценкой J3CML для /, полученной с использованием условного правдоподобия и обычной логит ML-оценкой /ъль, игнорирующей индивидуальные эффекты (при вычислении последней константа исключается). Логит MLE состоятельна и эффективна только при гипотезе H0 и несостоятельна при альтернативе. Условная же MLE состоятельна и при гипотезе H0 и при альтернативе, но не эффективна, так как использует не все данные. Таким образом, положение здесь соответствует тому, при котором реализуется схема Хаусмана (см. Главу 2, разд. 2.6.5.). Статистика критерия

H = (ficML - вШ. j )CoV{eCML )- ^(Рш. } ' [ftCML - )

имеет при гипотезе H0 асимптотическое распределение хи-квадрат с числом степеней свободы, равным размерности вектора в .

 

З а м е ч а н и е

Существенным недостатком метода условного правдоподобия является то, что он предполагает (условную) независимость yi1,K,yT при фиксированных xjt,atМетод неприменим к моделям с запаздывающими значениями объясняющей переменной в правой части.

3.12.2. Пробит-модель со случайными эффектами

 

Если    а    статистически    независимы    от объясняющих

переменных, то модель со случайными эффектами представляется более подходящей, и в этом случае проще рассматривать не логит, а пробит-модель. (Хотя можно использовать и логит-модель, что и делается в приводимом далее примере.)

Здесь мы отправляемся от спецификации

y = J1,   если   УІІ > 0 "   [о — в противном случае,

УI = xl в + u,t,

u,t = а,+є«:

где

а - случайные индивидуальные эффекты, а ~ i.i.d. N(о,а^),

єи - случайные ошибки, еи ~ i.i.d. N(о,ст2), причем   индивидуальные   эффекты   и   ошибки статистически независимы. В этих условиях совместное распределение случайных величин un,...,ujT нормально, причем E(пи) = 0 , D(uit) = ст2а + &Є , Cov(uit,uis ) = Cov(a + єи, а + 2is) = о2а   для s Ф t, так что значение

л. л.              Cov(uit, uis) o2a

коэффициента  корреляции   p =  ,  ,  у,   s   s = —2 а 2 между

J^JDuT)   a2a + аЄ

ошибками uit и uis внутри одной группы (субъекта) одинаково для

любых s Ф t. В "стандартной" спецификации D(ujt ) = 1 и р = о2а.

Это соответствует предположению о том, что стЄ = 1 — (52а.

Совместная  вероятность  получения  набора   УЛ,.--, y T при

заданных xл,..., xT определяется как

■, У,тХП,к' XiT'       p)f(al )dal =

 

-co l t =1 _

В рассматриваемой пробит-модели

Подпись: 2
aJ

если y,t =1

 

, если yit = 0,

 

 

/2

Итоговый интеграл вычисляется численными методами. Соответствующие программы имеются в некоторых пакетах (например, в Stata).

 

При гипотезе H0 об отсутствии индивидуальных эффектов

 

так что проверка отсутствия индивидуальных эффектов сводится к проверке гипотезы Р= 0 .

 

З а м е ч а н и е

В контексте панельных данных построение порядковых пробит моделей с несколькими категориями отклика довольно затруднительно.

3.12.3. Пример

 

Рассмотрим результаты исследования панельных данных по Германии (German Socio-Economic Panel) за 5-летний период с 1985 по 1989 гг., проводившихся с целью выяснения влияния состояния безработицы на степень удовлетворенности жизнью ("well-being"). Исходные данные были представлены в порядковой шкале и индексировались числами от 0 до 10. Ввиду сложности построения порядковых логит- и пробит-моделей для панельных данных, данные были затем сжаты до бинарных. Индивиды, у которых удовлетворенность жизнью индексировалась числами от 0 до 4, считались неудовлетворенными жизнью, тогда как индивиды с индексами 5 и выше считались более или менее удовлетворенными жизнью.

В  качестве  объясняющих переменных первоначально были привлечены следующие характеристики индивидов: Непрерывная переменная:

LOGINCOME - логарифм (располагаемого) дохода - см. ниже. Дамми-переменные:

UNEMP (безработный), NOPARTIC (не включен в рынок труда), SELFEMP   (самозанятый),   PARTTIME   (частично   занятый) -указывают текущий сатус на рынке труда (категория "полностью занятый" не снабжается дамми-переменнной), MALE - индивид мужского пола, OKHEALTH - хорошее состояние здоровья, AGE - возраст и AGESQUARED - квадрат возраста, VOCATIONAL D. - наличие профессиональной степени, UNIVERSITY D. - наличие университетской степени, MARRIED - состояние в браке.

Для правильной интерпретации влияния безработицы на удовлетворенность жизнью надо учитывать целый ряд обстоятельств.

Например, безработица обычно ведет к сокращению дохода, что, в свою очередь, может уменьшить удовлетворенность. Однако, если доход включается в число объясняющих переменных, то коэффициент при безработице фактически измеряет влияние безработицы при прочих равных, т.е. при сохранении дохода постоянным. Это могло быть в реальности, если бы страховое возмещение при безработице достигало 100\%. При высоком (отрицательном) коэффициенте корреляции между безработицей и доходом оценки остаются несмещенными, но их точность может значительно уменьшаться.

Удовлетворенность индивида может уменьшаться вследствие безработицы также и потому, что доля его вклада в общий семейный бюджет уменьшается. Поскольку, в отличие от доходов домохозяйства, имеющиеся в панели данные в отношении индивидуального дохода ограничены прошлыми доходами, в уравнение включается не индивидуальный доход, а доход домохозяйства.

Включение в модель взаимодействий факторов позволяет выделять дифференциальные эффекты влияния безработицы в группах, имеющих разные атрибуты, например, в разных возрастных группах. В связи с этим в модель включены помимо собственно UNEMP также и переменные

UNEMP*AGE<29

UNEMP*AGE30-49.

Другим важным взаимодействием является взаимодействие между безработицей и продолжительностью текущего периода пребывания в состоянии безработного. Влияние продолжительности безработицы на психическое состояние индивида достаточно хорошо документировано в литературе по психологии. В соответствии с этим, в уравнение включается переменная

UNEMPDUR (продолжительность периода безработицы, продолжающегося в настоящее время) и, для учета возможной нелинейности, переменная

UNEMPDURSQ *10-2.

К сожалению, в данных полностью отсутствовал региональный аспект, так что не удалось выяснить влияние локального уровня безработицы.

Следует отметить очень существенное взаимодействие безработицы и пола индивида. По этой причине обработка данных производилась также раздельно по мужчинам и женщинам.

Наличие протяженных наблюдений позволяет, в принципе, включать в модель элементы динамики. Мы, однако, уже говорили о проблемах с оцениванием динамических моделей бинарного выбора, в частности, с включением в правую часть запаздывающих значений объясняемой переменной. В данном анализе предполагается устойчивость индивидуальных откликов во времени, и она как раз учитывается введением в модель индивидуальных эффектов. Для проверки этого свойства в модель помимо переменной UNEMPDUR включается также переменная PREVDUR, указывающая на суммарную продолжительность периодов безработицы за 10 лет, предшествующих анализируемому периоду.

Кроме того в модели используется в качестве объясняющей еще и переменная CHANGEINC - относительное изменение дохода домохозяйства по сравнению с предыдущим годом. Это связано с некоторой неясностью в отношении того, что именно влияет на удовлетворенность - собственно уровень доходов или его изменение.

Наконец, нельзя исключать возможного наличия и обратной причинной связи между безработицей и уровнем удовлетворенности, т.е. того, что внутренне менее удовлетворенные индивиды скорее и оказываются безработными. Если это так, то переменная UNEMP коррелирует со случайным эффектом в модели случайных эффектов и оценка максимального правдоподобия, не учитывающая этого, оказывается несостоятельной. Поскольку далее приводятся результаты статистического анализа и по модели с фиксированными эффектами и по модели со случайными эффектами, имеется возможность оценить устойчивость результатов к этой возможной эндогенности.

Основная задача состоит в проверке гипотезы о негативном влиянии безработицы на удовлетворенность при очистке от влияния прочих факторов, включая влияние уменьшения доходов.

 

В приводимых ниже табл. А1 и А2 указаны результаты оценивания порядковой пробит-модели, не учитывающей панельной структуры данных (данные усреднены по времени), но включающей временные дамми. В рассмотренной порядковой пробит-модели предполагается, что уравнение полезности имеет вид

S* = xT в + єи,

и наблюдаемое значение индекса удовлетворенности определяется соотношениями

,     если    S* < 0,

1,   если 0 < S* < у1,

 

10,  если S* >Y9.

Таблицы B1 и B2 содержат результаты оценивания FE логит-модели и RE пробит-модели с бинарным откликом (1 - если уровень удовлетворенности равен 5 или выше, 0 - если уровень удовлетворенности ниже 5).

UNEMP*AGE<29

-0.164

(0.078)

UNEMP*AGE30-49

-0.221

(0.065)

UNEMPDUR

-0.011

(0.007)

UNEMPDURSQ *10-2

0.013

(0.020)

PREVDUR

-0.009

(0.001)

NOPARTIC

-0.042

(0.018)

SELFEMP

-0.107

(0.033)

PARTTIME

-0.060

(0.028)

MARRIED

0.140

(0.017)

OKHEALTH

0.428

(0.014)

AGE

-0.050

(0.004)

AGESQ*10-2

0.062

(0.005)

VOCATIONAL D.

0.083

(0.013)

UNIVERSITY D.

0.106

(0.033)

LOGINCOME

0.208

(0.017)

CHANGEINC

0.018

(0.022)

1986

-0.027

(0.020)

1987

-0.127

(0.020)

1988

-0.191

(0.020)

1989

-0.219

(0.021)

Observations

24055

 

Таблица А2 (раздельное оценивание по мужчинам и женщинам)

 

 

 

Male

Female

coeff.

s.e.

coeff.

s.e.

Constant

2.273

(0.246)

1.259

(0.234)

UNEMP

-0.402

(0.063)

-0.118

(0.089)

UNEMP*AGE<29

-0.321

(0.105)

-0.064

(0.126)

UNEMP*AGE30-49

-0.245

(0.085)

-0.175

(0.109)

UNEMPDUR

-0.003

(0.010)

-0.010

(0.018)

UNEMPDURSQ*10-2

-0.013

(0.028)

0.042

(0.064)

PREVDUR

-0.010

(0.001)

-0.008

(0.001)

NOPARTIC

-0.273

(0.035)

0.056

(0.024)

SELFEMP

-0.087

(0.038)

-0.155

(0.069)

PARTTIME

-0.180

(0.129)

-0.001

(0.031)

MARRIED

0.133

(0.024)

0.110

(0.026)

OKHEALTH

0.409

(0.021)

0.426

(0.021)

AGE

-0.063

(0.006)

-0.049

(0.006)

AGESQ*10-2

0.078

(0.007)

0.062

(0.007)

VOCATIONAL D.

0.066

(0.019)

0.093

(0.019)

UNIVERSITY D.

0.086

(0.040)

0.174

(0.059)

LOGINCOME

0.165

(0.024)

0.253

(0.025)

CHANGEINC

0.014

(0.030)

0.015

(0.031)

1986