Имя материала: Эконометрика для начинающих (Дополнительные главы)

Автор: Носко Владимир Петрович

1.8. модель тобит-11

 

В предыдущем разделе мы рассмотрели линейную модель наблюдений

price* =a + [3xi +стєі ,    i = 1, к, n,

в которой price* - цена, которую уплатила за покупку автомобиля

(автомобилей) i-я семья, если эта семья имеет автомобиль, или цена, которую уплатила бы за покупку автомобиля i-я семья, не имеющая автомобиля, если бы эта семья решила приобрести автомобиль. При этом мы предполагали, что i-я семья покупает автомобиль по цене

price*, если  price* > у. Таким образом, в этой модели решение о

приобретении или неприобретении собственного автомобиля определяется самой ценой, по которой предполагается приобрести автомобиль. В то же время мы могли бы рассмотреть и другую модель, в которой процесс принятия решения о стоимости покупаемого автомобиля отделен от процесса принятия решения о покупке автомобиля.

Пусть мы имеем дело с некоторым показателем у*, значения которого наблюдаются  не для всех i . Значение у* наблюдается,

если выполнено условие к* > 0, где к*    - некоторая функция полезности. Мы будем предполагать, что у* = xlft + єи,  i =      n ,

к = x2>A + Є2і ,    i = 1       П ,

где

x1i ={x11i, k,x1   i)   -   вектор   значений   p1 объясняющих

переменных в уравнении для у i ,

в1 = {д11,...,д1рі ) - вектор коэффициентов при этих переменных, x2i = (x21 i, к, x2p2 i)   -  вектор  значений   p2 объясняющих

переменных в уравнении для к*,

в2 = [б21,...,62p2) - вектор коэффициентов при этих переменных.

Случайные составляющие єи и є2і могут быть коррелированными, так что Cov{e1i ,є2і )^ 0. Следуя обычной практике,  мы  будем  предполагать,  что  двумерные случайные

векторы (єи,є2і) , і = 1,n , независимы в совокупности и имеют одинаковое двумерное нормальное распределение N2 (0, I) с нулевым вектором математических ожиданий и ковариационной матрицей

(

012 1

2

02 J

т.е.

 

Vf2i J

і'.і.й?. N2

0,*

 

12

22

01

2 JJ

Для нормализации функции полезности полагаем

2 =1.

Наблюдаемыми являются

значения объясняющих переменных

і = 1,к,n ;

значения переменной кі,

кі =

1, если к* > 0,

і

0,   если к* < 0; значения переменной уі, y,, если кі = 1,

 

x1 j,і' x2j,і'j = 1k' j

0,   если кі = 0.

 

Определенную таким образом модель называют стандартной Тобит-II моделью. Соответственно, о модели рассмотренной в предыдущем разделе, в этом контексте говорят как о стандартной Тобит-I модели.

З а м е ч а н и е

Объясняющие переменные в уравнениях для у* и к* могут

быть как одинаковыми, так и различными. В ряде ситуаций экономическая    аргументация    указывает    на необходимость

включения в правую часть уравнения для к* (уравнение выбора)

всех переменных, включенных в правую часть уравнения для у*. При этом коэффициенты при одной и той же переменной в уравнениях для у* и к* могут быть различными.

Если предположить, что x^i01 = x12i92 и e1i =£2i, то мы возвращаемся к стандартной Тобит-модели, рассмотренной в предыдущем разделе (модель Тобит-I).

Обращаясь опять к примеру с автомобилями, мы могли бы расмотреть,   например,   модели,   в   которых   значение price* определяется по той же формуле price* = а + в xi +<j£j,    i = 1,n,

но наличие автомобиля соответствует выполнению соотношения

к* >0, в котором

к* = y+SXj + ut, или, например,

К =7+SXi + fCd+ ui,

где man =1 , если главой семьи является мужчина, и man = 0 , если главой семьи является женщина.

 

Прежде всего заметим, что (при фиксированных значениях x1i,

X2i )

Е{у,к, = 1}= xfa + E[exhl = 1}= xlA + E^he2l > -x^2}= где, как и ранее,

Ж z) = <p(z ) 0>(z).

Если <712 = 0, то

E{yhl = 1}= х1і^1 .

Это означает, что если є1і и є2і не коррелированы, то можно,

игнорируя уравнение для к*, производить непосредственное оценивание уравнения регрессии

 

методом наименьших квадратов по наблюдениям с к{ = 1. Это приводит к состоятельному оцениванию значений x1^i91.

Однако если  <т12 ф 0, то при таком оценивании возникает

смещение оценки х1^ів1, пропорциональное величине ж{х12і92 ), которую называют в этом контексте лямбдой Хекмана.

Получить состоятельные и асимптотически эффективные оценки параметров модели Тобит-II можно, используя метод максимального правдоподобия, при котором соответствующая функция правдоподобия максимизируется по всем возможным значениям параметров модели 0ъ02,оъо12. Однако чаще такую модель оценивают, используя двухшаговую процедуру Хекмана. Она проста в вычислительном отношении и дает хорошие стартовые значения для итерационной процедуры максимизации функции правдоподобия.

Идея Хекмана состоит в использовании уже приводившегося выше соотношения

E{yk = 1}= Х?& +CX12/fc?2 )

и построения на его основе модели регрессии

У, = хЇА + a12X,+V, ,

где X - переменная, определяемая соотношением

х1=х{хт11вг )=<р(хт2&)/ ф(хт2А).

Если е1i не коррелирована с х1i и х2i, то V не коррелирована с х1i и X, так что эту модель регрессии можно оценивать методом наименьших квадратов. Проблема, однако, в том, что значения X не наблюдаются, поскольку неизвестен вектор коэффициентов 02 в модели выбора.

Оценивание вектора 02 производится в рамках пробит-модели бинарного выбора. При этом получаем оцененные значения X =х(хт§2) (первый шаг процедуры Хекмана). Эти оцененные значения используются затем на втором шаге процедуры вместо X .

Модель y t = х'тів1 + a12X +V оценивается методом наименьших квадратов; в результате получаем состоятельные (хотя и не эффективные) оценки для в1 и а12. Используя эти оценки, мы

получаем оцененное ожидаемое значение y t при заданных х1 t, х2 t и ht = 1 в виде

E{{ х1г , х2, , h, = 1}= х1Т 01 + aal2X(xT,^2 ) .

Если же нас интересует ожидаемое значение y при заданных х1 і , х2 t без условия h = 1, то оно оценивается величиной

E {yгХU, х 2, }= хТ<01.

 

Поскольку смещение при оценивании уравнения для у* методом наименьших квадратов вызывается коррелированностью е1 i и є2i, представляет интерес проверка гипотезы об отсутствии такой коррелированности в рамках модели, оцененной на втором шаге. Отметим только, что при проверке этой гипотезы следует производить коррекцию значений стандартных ошибок оценок, учитывающую гетероскедастичность модели и тот факт, что вместо переменной Я,  на втором шаге используется

предварительно оцененная переменная Я .

 

Заметим, наконец, что в описанной выше стандартной Тобит-II модели функция правдоподобия имеет вид

Ь(вх,в2—2) = П№ = OF"''(P[h, = 1}- f(yK = if ,

i=1

где f (ytyii = i) - условная плотность распределения случайной величины yt при ht = 1. Здесь

P[hl = 0} = 1 - ф(д2>2 ),

P{h = 1}- f (yK = 1)=p[{ = 1 y,}- f (y,),

 

 

f (y- )=-rr

^2 + {-12І — )yi - ХЇА

 

(y, - <A )

exp

2-2

Для начала итерационной процедуры в качестве стартовых можно взять значения оценок параметров, полученные в процессе реализации двухшаговой процедуры Хекмана.

П р и м е р 1

Пусть в примере с автомобилями наличие у семьи собственного автомобиля определяется условием w* > 2000, где

w* =-3600 + 8x, + 1800^2i, є21,...,є2Д000 ~ i.i.d. N(0,1).

Обозначив к* = w* — 2000, запишем это условие в виде к* > 0, где

к* = —5600 + 8 x, +1800 є2і,

и нормализуем функцию полезности, разделив обе части последнего равенства на 1800:

к* = —3.111 + 0.00445x, +є2і.

Пусть "потенциальная цена" автомобиля для i-й семьи определяется уравнением

price*, = 4000 + 6xi +є1і , єп,...,є1Д000 ~ i.i.d. N(0,10002). В   смоделированной   выборке   пары    (є11,є21 ),..., (є1 1000,є21000 ) взаимно независимы, но Соу(єи ,є2і ) = 707, так что коэффициент корреляции случайных величин є1і ,є2і равен р12 = 0.707.

В принятых выше общих обозначениях модели Тобит-II получаем:

у* = ^11x11,i + ^12x12,i +є1і ,   кі = ^21x21,i + ^22 x22,i + є2і , где    x11,i = x21,i = u x12,i = x22,i = xi,  °11 = 4000, °12 = ^  °21 =—3.111,

<922 = 0.00445; при этом a1 = 1000, o2 = 1, <r12 = 707.

Применяя к смоделированным данным двухшаговую процедуру Хекмана, получаем на первом шаге оцененное уравнение

к* = —3.450 + 0.00476 xt, а на втором шаге - оцененное уравнение

price*] = 3936.2 + 5.995xi.

Используя полученные оценки параметров в качестве стартовых значений итерационной процедуры максимального правдоподобия, приходим к уравнениям

к* =-3.483 + 0.00480 x,,

price* = 4159.3 + 5.828хі.

При этом получаем также <т1 = 1010.7, Д2 = 0.598 .

Как видим, оцененные значения параметров достаточно близки к значениям, при которых производилось порождение данных. Приведем теперь графики, иллюстрирующие полученные результаты.

1.2 п

1

0.8

0.6 -j 0.4

0.2 0

 

о Hi H_F

18000 16000 -j

14000 12000 10000 8000 6000

4000 2000

0

 

о Y_STAR ■ Y_STAR_F582

 

S89d У VIS       d У VIS Л ■ У VIS Л°

i ватаг j

 

96

 

П р и м е р 2

В условиях Примера 1 перемоделируем данные с измененной функцией полезности, полагая теперь h* =_4 + о.оозx + 2(dman),. + є2і,

где dman = 1, если главой семьи является мужчина, и dman = 0, если главой семьи является женщина.

Применяя к новым смоделированным данным двухшаговую процедуру Хекмана, получаем на первом шаге оцененное уравнение

к* =-4.280 + 0.00297 x, + 2.347(dman)., а на втором шаге - оцененное уравнение

price* = 3879.97 + 6.124xI.

При этом получаем также ст1 = 984.2, Д2 = 0.643.

Как видим, и здесь оцененные значения параметров достаточно близки к значениям, при которых производилось порождение данных. Приведем для сравнения наблюдаемые значения переменной yi и оцененные ожидаемые значения этой переменной (Y_EXPECTED_F).

Обратим внимание на две ветви графика оцененных ожидаемых значений yi. Верхняя ветвь соответствует семьям, которые возглавляют мужчины, а нижняя - семьям, которые возглавляют женщины.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 |