Имя материала: Эконометрика для начинающих (Дополнительные главы)

Автор: Носко Владимир Петрович

1.2. использование метода максимального правдоподобия для оценивания моделей бинарного выбора

 

Итак, пусть наша задача состоит в оценивании параметров модели бинарного выбора

y, = G(elx,l + L + epx,p )+є ,   , = ^--^n , где      G(z)   -  S-образная  функция  распределения, имеющего плотность   g (z ) = G '(z).   В   соответствии  с   введенными выше

обозначениями          elxl +   +epxip = xT в, так что

G(el x д +     +epx p ) = G(xTe).     Мы     предполагаем,     что при

фиксированных значениях объясняющих переменных в n наблюдениях,    что    соответствует    фиксированным значениям векторов   xi,   случайные   ошибки           £1,,..,en статистически

независимы и E (eixi) = 0 , так что P{yi = l| xi }= E (y,xt) = G(xT в). Тогда   при   фиксированных   xi    статистически   независимы и

случайные величины  g{)1 xu Н     +~epxjp )+et,      i = 1,,..,n , т.е.

статистически независимы y1, к, yn . В силу этого (условная при фиксированных xi, i = 1, к, n ) совместная вероятность получения конкретного набора наблюдений y1,...,yn (конкретного набора нулей и единиц) равна произведению

П (ГУ, = 1 x t [Pyt = 0 x, Г* = П     (1 - G[xTef-yi .

i=1 i=1

Правая часть этого выражения является при фиксированных xi, i = 1, к, n , функцией от вектора неизвестных параметров в,

Ь(в) = L(ex1, к, xn) = П {GG{xTв))Уі (1 - G{xTв))1-yi

i=1

и интерпретируется как функция правдоподобия параметров в1,к,вр . Дело в том, что при различных наборах значений в1,,..,вр

получаются различные L()), т.е. при фиксированных xi, i = 1, к,n , вероятность наблюдать конкретный набор значений y1, к, yn может быть более высокой или более низкой, в зависимости от значения в . Метод максимального правдоподобия предлагает в качестве оценки

вектора параметров в использовать значение в = в, максимизирующее функцию правдоподобия, так что

Lip) = max      = max f[ [g{xt в))Уі {1 - g{xt в)) 1~Уі

i=1

Использование свойства монотонного возрастания функции ln(z), позволяет найти то же самое значение в, максимизируя логарифмическую функцию правдоподобия lnL{0). В нашем случае

lnL(6) = Jy, lnG(xT6)+ J(1 - yi )ln(1 - G(xf #)).

i=1 i=1

Мы не будем углубляться в технические детали соответствующих процедур максимизации, имея в виду, что такие процедуры "встроены" во многие прикладные пакеты статистических программ для персональных компьютеров и читатель при необходимости может ими воспользоваться. Заметим только, что если не имеет место чистая мультиколлинеарность объясняющих переменных (т.е. если матрица X = (xiJ-) значений p

объясняющих переменных в n наблюдениях имеет ранг p , так что

ее столбцы линейно независимы), то тогда функция L(0) имеет

единственный локальный максимум, являющийся и глобальным максимумом, что гарантирует сходимость соответствующих итерационных процедур к оценке максимального правдоподобия.

Мы рассмотрим теперь результаты применения метода максимального правдоподобия для оценивания параметров а и 0 моделей

yi = G(a + 0xi )+єі,  i =1n, по упомянутым выше смоделированным данным. При этом мы используем   предусмотренную   в   пакете      Econometric Views (EVIEWS) возможность выбора в качестве G(z) функций

1      Г  -t2 /2

Ф(z) =  ■     I e      dt -  функция стандартного нормального 42л

распределения N(0,1) (пробит-модель),

ez

Л( z) =             -   функция   стандартного логистического

1 + ez

распределения (логит-модель),

G(z) = 1 - exp(- ez) - функция стандартного распределения экстремальных значений (минимума) I-го типа (распределение Гомпертца, гомпит-модель).

Заметим, что функции плотности первых двух распределений являются четными функциями (графики этих плотностей симметричны относительно оси ординат), тогда как функция плотности последнего из трех распределений не обладает таким свойством. Ее график асимметричен и скошен в сторону отрицательных значений аргумента.

Результаты оценивания указанных трех моделей по смоделированным данным (1000 наблюдений) с использованием пакета EVIEWS таковы:1

 

В четвертом столбце приведены значения отношений оценок коэффициентов к стандартным ошибкам, рассчитанным по асимптотическому нормальному распределению оценок максимального правдоподобия. В связи с этим, здесь и в последующих таблицах указанное отношение называется не t -статистикой, а z -статистикой. P-значения, приводимые в пятом столбце, соответствуют стандартному нормальному распределению.

Полученные значения оценок параметров а ив в первой модели (а = —3.503812, в = 0.003254) соответствуют оценкам ц = 1076.77 и о = 307.31 параметров функции нормального распределения, "сглаживающей" построенную ранее функцию Gn (x), график которой представляет ломаную. Заметим, что в действительности при моделировании данных мы использовали в качестве G(x) функцию нормального распределения с параметрами ц = 1100 и о = 300. Следующий график позволяет сравнить поведение

кусочно-линейной функции Gn (x),

теоретической      функции      G(x), соответствующей нормальному распределению N(1100, 3 002),

оцененной функции G(x), соответствующей нормальному распределению N(1076.77, 307.312).

На следующем графике добавлены для сравнения также и оцененные функции G(x) для логит- и гомпит-моделей

|                     G_N       THEOR           PR OBIT         LOGIT            GOMPit

Кривые, получаемые по пробит- и логит-моделям, отличаются очень мало как друг от друга, так и от теоретической кривой. В то же время кривая, полученная по гомпит-модели, представляется менее удовлетворительной. Разумеется, хотелось бы иметь некоторые количественные критерии для сравнения разных моделей и для проверки адекватности каждой из рассматриваемых моделей данным наблюдений. Мы займемся теперь этой проблемой.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 |