Имя материала: Путеводитель по современной эконометрике

Автор: Вербик Марно

6.4. метод квази-максимального правдоподобия и тесты моментных условий

Это существенно, что метод максимального правдоподобия требует полностью определенных предположений об общем виде анализируемых распределений, тогда как для применения обобщенного метода моментов (ОММ), обсужденного в предыдущей главе, делаются предположения только о моментах этих распределений. Однако, возможно, что моментные условия, используемые в подходе ОММ, могут также опираться на предположения о форме распределения. Это позволяет нам воспроизводить ММП-оценку в виде ОММ-оценки с моментными условиями, соответствующими условиям первого порядка максимального правдоподобия. Такое обобщение полезно, поскольку позволяет нам утверждать, что в некоторых случаях оценка максимального правдоподобия состоятельна, даже если функция правдоподобия не полностью корректна (но корректны условия первого порядка). Кроме того, это позволяет нам расширить класс тестов множителей Лагранжа на случай тестов моментных условий.

 

6.4.1. Метод квази-максимального правдоподобия

В этом пункте данного параграфа мы увидим, что ММП-оценку можно интерпретировать как ОММ-оценку, отметив, что условия первого порядка проблемы максимального правдоподобия соответствуют выборочным средним, основанным на теоретических моментных условиях. Отправной точкой является справедливость равенства

E{si(0)} = 0 (6.41)

для истинного if-мерного вектора параметров 6 при предположении, что функция правдоподобия корректна. Доказательство этого равенства относительно легкое и поучительное. Если мы рассматриваем функцию плотности переменной yi при заданном векторе

объясняющих переменных #г, /(Уг|^г5 9) > то по построению справедливо, что (см. Приложение Б),

/

f{yi[Xi 9) dyi = 1,

I

где интегрирование проводится по несущему множеству*^ уі. Дифференцируя по вектору параметров 0, получаем

df(yixi)

dyi = 0.

дв

Поскольку

/(Уіхі, в) = 8і(6)/(уіхі; в),

dftViW, 0) = dogf(yixi; в)

дв дв то из этого следует, что

I

Si(e)f(yixi;e) dVi = Е{8і{в)} = 0,

где первое равенство следует из определения оператора математического ожидания.

Предположим, что вектор неизвестных параметров в однозначно определяется этими условиями. То есть, существует только один вектор 0, который удовлетворяет условию (6.41). Тогда условие (6.41) является совокупностью действительно имеющих место моментных условий, и для оценивания вектора неизвестных параметров 9 мы можем использовать ОММ-подход. Так как число параметров равно числу условий моментов, то это сводится к решению условий первого порядка

^ £>w=°-

Конечно, такое решение воспроизводит ММП-оценку для вектора параметров 9. Однако, оно показывает, что получающаяся оценка для вектора параметров 9 состоятельна при условии, что условие (6.41) корректно, которое, возможно, более слабое, чем требование правильной спецификации всего распределения. В линейной модели регрессии с нормальными остатками условия первого порядка относительно вектора параметров /3, как легко заметить, соответствуют равенству

Е{(Уі-х'г(3)хі} = 0,

*)

То есть по всем возможным значениям     (примеч. научн. ред. перевода).

которое в свою очередь соответствует совокупности моментных условий, налагаемых МНК-оценкой. Тем самым объясняется, почему ММП-оценка в нормальной линейной модели регрессии состоятельна, даже если распределение остатка Єі не является нормальным.

Если ММП-оценка основана на неправильной функции правдоподобия, но можно аргументировать, что она состоятельная на основе справедливости условия (6.41), то такая оценка иногда называется оценкой квази-максимального правдоподобия (КММП-оценкой) или оценкой псевдо-максимального правдоподобия (см. (White, 1982) или (Gourieroux, Monfort, Trognon, 1984)). Асимптотическое распределение КММП-оценки может отличаться от асимптотического распределения ММП-оценки. В частности, результат для асимптотической ковариационной матрицы (6.16) может больше не быть справедливым. Используя наши общие формулы для ОММ-оценки, можно получить асимптотическую ковариационную матрицу КММП-оценки для вектора неизвестных параметров предполагая, что условие (6.41) корректно. Из результатов по асимптотическому распределению (5.74)-(5.76) следует, что КМПП-оценка 9 удовлетворяет

 

где8)

у = 1(9)-Ч(9)1(9)- (6.42)

 

m - Е~Ж] - Е           d9dF~y

как это определено в (6.17), и

J(6) = Е{8і(в)8і(ЄУ},

как в определении (6.19). Ковариационная матрица (6.42) обобщает ковариационную матрицу (6.16) и корректна всякий раз, когда КММП-оценка 9 состоятельна. Например, в случае линейной модели регрессии оценивание ковариационной матрицы на основе выражения (6.42) воспроизводило бы состоятельную ковариационную матрицу при наличии гетероскедастичности, которая обсуждалась в п. 4.3.4. Некоторые пакеты программного обеспечения имеют опцию

 

Для обеспечения справедливости формулы (6.42) сохраняется предположение, что наблюдения являются взаимно независимыми.

вычисления робастных стандартных ошибок для (К)ММП-оценок, основанных на выражении ковариационной матрицы (6.42).

Информационный матричный тест (ИМ-тест), предложенный в статье Уайта (White, 1982), тестирует равенство двух К х К матриц 1(9) и J(9) с помощью сравнения их выборочных аналогов. Из-за симметрии следует проводить сравнение максимум К(К + 1)/2 элементов, так что степени свободы для ИМ-теста потенциально очень большие. В зависимости от вида функции правдоподобия с помощью ИМ-теста проводится проверка на неправильную спецификацию одновременно по ряду направлений (как, например, функциональный вид, гетероскедастичность, асимметрия и эксцесс). Для дополнительного обсуждения и описания вычислительных проблем, см. (Davidson, MacKinnon, 1993, Section 16.9).

 

6.4.2. Тесты моментных условий

Анализ, содержащийся в предыдущем пункте данного параграфа, позволяет нам обобщить класс тестов множителей Лагранжа на случай так называемых тестов моментных условий (МУ-тестов), которые предложены в статьях (Newey, 1985) и (Tauchen, 1985). Рассмотрим модель, определяемую условием (6.41)

Е{8і(в)} = О,

где (К)ММП-оценка 9 удовлетворяет соотношениям:

 

i=l

Теперь рассмотрим гипотезу, определяемую условием

Е{гщ(9)} = 0, (6.43)

где rrii(9) — J-мерная функция данных и неизвестных параметров в векторе 9, подобная Si(9). Различие состоит в том, что при оценивании условие (6.43) не накладывается. Обоснованность гипотезы (6.43) можно протестировать, проверяя близок ли к нулю ее выборочный аналог

 

i=l

Это может быть сделано довольно легко, если подметить сходство между выражением (6.44) и метками более общей функции правдоподобия. Следовательно, ВПГ-версию теста моментных условий (6.43) можно вычислить, взяв iV, умноженное на нецентрированный R2 регрессии вектора единиц по столбцам матрицы *S, где S теперь имеет строки вида

[зі(вУ пнів)'].

При нулевой гипотезе (6.43) получающаяся критическая статистика имеет асимптотическое хи-квадрат распределение с J степенями свободы.

Вышеупомянутый подход показывает, что дополнительные условия, которые тестируются, не обязательно должны соответствовать меткам более общей функции правдоподобия. Специфической областью, где этот подход полезен, является тестирование гипотезы нормальности.

 

6.4.3. Тестирование гипотезы нормальности

Снова рассмотрим линейную модель регрессии при нулевой гипотезе нормальных остатков. Для непрерывно наблюдаемой переменной тесты на нормальность обычно проверяют асимметрию (третий момент) и избыточный эксцесс (четвертый момент), поскольку нормальное распределение подразумевает, что Е{е\} = 0 и Е{е — Зет4} = 0 (см. Приложение Б). Если Е{е\} Ф О, то распределение остатка є і не является симметричным относительно нуля. Если Е{е4 — За4} > 0, то распределение остатка Єі как говорится, показывает избыточный эксцесс. Это означает, что распределение остатка є і имеет более тяжелые хвосты, чем нормальное распределение. В книге (Davidson, MacKinnon, 1993, p. 63) представлены графические примеры таких ситуаций.

Учитывая обсуждение из предыдущего пункта параграфа, тест на нормальность можно получить, сначала построив регрессию вектора единиц по столбцам матрицы 5, которая теперь имеет строки вида

[егх>   є?-а2   П ег4-3а\%

где є і обозначает ММП-оцененный остаток (или МНК-остаток), и затем, вычислив iV, умноженное на нецентрированный R2. Хотя ненормальность остатка Єі не приводит к несправедливости свойств ни состоятельности МНК-оценки, ни ее асимптотической нормальности, вышеупомянутый тест иногда представляет интерес. Показание, что остаток є і имеет весьма скошенное распределение, может указать на возможно желательное преобразование зависимой переменной до

оценивания (например, рассматривая логарифмическую заработную плату, а не саму заработную плату). В главе 7 мы увидим классы моделей, где нормальность играет намного более важную роль.

Популярным вариантом МЛ-теста на нормальность является тест Джарка—Вера (Jarque и Вега, 1980). Критическая статистика имеет вид

£,мл = т

1 / 1 N є32 1 / 1 N є4 42

6 V TV ) +24V7vS^4~

4      г=1       '  4 i=l

(6.45)

т. е. является взвешенным средним квадратов выборочных моментов, соответствующих асимметрии и избыточному эксцессу, соответственно. При нулевой гипотезе критическая статистика имеет асимптотическое хи-квадрат распределение с двумя степенями свободы; более подробное описание см. в (Godfrey, 1988, Sect. 4.7).

 

Упражнения

Упражнение б. 1 (нормальная линейная регрессионная модель)

Рассмотрим следующую линейную модель регрессии

Уі = /Зі + (32Хі + Єі,

где (3 = (З2У — вектор неизвестных параметров, а Хі — одномерная наблюдаемая переменная. Мы имеем выборку из г = 1,..., N независимых наблюдений и предполагаем, что остатки Єі являются НОНР(0, <т2), независимыми от всех Хі. Тогда функция плотности у і (при заданном Х{) имеет вид

 

а. Приведите выражение для вклада в логарифм правдоподобия наблюдения г, log Li(fi, а2). Объясните, почему логарифмическая функция правдоподобия для всей выборки имеет вид

n

logm ^2) = ]TlogL;(A a2).

г=і

*  ^      d log Li(/?, a2)

о. Определите выражения для двух элементов —         и

о(3

покажите, что при истинных значениях параметров оба имеют нулевое математическое ожидание.

в. Получите выражение для

<91ogL,(/3, a2) 8a2

и покажите, что при

истинных значениях параметров оно также имеет нулевое математическое ожидание.

Предположим, что Хі — фиктивная переменная, равная 1 для мужчин и 0 для женщин такая, что Хі = 1 для і = 1,... , N± (первые N наблюдений) и Хі = О для і — N + 1,... , N.

г. Получите условия первого порядка для функции максимального правдоподобия. Покажите, что ММП-оценки для вектора неизвестных параметров /3 имеют вид

Какова интерпретация этих двух оценок? Какова интерпретация значений истинных параметров /Зі и /З2?

д. Покажите, что

д2оёи((3,а2) = д2 log LjjP, а2)

dp да2            да2 др

и покажите, что эти частные производные второго порядка имеют нулевое математическое ожидание. Каковы следствия из этого результата для асимптотической ковариационной матрицы ММП-оценки (ДьДз,?2)? е. Представьте два способа оценивания асимптотической ковариационной матрицы для (Pi, fa)' и сравните результаты, ж. Представьте альтернативный способ оценивания асимптотической ковариационной матрицы для (/Зі, (З2У, который позволяет остатку Єі быть гетероскедастичным.

Предположим, что мы интересуемся гипотезой Но : /З2 = 0 против альтернативной гипотезы Н : /З2 ф 0. Тесты могут быть основаны на принципе отношении правдоподобия, множителей Лагранжа или на принципе Вальда.

з.         Объясните, каковы эти три принципа.

и.         Обсудите для каждого из трех тестов, что требуется для их

вычисления.

Хотя три критических статистики имеют одно и то же асимптотическое хи-квадрат распределение, можно показать (см., например, (Godfrey, 1988, Sect. 2.3)), что для вышеприведенной модели при любой конечной выборке справедливо, что

£б < £ол < £>мл-

к. Объясните, что означает мощность теста. Что данное неравенство говорит нам о мощности трех критериев? (Подсказка: если требуется, то обратитесь к главе 2.)

л. Объясните, что означает (фактический) размер теста. Что данное неравенство говорит нам о размерах трех тестов?

м. Предпочли бы вы один из этих трех критериев, зная вышеприведенное неравенство?

 

Упражнение 6.2 (пуассоновская регрессионная модель)

Пусть уі обозначает, сколько раз индивидуум і покупает табак в данном месяце. Предположим, что имеется случайная выборка из n индивидуумов, для которых мы наблюдаем значения 0,1,2,3,... . Пусть Хі будет наблюдаемой характеристикой этих индивидуумов (например, пол). Если мы предполагаем, что для данного Хі переменная уі имеет распределение Пуассона с параметром = exp {fii+foxi} (см., например, (Greene, 2000, Sect. 19.9)), то функция вероятностной меры переменной у і , условной по Хі , имеет вид

е~ХіХу

Р{Уі = ухі} =  1 .

а.         Напишите логарифмическую функцию правдоподобия для этой

так называемой пуассоновской регрессионной модели.

б.         Получите вектор меток. Используя тот факт, что распределение

Пуассона подразумевает Е{уіхі] = Хі, покажите, что метка

имеет нулевое математическое ожидание.

в.         Получите выражение для информационной матрицы /(/Зі, /З2)•

Используйте ее для определения асимптотической ковариаци-

онной матрицы для ММП-оценки и для вывода состоятельной

оценки для этой матрицы.

г.          Опишите, как можно построить тест на «пропущенную» в моде-

ли объясняющую переменную, используя схему критерия мно-

жителей Лагранжа. Какая вспомогательная регрессия необхо-

дима?

 

7         

В практических приложениях часто приходится описывать явления, которые имеют дискретную или смешанную дискретно-непрерывную природу. Например, можно интересоваться объяснением, имеют ли оплачиваемую работу (да или нет) замужние женщины и сколько часов они работают (нуль или более). Если требуется объяснить такой тип переменной, то, в общем, линейная модель регрессии неприемлема. В этой главе мы рассмотрим альтернативные модели, которые можно применить для моделирования дискретных и дискретно-непрерывных переменных, и уделим внимание оцениванию и интерпретации их параметров.

Хотя и не всегда, но во многих случаях проблемы, анализируемые с помощью моделей такого типа, имеют микроэкономическую природу и таким образом, требуются данные относительно индивидуумов, домашних хозяйств или фирм. Чтобы подчеркнуть это, мы проиндексируем все переменные индексом г, пробегающим целочисленные значения от 1 до объема выборки N. Параграф 7.1 начинается, возможно, с самого простого случая ограниченной зависимой переменной модели, то есть с модели бинарного выбора. Распространение на множественные дискретные исходы обсуждается

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 |