Имя материала: Эконометрика.Конспект лекций

Автор: Ангелина Витальевна Яковлева

Лекция № 24. цензурированные и стохастические объясняющие переменные

 

Объясняющая переменная называется цензурированной в том случае, если она представляет собой момент наступления интересующего нас события, а продолжительность исследования ограничена во времени.

Концепция цензурирования переменных или наблюдений впервые возникла в исследованиях, связанных с биологией и медициной. Однако на современном этапе развития науки метод цензурирования применяется во многих областях, например в социологии, демографии и др. В экономике с помощью цензурирования изучается время «выживания» новых предприятий или новой продукции, поступившей на рынок.

Существует понятие правого и левого цензурирования, которое определяется в зависимости от направления процесса цензурирования. Например, осуществляется проверка 100 однотипных предприятий по определенным параметрам, которая заканчивается через некоторое время. В данном случае применяется правое цензурирование, так как известно в какой момент процесс был начат и в какой конкретно момент времени, расположенный справа от точки начала проверки, он закончится. Левое цензурирование может применяться в биомедицинских исследованиях.

Цензурирование может быть однократное (наступающее в один момент времени) и многократное (наступающее в различные моменты времени). Например, проверка 100 предприятий может закончиться спустя фиксированный отрезок времени. Если процесс проверки завершился в определенный момент времени, то использовалось однократное цензурирование, а исследуемые данные были цензурированы один раз. Многократное цензурирование используется в биомедицинских исследованиях.

Существует цензурирование I и II типа. Цензурирование I типа применяется в тех ситуациях, когда процесс тестирования завершается в заранее известный момент времени. При проверке 100 предприятий процесс заканчивается через фиксированный отрезок времени.

Количество предприятий, не прошедших проверку по установленным критериям, является случайной величиной, а время эксперимента — величиной заранее известной. При цензурировании II типа процесс тестирования продолжается до тех пор, пока не будет достигнут предел по браку, т. е. при проверке 100 предприятий процесс будет закончен тогда, когда 15 предприятий не будут удовлетворять заданным критериям. Число забракованных элементов известно, а время эксперимента является величиной случайной.

Линейную модель регрессии с цензурированной зависимой переменной можно записать следующим образом:

Уі =00 +0ixi + ЄІ,

 

где Уі = У\%Уі > 0.

При цензурировании зависимой переменной пользуются методом усечения:

Оценки неизвестных коэффициентов модели регрессии с цен-зурированными переменными находятся с помощью метода максимума правдоподобия. В данном случае минимизируется логарифм функционала максимального правдоподобия вида:

1=inl=14іп2п * -2

(У* -xTв

11пФ

xT 0

Дифференцируя данный функционал по вектору неизвестных коэффициентов, получим оценки максимального правдоподобия

'вml.

Данные оценки могут получиться смещенными. Смещение устраняется с помощью изменения функционала максимального правдоподобия и приведения его к виду:

l = 1n L = 1іп

1          2І g

e v

11n

1-Ф

1

Стохастические объясняющие переменные

Первая предпосылка нормальной линейной регрессионной модели заключается в том, что независимые (объясняющие) переменные xi (i = 1, n) являются детерминированными (нестохастическими), т. е. неслучайными величинами. Однако на практике данная предпосылка не выполняется, так как объясняющие переменные сами были определены из других экономических моделей, а также могли быть ошибочно измерены.

Выделяют три вида моделей со стохастическими объясняющими переменными:

величины X и є распределены независимо друг от друга;

величины X и є одномоментно не коррелированы, т. е. объясняющие переменные зависят от случайной ошибки регрессии, но их значения на текущий момент времени не корре-лированы;

3)         величины X и є одномоментно коррелированы, т. е. значе-

ния объясняющих переменных и случайной ошибки регрес-

сии коррелируют в каждый момент времени.

Рассмотрим применение обычного метода наименьших квад-

ратов для перечисленных моделей исходя из предположения

о том, что средние значения и дисперсия объясняющей перемен-

ной в генеральной совокупности конечны. Однако следует учи-

тывать, что данное предположение не распространяется на моде-

ли временных рядов.

Пусть распределение х имеет конечное математическое ожидание и конечную дисперсию:

величины х и є распределены независимо друг от друга. Данное условие характерно для нормальной линейной регрессионной модели, например:

 

В данном случае МНК-оценки коэффициентов регрессии будут удовлетворять свойствам несмещенности, состоятельности и эффективности;

величины х и є одномоментно не коррелированы. В качестве примера подобной модели можно привести модель регрессии, включающую лаговую зависимую переменную как одну из объясняющих переменных.

Рассмотрим свойства МНК-оценок для авторегрессионной модели первого порядка:

у, =А +Дх+А у,-х+£t.

Текущая зависимая переменная yt и случайная ошибка et не коррелированны, однако регрессор yt —1 коррелирован со всеми предыдущими ошибками модели. В этом случае возникает вопрос о несмещенности МНК-оценки в2. Приведем первоначальное уравнение регрессии к виду:

y, =в0 + в2У, -1 +£i.

Тогда ^

в 2 =в2 + ~f-,

 

где      ^ 0, так как переменная коррелирована со всеми Syy      предыдущими ошибками.

 

Таким образом, МНК-оценка в2 является смещенной в конечных выборках при условии неодномоментного коррелирования величин x и є. Однако если объем выборки стремится к бесконечности, то МНК оценка в2 будет состоятельной:

p lim ~вг =в2 и J±^L^ 0,

где p lim означает предел по вероятности; 3) величины x и є одномоментно коррелированы. В данном случае даже при большом объеме выборочной совокупности МНК оценки будут смещенными и несостоятельными. При условии, что дисперсия x неограниченно возрастает, т. е. является бесконечной, оценить свойства МНК-оценок весьма затруднительно, так как Cov(x, є) не имеет предела. Выявить неслучайный характер объясняющих переменных можно с помощью графика остатков регрессионного уравнения: e =   — yt. Если остатки расположены в виде горизонтальной полосы, то регрессионные остатки e являются случайными величинами.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 |