Имя материала: Введение в эконометрику

Автор: Кристофер Доугерти

Состоятельность

 

Вообще говоря, если предел оценки по вероятности равен истинному значению характеристики генеральной совокупности, то эта оценка называется состоятельной. Иначе говоря, состоятельной называется такая оценка, которая дает точное значение для большой выборки независимо от входящих в нее конкретных наблюдений.

В большинстве конкретных случаев в этой книге несмещенная оценка является и состоятельной. Для этого можно построить контрпримеры, но они, как правило, будут носить искусственный характер.

Иногда бывает, что оценка, смещенная на малых выборках, является состоятельной (иногда состоятельной может быть даже оценка, не имеющая на малых выборках конечного математического ожидания). На рис. 0.12 показано, как при различных размерах выборки может выглядеть распределение вероятностей. Тот факт, что при увеличении размера выборки распределение становится симметричным вокруг истинного значения, указывает на асимп

тотическую несмещенность. То, что в конечном счете оно превращается в единственную точку истинного значения, говорит о состоятельности оценки.

Как мы увидим далее в этой книге, оценки типа показанных на рис. 0.12 весьма важны в регрессионном анализе. Иногда невозможно найти оценку, несмещенную на малых выборках. Если при этом вы можете найти хотя бы состоятельную оценку, это может быть лучше, чем не иметь никакой оценки, особенно если вы можете предположить направление смещения на малых выборках.

Нужно, однако, иметь в виду, что состоятельная оценка в принципе может на малых выборках работать хуже, чем несостоятельная (например, иметь большую среднеквадратичную ошибку), и поэтому требуется осторожность. Подобно тому, как вы можете предпочесть смещенную оценку несмещенной, если ее дисперсия меньше, вы можете предпочесть состоятельную, но смещенную оценку несмещенной или несостоятельную оценку им обеим (также в случае меньшей дисперсии).

 

Полезное правило

Иногда оценка рассчитывается как отношение двух величин, имеющих случайные составляющие, например:

Z = X/Y, (0.35)

где Хн Y— величины, рассчитанные по данным выборки. Обычно трудно сказать что-либо определенное о математическом ожидании величины Z Вообще говоря, она не равна частному от деления Е(Х) на Е(У). Если Ус некоторой вероятностью может равняться нулю, то математическое ожидание Z не может быть даже определено. Если, однако, Хи Устремятся к конечным величинам plim X и plim Y на больших выборках и plim Y не равен нулю, величина Z будет стремиться к отношению plim A/plim Y. Следовательно, даже если нельзя сказать что-либо определенное о свойствах Z на малых выборках, мы иногда можем судить о ее состоятельности.

Предположим, например, что теоретические средние двух случайных переменных и У равны 1Х и ]iY соответственно и что обе они подвержены случайным воздействиям, так что

X = vlx+ux, (0.36) Y = VLY+uy, (0.37)

где их и иу — случайные составляющие с нулевым средним. Если мы по выбо-

рочным данным хотим оценить отношение          то оценка Z = X / Y будет

состоятельной, поскольку

p\mZ = р\тХ / p\mY - хх / iY, (0.38)

и можно сказать, что Z является хорошей оценкой для больших выборок, хотя, возможно, для малых выборок о E(Z) нельзя сказать ничего.

 

Упражнения

0.14. Является ли несмещенность необходимым или достаточным условием состоятельности?

0.15. Случайная величина Л" принимает значения J и 4с равными вероятностями. Случайная величина ^принимает значения 1 и 2также с равными вероятностями. Величины X и У распределены независимо друг от друга. Переменная Zoпpeдeляeтcя как Z= X/Yvl имеет четыре возможных значения, каждое с вероятностью 0,25:

Покажите, что E(Z) не равно E(X)/E(Y).

0.16. Величины X и Y являются выборочными средними XwYt определенных как в предыдущем упражнении. Величина Z— оценка отношения теоретических средних и определяется как X / Y. К какому значению будет стремиться Z на большой выборке?

0.17. Выполните предыдущие два упражнения, предположив, что Y может принимать значения 0 и 1 с равными вероятностями.

Приложение 0.1

 

Обозначения с использованием знака I: обзор

 

Обозначения с использованием знака I дают возможность быстрой и удобной записи ряда из подобных членов. Для чтения данной книги необходимо знакомство с такой записью, и здесь дается краткий обзор для тех, кому нужно освежить это в памяти.

Начнем с примера. Предположим, что объем выпуска лесопилки, измеренный в тоннах, за месяц і составляет причем qx — общий выпуск в январе, q2 — общий выпуск в феврале и т. д. Обозначим годовой выпуск как Z Тогда

Z = Я + Яг + Яз + Я А + Я5 + Яв + Яі + ?8 + Я9 + Я 0 + Я 1 + Я 2 •

Можно «просуммировать» это выражение на словах, сказав, что Z есть сумма величин qt (от q{ до д12). Очевидно, при определении Zhct необходимости записывать все 12 слагаемых. Иногда мы будем упрощать запись, представляя сумму в таком виде:

 

имея в виду, что все пропущенные члены включаются в суммирование.

Запись с использованием знака Z позволяет выразить эту сумму в удобной, аккуратной форме:

12

 

Выражение справа от знака £ говорит о том, какого вида члены суммируются, в данном случае это члены вида qr Под знаком Z записывается индекс, который меняется при суммировании (в данном случае /), и его начальное значение (в данном случае 1). Таким образом, мы знаем, что первым слагаемым является qv Знак равенства указывает, что индекс / для первого слагаемого должен равняться единице.

Над знаком Z записывается последнее значение / (в данном случае 12), и, таким образом, мы знаем, что последним слагаемым является qn. Автоматически ясно, что все промежуточные члены между qx и q{2 также должны быть включены в суммирование, и мы получаем удобно переписанное второе определение Z.

Предположим, что средняя цена за тонну продукции лесопилки за месяц і равна р.. Общая стоимость выпуска за месяц і равна p.qp а стоимость выпуска за год составляет V, где V рассчитывается по формуле:

V = РІЇІ + ... + РпЯп-

Теперь мы суммируем члены вида pfqn где нижний индекс / меняется от 1 до 12, и при использовании знака I это выражение может быть записано таким образом:

 

Если с{ — общие издержки работы лесопилки за месяц /, то прибыль за месяц

/ будет равна  с) и, следовательно, общая прибыль за год (П) записы-

вается как

П = {рЯ - q)+...+ {рпЯп - сп), что можно обобщить в виде:

12

 

/=1

Заметим, что выражение для прибыли можно также переписать как разность общего дохода и общих издержек:

П = {рЯ +... + РпЯп) - (с +... + С[2 )> и с использованием знака X это выражение обобщается в виде:

12 12

 

/=1 /=1

Если цена продукции в течение года постоянна и равна р, то выражение для стоимости годового выпуска можно упростить:

12

V = pqx+...+ pqn = p(qx +... + qn) =

/=1

Следовательно,

12 12

 

/=1 /=1

Если выпуск в каждом месяце постоянен и равен q, то выражение для годового выпуска также можно упростить:

Z = qx +...+ tf12 =?+...+ 0 = 12g.

Следовательно, в этом случае

12

2>,=12tf.

/=1

Мы проиллюстрировали три правила, которые могут быть записаны формально.

Правило суммирования 1 (проиллюстрировано разложением прибыли на общий доход минус общие издержки):

 

5>/+^/) = 1>/+1>г

/=1       /=1 /=1

Правило суммирования 2 (проиллюстрировано выражением V в случае постоянной цены):

п п (=1 ;=1

если а постоянно. 30

Правило суммирования 3 (проиллюстрировано выражением Z в случае постоянного объема выпуска):

п

 

/=1

если а постоянно.

Часто из контекста ясно, каковы начальный и конечный суммируемые члены. В этом случае выражение

 

X*/

/=1

часто упрощается до їх,.. Далее, часто столь же очевидно, какой индекс меняется при суммировании, и все выражение упрощается до їх.

Иногда приходится выполнять суммирование внутри другого суммирования, что требует дальнейших пояснений. В принципе это нетрудно, но поскольку такие операции не выполняются в данной книге, мы не будем их рассматривать.

 

Приложение 0.2

Математическое ожидание и дисперсия непрерывной случайной переменной

Определение математического ожидания непрерывной случайной переменной очень похоже на соответствующее определение дискретной случайной величины:

E(x)=jtf(x)dx,

где интегрирование производится на всем интервале, где определена функция /(х).

В обоих случаях разные возможные значениях взвешиваются по соответствующим им вероятностям. Для дискретной случайной величины суммирование осуществляется на основе последовательного перебора возможных значений х. В непрерывном случае это, конечно, производится на непрерывной основе, суммирование заменяется интегрированием, и значения вероятностей pf заменяются значениями функции плотности вероятности /(х). Принцип, однако, сохраняется тот же.

Дискретная

Непрерывная

возможным значениям

В разделе, посвященном дискретным случайным величинам, показано, как рассчитать математическое ожидание функции g (х) — функции случайной величины х. Берется список всех разных значений, которые может принимать g(x), каждое взвешивается по соответствующей ему вероятности, и произведения суммируются.

Процедура для непрерывной случайной величины точно такая же, с той лишь разницей, что теперь она осуществляется на непрерывной основе, что означает суммирование путем интегрирования вместо 1-суммирования. Для дискретной случайной величины Е {g (х)} = Ъ g (x)pi9 где суммирование производится по всем возможным значениям х. В непрерывном случае оно определяется как

£{g(x)}=jg(x)Ax)dc

где интегрирование производится по всей области определения f(x).

Что касается дискретных случайных переменных, то здесь есть одна функция, которая особенно нас интересует, — теоретическая дисперсия. В обзоре она была определена как математическое ожидание (х — ц)2, где ц — теоретическое среднее (то же самое, что Е(х)). Чтобы рассчитать дисперсию, нужно просуммировать значения (х — |i)2, взвешенные по соответствующим вероятностям, по всем возможным значениям х. Применительно к непрерывной случайной переменной это означает, что нужно вычислить а2 — теоретическую дисперсию х:

а2 = Е{(х - ц)2} =j(x - x)2f(x)dx.

В познавательных целях было бы полезным сравнить это равенство с уравнением (0.9), где дано аналогичное выражение для дискретной случайной переменной (переверните несколько страниц назад и проверьте).

Как и ранее, при расчете теоретической дисперсии вы можете вычислить теоретическое стандартное отклонение (а) путем простого извлечения из нее квадратного корня.

 

Приложение 0.3

 

Доказательство того, что s2 — несмещенная оценка теоретической дисперсии

 

В табл. 0.5 указано, что несмещенная оценка а2 рассчитывается по формуле s2, где

s2 = -^l(xi-x)2.

Приступим к доказательству, переписав (Xj-x)2 в более сложном, но полезном виде:

(*, - х)2 = {(*, - АО - 6 - а*)}2 = (*/ - и)2 - 2(*/ - ii)(x - ц) + (і - //)2

 

(при раскрытии скобок х сократятся). Следовательно,

X (х,- - х)2 = X (X/ - д)2 - 2(х - ц)Х (*/ - ц) 4- л(х - ц)2.

Первое слагаемое здесь есть сумма первых слагаемых предыдущего уравнения, записанная с использованием знака I. Аналогично второе слагаемое здесь есть сумма вторых слагаемых предыдущего уравнения, вновь с использованием знака £ и того факта, что (х - ц)2 — общий множитель. Перейдя к суммированию третьих членов предыдущего уравнения, отметим, что все они равны (*-/02 и поэтому нет необходимости использовать знак Z.

Вторая составляющая может быть переписана как -2л(х-д)2, поскольку

Х(Х/ -Д) = Хх,- — п)1 = пх — п]1 = A7(X-JL1),

и мы получаем:

І (X/ - х)2 = I (х, - м)2 - 2л(х - д)2 + п(х - д)2 = І (х/ - д)2 - л(х - д)2. Беря в этом уравнении математические ожидания, имеем: £{Х(Х/ -х)2} = £{Х(х,- - д)2}-л£{(х-д)2} =

= £{<*,- - //)2} + ... + Е{хп -ц)2}- пЕЦх - //)2 = = п pop. var(x) - п pop.var(x) = = /іа2-л(а2/л) = (л-1)а2,

используя тот факт, что теоретическая дисперсия х равна о2/п. Это доказывается в разделе 1.7. Следовательно,

£(^2) = £{-1тХ^/-^)2} = ^2

/2-1 ^

и поэтому s2 — несмещенная оценка а2.

1

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 |