Имя материала: Моделирование экономических процессов

Автор: Грачева Марина Владимировна

I.4. свойства оценок

Эконометрика занимается в основном оценкой параметров экономических зависимостей и проверкой гипотез, относящихся к этим параметрам. Например, вновь рассмотрим простейшую кейн-сианскую функцию потребления, связывающую потребление с доходом:

.у, =Р1+Р2х,+є,. (1.13)

В экономической теории предлагается линейная форма функции потребления и даже обосновывается наличие ограничений на параметры. Например, если pj интерпретировать как автономное

потребление, а  р2 — как предельную склонность к потреблению,

то разумно считать, что

Р! >0, 0<р2 <1.

Однако экономическая теория обычно не отвечает на вопрос о точных значениях параметров модели. Даже если точное значение параметра теоретически обосновано, эконометрист все равно может интересоваться оценкой параметра с целью проверки соответствия эмпирических данных и теоретических результатов. Таким образом, назначение эконометрики состоит в том, чтобы получать оценки неизвестных параметров в эмпирических экономических моделях и проверять связанные с ними гипотезы.

Например, используя ежегодные данные за период 1929— 1940 гг. о совокупном потреблении и доходе в США и учитывая инфляцию и рост населения, можно получить следующую оценку уравнения (1.13):

yt =11,45 + 0,78*,. (1.14)

Таким образом, оценки автономного потребления р, и предельной склонности к потреблению р2 составили, соответственно

II,        45 и 0,78. Эти числа получены по определенным экономет-

рическим формулам. По традиции, сложившейся в русскоязычной

литературе, как сами эти формулы, так и результаты вычислений по

ним, называются оценками. В то же время в английской терминоло-

гии используются два разных понятия: estimator — оценка, «оцен-

щик», т.е. формула для оценивания, и estimate — оценка, оцененное

значение, т.е. результат оценивания.

Вообще говоря, для оценивания одних и тех же параметров эконометрической модели могут быть предложены различные формулы (методы), которые, очевидно, будут приводить к разным результатам. Одни из них могут быть явно хуже других, но в некоторых случаях предпочтительность одних оценок перед другими не так очевидна. Таким образом, необходимо иметь набор формальных критериев, по которым можно было бы «проверить качество» методов оценивания.

1.4.1. Распределение оценки

Рассмотрим модель:

.у, =Рх,+є,, (1.15)

где є, — белый шум.

Уравнение (1.15) задает предполагаемый процесс генерации значений yt. Выберем какой-нибудь метод оценивания параметра

Р и обозначим соответствующую формулу для оценки через р .

По конкретным наблюдённым значениям временных рядов у и х можно получить конкретное значение оценки. Однако данные временные ряды — это одна из возможных реализаций случайных процессов, поэтому, рассуждая теоретически, мы могли бы вместо данной реализации иметь несколько другую реализацию и (на основе той же самой формулы р) получить другой числовой результат. Теоретически значение оценки будет меняться в зависимости от различных реализаций. Это служит основанием для того, чтобы

считать, что оценка р является случайной величиной, имеющей

неконтролируемый разброс, обусловленный случайностью механизма формирования наблюдаемого временного ряда. Так мы приходим к понятию распределения оценки, которое задается законом распределения вероятностей случайной величины р и позволяет вычислить вероятность попадания оценки в любой указанный интервал.

Для конкретности предположим, что х является по сути детерминированной (неслучайной) переменной с заранее заданными фиксированными значениями: например, х может быть временным параметром со значениями 1, 2, 3, п. Тогда, воспользовавшись генератором случайных чисел, мы могли бы произвести серию, например, из 2500 экспериментов Монте-Карло, генерируя в каждом из них реализацию ряда случайных ошибок £j,є„ длиной п. Имея фиксированный временной ряд ДЛЯ X и используя уравнение (1.15), в котором значение р зафиксировано, например, на уровне Рв3,5, можно рассчитать 2500 временных рядов для у . Поскольку в ходе проведения эксперимента истинное значение р известно, то, построив 2500 реализаций

оценки р по повторным выборкам, можно определить характер

распределения значений оценки р по отношению к р. Для этого

строится гистограмма значений оценки, которая является эмпирической аппроксимацией ее теоретического закона распределения. Метод Монте-Карло используется для построения эмпирического распределения оценки в том случае, когда модель или метод оценивания особенно сложны и поведение оценки не поддается теоретическому анализу. Однако часто свойства распределения оценки можно вывести, считая, что для модели выполняются те или иные предположения.

Качество оценки (метода оценивания) обычно проверяется путем анализа свойств ее распределения. В частности, метод оценивания будет очевидно предпочтительнее, если вероятность того, что он даст оценку, близкую к истинному (но неизвестному) значению оцениваемого параметра, будет достаточно велика.

1.4.2. Несмещенность

Первое из рассматриваемых свойств — несмещенность. Оценка параметра называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра. Это означает, что положительные и отрицательные отклонения значений оценки, полученные (по разным выборкам), «взаимно компенсируются», т.е. осреднение (по всевозможным выборкам) значений оценки дает истинное значение параметров.

Разумеется, не всякая оценка является несмещенной. Назовем смещением оценки разность между ее математическим ожиданием и истинным значением оцениваемого параметра:

Я=£р-р. (1.16)

При В & 0 оценка является смещенной. Ясно, что при наличии достаточно большого смещения и относительно малого разброса (дисперсии) оценки вокруг своего математического ожидания значения оценки не будут концентрироваться рядом с истинным значением параметра. Таким образом, использование несмещенных оценок часто оказывается более предпочтительным.

Рассмотрим теперь две оценки одного и того же параметра, распределения которых обладают следующими свойствами: р —

несмещенная оценка с большой дисперсией; р — оценка с небольшим смещением, но сравнительно малой дисперсией. В данном случае более предпочтительной будет оценка р , поскольку ее значения, вычисленные по различным выборкам (теоретически возможным при повторениях наблюдений), будут чаще оказываться в окрестности истинного значения параметра р. Данный пример

подчеркивает важную роль дисперсии оценки как измерителя качества оценивания.

1.4.3. Наилучшая несмещенная оценка

Как было показано выше, решение о том, какой метод оценивания «лучше», должно основываться на рассмотрении не только математических ожиданий оценок, но и их дисперсий. Однако говорить об оценке с «минимально возможной» дисперсией следует с осторожностью.

Предположим, например, что для оценки параметра р в модели (1.15) используется оценка р =123,4 , принимающая одно и

то же значение вне зависимости от содержательного смысла задачи или имеющихся выборочных данных. Поскольку эта оценка не меняется, ее дисперсия равна нулю — наименьшему из возможных значений. По этой причине, очевидно, необходимо ограничить поиск минимальной дисперсии каким-либо классом оценок. Обычно это достигается за счет рассмотрения только несмещенных оценок.

Рассмотрим две несмещенные оценки, одна из которых (Р) имеет

распределение с меньшей дисперсией, чем другая оценка (р). Ясно,

что более приемлем метод оценивания по формуле р, так как она чаще будет давать оценку, близкую к истинному значению оцениваемого параметра, чем р .

Оценка, которая имеет наименьшую дисперсию среди оценок некоторого класса, называется наиболее эффективной или наилучшей в этом классе.

Вообще говоря, существует общий подход к выбору оценок —• принцип максимального правдоподобия, использование которого во многих ситуациях позволяет получать наилучшую несмещенную оценку, если она существует. Однако часто бывает удобно ограничиться рассмотрением оценок, являющихся линейными функциями ошибок. Оценка, которая является линейной, несмещенной и имеет наименьшую дисперсию среди всех линейных несмещенных оценок, называется наилучшей линейной несмещённой оценкой.

Если мы оцениваем более чем один параметр, то понятие эффективности необходимо уточнить. При наличии двух оценок Р и р

Л-мерного векторного параметра р обычно сравнивают ковариационные матрицы этих оценок, имеющие размерности k х к. Если

разность ковариационных матриц Var(P) - Var(P) неотрицательно определена, то говорят, что векторная оценка р является более эффективной, чем р .

1.4.4. Асимптотические свойства оценок

Следует подчеркнуть, что рассмотренные выше теоретические свойства «хорошей» оценки (несмещенность, эффективность) должны выполняться при любом фиксированном объеме выборочных наблюдений, используемых при ее вычислении. Так, например, математическое ожидание несмещенной оценки должно совпадать с оцениваемым параметром вне зависимости от количества имеющихся наблюдений. Однако во многих случаях оценка с такими свойствами не существует. Тогда следует обратиться к асимптотическим свойствам оценки, т.е. посмотреть, как она ведет себя, когда используется очень большое (неограниченно растущее) количество выборочных наблюдений. Иногда, если известны только асимптотические свойства рассматриваемой оценки, ее поведение при малых объемах выборки исследуют путем имитации подходящего механизма получения данных с помощью метода Монте-Карло.

Интуитивное представление о том, чем занимается асимптотическая теория, можно получить с помощью все тех же экспериментов Монте-Карло. Пусть данные формируются в соответствии с уравнением (1.15) при заданном значении параметра р, причем объясняющая переменная х имеет неслучайный характер (например, является временем) и, таким образом, список ее значений заранее известен и фиксирован. При заданном объеме выборки Т первый шаг процедуры Монте-Карло состоит в генерации последовательности значений случайных ошибок гь t— 1, 2, Ти соответствующих значений зависимой переменной yt. На втором шаге по полученным данным и известной формуле оценочной функции р вычисляется значение оценки параметра р. Многократное повторение этой двухшаговой процедуры (при одном и том же объеме выборки Т) позволит получить достаточно длинную серию

реализаций оценки р и построить по ней гистограмму распределения этой оценки.

Изложенная процедура многократной генерации временных рядов є и у определенной длины Т с последующим вычислением

гистограммы распределения оценки рг может быть реализована

для некоторого начального значения Т= То, например, для 100 наблюдений. Далее такие же эксперименты Монте-Карло можно повторить для Т — 7о + 1, затем для Т= Tq + 2 и так далее, увеличивая Т. При каждом значении Т будет получено отдельное

эмпирическое распределение, соответствующее оценке рг. Если

свойства оценки не зависят от объема выборки Т, то гистограммы распределений будут выглядеть практически одинаково. Если же объем выборки сказывается на поведении оценки, то вид распределений (их форма и/или положение) будет меняться при росте Т.

Осуществление подобных компьютерных экспериментов необходимо далеко не всегда. Во многих случаях поведение оценок при больших Т можно исследовать математически. Свойства оценок, полученные при Т -»оо , называются асимптотическими свойствами.

Как мы упоминали ранее, форма и положение эмпирического распределения для малых значений Т может рассматриваться для того, чтобы проверить свойства оценки при малом объеме выборки, если они не могут быть получены математически. Заметим, что последовательность рг, Г = Г0, Г0+1, 7^+2, где рг обозначает оценку (формулу для оценивания), вычисляемую по выборке объема Т, сама является случайным процессом, так как каждый член этой последовательности — случайная величина, принимающая те или иные значения в зависимости от конкретной реализации наблюдаемых временных рядов.

Предел распределения оценки, если он существует, при стремлении Т к бесконечности, называется асимптотическим распределением оценки. Если математическое ожидание оценки стремится к истинному значению оцениваемого параметра, то оценка называется асимптотически несмещенной. Однако чаще нас будет интересовать другое асимптотическое свойство — состоятельность. Образно говоря, оценка называется состоятельной, если по мере увеличения числа наблюдений Т значения (распределение значений) оценки все сильнее концентрируются вокруг истинного значения парамет

pa. Формально состоятельность означает, что вероятность того, что разность между значением оценки и истинным значением параметра превзойдет произвольно заданную (сколь угодно малую) величину, должна стремиться к нулю при стремлении объема выборки к бесконечности:

Подпись:
Если оценка состоятельна, т.е. для нее выполняется предельное соотношение (1.17), то говорят, что ее предел по вероятности равен истинному значению оцениваемого параметра, и пишут

/?limpr = р.

(118)

 

Таким образом, «состоятельность» и «сходимость по вероятности» — это синонимы.

Если оценивается вектор параметров, то оценка считается состоятельной, если каждая компонента вектора оценок сходится по вероятности к соответствующей компоненте вектора истинных значений параметров.

Пусть имеется две оценки, вычисляемые по выборке объема

Т, ат и рг, такие, что наряду с соотношением (1.18) выполняется также

p\maT = а.

г->оо

(119)

Тогда справедливы следующие свойства пределов по вероятности:

(1.20, а)

(1.20, Ь)

Если рг * 0 и р ф 0, то

 

(1.20, с)

Если Рг >0 и р>0, то

 

(1.20, d)

Если у — константа, то

/?Иту = у.       (1.20, ё)

г->оо

Если ф — непрерывная функция, то

рИтФ(рг) = ф(р). (1.20,/)

г->оо

Утверждение (1.20, /) называется теоремой Слуцкого. Оно справедливо не только в случае одного числового параметра р, но и если р — вектор. Тогда ф — непрерывная функция соответствующего

числа аргументов. Легко заметить, что свойства (1.20, а), (1.20, А), (1.20, с) и (1.20, d) являются следствиями теоремы Слуцкого.

Следует обратить внимание на различия между понятиями математического ожидания и дисперсии асимптотического распределения оценки при Г->оо, пределами математического ожидания и дисперсии оценки при Т -> оо и пределом по вероятности оценки при Т -> оо .

В некоторых случаях пределы математического ожидания и дисперсии оценки при Т —> оо могут не существовать, в то время как математическое ожидание и дисперсия асимптотического распределения существуют, поэтому использование моментов асимптотического распределения считается более удобным.

Достаточное условие состоятельности оценки состоит в том, чтобы среднее асимптотического распределения было равно истинному значению параметра и дисперсия асимптотического распределения равнялась нулю. Приведем пример, показывающий, что это условие не является необходимым.

Предположим, что распределение оценки рг при фиксированном объеме выборки Т с вероятностью, практически равной единице, концентрируется в малой окрестности точки р, а с оставшейся (почти нулевой) вероятностью может принимать значения близкие к Т. Точнее, пусть

4рг-РІ<^} = і-^ир{ірг-г|<^} = І.

Для простоты дальнейших выкладок будем дополнительно считать, что оценка рг имеет функцию плотности, которая принимает значение Г— 1 на отрезке длины 1/Гс центром в точке р, значение 1 на отрезке длины 1/Гс центром в точке Г и значение 0 в остальных случаях. Ясно, что такая оценка является состоятельной, так как ^ jl Рг ~ РI > "^7 j =   ~^ ® ПРИ Т ~^00 ' ® результате прямых вычислений нетрудно получить следующие результаты: lim £ХРт) = Р + 1 и lim Л(рг) = оо.

Таким образом, предел математического ожидания оценки не совпадает с истинным значением оцениваемого параметра (асимптотической несмещенности нет) и, более того, асимптотически дисперсия оценки бесконечно велика, тем не менее оценка является состоятельной.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 |