Введение в эконометрику

1.5. выборочная дисперсия

 

До сих пор термин «дисперсия» использовался в смысле теоретической дисперсии (т. е. относящейся ко всей генеральной совокупности), как это и определялось в обзоре. Для целей, которые прояснятся при обсуждении регрессионного анализа, целесообразно ввести понятие выборочной дисперсии (при этом будет сделано три важных замечания). Для выборки из п наблюдений хр хп выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:

Var(x) = iX(*/-^)2- (1.14) Сделаем следующие три замечания:

Определенная таким образом выборочная дисперсия представляет собой смещенную оценку теоретической дисперсии. В приложении О.З показано, что s2, определенная как

1    V   — 2

            2,(х,-х) ,

/1-І

1 В русскоязычной литературе величина Var (х) обычно называется выборочной дисперсией, а s2 — «исправленной», или несмещенной, выборочной дисперсией. (Прим. ред.)

является несмещенной оценкой с2. Отсюда следует, что ожидаемое значение величины Var(x) равно [(л — 1)/п]с2 и что, следовательно, она имеет отрицательное смещение. Отметим, что если размер выборки п становится большим, то (п — 1)/п стремится к единице и, таким образом, математическое ожидание величины Var (х) стремится к с2. Можно легко показать, что ее предел по вероятности (plim) равен а2 и, следовательно, она является примером состоятельной оценки, которая смещена для небольших выборок.

Так как величина s2 является несмещенной, то в некоторых работах ее часто определяют как выборочную дисперсию и либо избегают ссылок на Var (х), либо дают ей какое-то другое название. К сожалению, общепринятой договоренности по этому поводу до сих пор нет1. В каждой работе вам следует проверять определение.

3. Поскольку указанная договоренность отсутствует, отсутствует и договоренность относительно условного обозначения данного понятия, и для этого используются самые различные символы. В данной работе теоретическая (или генеральная) дисперсия переменной х обозначается как pop. var (х) или, если это удобно, а2. Если ясно, о какой переменной идет речь, то нижний индекс может быть опущен. Выборочная дисперсия всегда будет обозначаться как Var (х) с прописной буквы К

Почему выборочная дисперсия в среднем занижает значение теоретической дисперсии? Причина заключается в том, что она вычисляется как среднеквадратичное отклонение от выборочного среднего, а не от истинного значения. Так как выборочное среднее автоматически находится в центре выборки, то отклонения от него в среднем меньше отклонений от теоретического среднего значения.