Имя материала: Математические методы в экономике

Автор: Замков Олег Олегович

15.2. основные статистические распределения

При обработке выборочных данных, в силу случайной природы процесса получения выборки, важно знать, каким вероятностным законам подчиняются выборочные значения исследуемого экономического показателя. Существует целый ряд распределений вероятности, которые играют роль эталона в статистических выводах. Это прежде всего равномерное распределение, нормальное распределение (распределение Гаусса) и распределение Стьюдента (/-распределение).

15.2.1. Равномерное распределение

Если значения случайной величины из некоторого интервала можно считать равновероятными, то мы приходим к равномерному распределению случайной величины. Равномерное распределение -это такое распределение вероятности, плотность которого постоянна в заданном интервале изменения случайной величины X. а < Х< Ь. Равномерно распределенная случайная величина обозначается R(a,b). Там, где встречается R без указания параметров, подразумевается стандартное равномерное распределение на интервале 0 < Х< 1: Ж0.1).

Плотность вероятности равномерного распределения на интервале [а, Ь постоянна на этом интервале:

Подпись: 1

Ъ - а О,

т =

а функция распределения:

О, х - а

1,

а <>х <. Ь х < а, х > Ь

 

х <> а

а < х <. b

х > Ь

а?

Для равномерного распределения М[Х = а * b, D[X = ^

2   '   1 J 12

Соответствующие этим функциям графики приведены на рисунке 15.1.

На примере равномерного распределения проще всего показать как графически и аналитически рассчитывать вероятность попадания в заданный интервал, т.е. РгоЬЦ <Х< х2}, используя соотношение между плотностью распределения и функцией распределения. Подобно тому, как масса физического тела, равномерно распреде-

Подпись: ДхД/>=РгоЬ(х:>.У<х+Дх)« ^

ленная по объему, находится как произведение плотности (массы в единице объема) на объем, так и вероятность попадания равномерно распределенной случайной величины в заданный интервал равна произведению плотности вероятности на длину интервала, и, таким образом, величина вероятности линейно растет с увеличением длины интервала (внутри области определения [а,Ь]).

В общем случае, разбивая интервал значений непрерывной величины (-оо, х,) на два интервала (-оо, х,) и [хр х2) (одновременные попадания случайной величины в которые являются взаимоисключающими событиями), мы имеем

Prob{-oo < X < х,} + Prob{x, < X < х,} = Prob{-oo < X < х2}.

Отсюда находим, что искомая вероятность попадания непрерывной случайной величины в интервал х, < X < х, равна разности функций распределения этой случайной величины:

Prob{x, < X < х,} = Prob{-oo < X < x,}-Prob{-a> < X < х.) = Fix,) -

Проводя такие же рассуждения, мы можем найти вероятность попадания непрерывной случайной величины в бесконечно малый интервал х < X < х + dx :

?оЪ{х < X < х + dx} = Prob{-oo <Х< x+dx} - Prob{-oo < X< х} = = FJ,x + dx) - Fx(x) = dFx(x) = Fp)dx.

В последних двух равенствах мы использовали определение бесконечно малого изменения функции распределения (или дифференциала этой функции). Из найденного соотношения видно, что вероятность попадания непрерывной случайной величины в бесконечно малый интервал х < Х< х + dx бесконечна мала и пропорциональна величине этого интервала dx. Отношение этой бесконечно малой вероятности к бесконечно малой величине интервала имеет конечное значение и характеризует плотность вероятности в точке х.

Итак, плотность распределения вероятности

f(Y, = dFx(x)    W + dx) - W

И, наоборот,

FJix) = fx(z)dz.

На рис. 15.2a приведен характерный график плотности вероятности, а на рис. 15.26 - график соответствующей функции распределения.

Используя выведенную нами взаимосвязь плотности вероятности и функции распределения, несложно показать, что наклон графика функции распределения характеризует плотность вероятности (чем больше плотность вероятности, тем быстрее меняется функция распределения) (точнее/(х) = tg(a)), а площадь под графиком фун-

кции плотности вероятности на интервале х < X < х,

x)dx

характеризует вероятность попадания непрерывной случайной величины в соответствующий интервал.

При этом суммарная площадь под графиком функции плотности вероятности на всем интервале -оо < Х< +оо равна по определению единице:

fx(x)dx = і.

15.2.2. Нормальное распределение

Если случайная величина формируется под действием большого количества независимых факторов, вклад каждого из которых в значение случайной величины мал, то в силу центральной предельной теоремы эта случайная величина будет иметь нормальное распределение. В роли таких величин могут выступать: объем продаж в конкурентной отрасли или в промышленности в целом, суммарные инвестиции, суммарное потребление домашних хозяйств и тому подобные величины, имеющие аддитивную природу, то есть складывающиеся из многих малых взаимно независимых величин.

Основная особенность случайной величины состоит втом, что нельзя предвидеть, какое значение она примет в результате испытания. Однако при достаточно большом числе испытаний поведение суммы независимых случайных величин почти утрачивает случайный характер и становится почти закономерным. При увеличении числа слагаемых в сумме противоположные случайные колебания отдельных величин сглаживаются и распределение вероятностей суммы становится весьма простым, приближаясь при определенных условиях к нормальному распределению.

Рассмотрим основные свойства нормального распределения. Главное из них - если ряд случайных величин (Xv Xv ... , Хп) имеет нормальное распределение, то их сумма (Х{ + X +...+ Xt) или любая линейная комбинация (а, Хх + а2 Х2 + ... + ая XJ также'будет иметь нормальное распределение.

Нормальное распределение одной случайной величины Охарактеризуется лишь двумя параметрами: средним значением, обычно обозначаемым ц, и стандартным отклонением, обычно обозначаемым а. Это обычно обозначают так: Х= N(n,a).

Распределение величины Х= £ ckXk, представляющей собой взве-шенную сумму п независимых нормально распределенных случайных величин = N(xt,ak) с параметрами цк и с^, также будет иметь нормальное распределение с параметрами |д = £ ск'Ик и о=   Е с*

*•>      N 4-І

г. 1

В частности, если все ск = -, все    и ак одинаковы и равны и, и о,

а         -   1 "

соответственно, то 1.1=111., а о = ~1=. Обозначая X = имеем,

о[Х]

таким образом, М[Х = М[Х], о[Х| = ^. Отсюда видно, что разброс среднего арифметического независимых нормально распределенных случайных величин стремится к нулю при неограниченном увеличении числа этих величин. Если, например, взята достаточно большая репрезентативная выборка населения, то средний доход в выборке почти наверняка окажется близким к действительному средг нему доходу населения.

График плотности вероятности нормального распределения имеет типичный колоколообразный види показан нарис. 15.3. Максимум этой функции находится в точке х = ц, а "растянутость" вдоль оси А"определяется параметром а. Чем меньше значение этого параметра, тем более острый и высокий максимум имеет плотность нормального распределения. Аналитически плотность вероятности нормального распределения на интервале (-со, +а>)

U - с)1

 

а функция распределения

FN(x) = -j=e~1^*. (2)

ГГ. If ТС jL,

МХ = и, D[X = о2, У[Х = -щ. Плотность вероятности нормального распределения (1) пропор-

циональна величине ехр

г21

, где z - безразмерная величина, оп-

ределяемая выражением z = ^ 1* Поэтому плотность нормального распределения достаточно быстро (экспоненциально) убывает при удалении х от среднего значения ц. Случайная величина z имеет нулевое математическое ожидание и единичную дисперсию; это вы

текает из их определений и свойств, учитывая, что z — ———. Она,

а

как и исходная случайная величинах, нормально распределена, но уже не зависит от каких-либо параметров. Поэтому ее распределение может быть протабулировано, то есть значения её плотности вероятности могут быть представлены в виде таблиц. Эта функция называется плотностью стандартного нормального распределения. Стандартное нормальное распределение - это нормальное распределение с параметрами ц = 0 и о = 1 (Z« /V(0,1)).

На практике чаще используют таблицы значений не плотности, а функции распределения стандартной нормальной величины F(z). Интересуясь, например, вероятностью того, что нормально распределенная случайная величина xпопадает в интервал х, <x<xv мы вначале находим соответствующий интервал для нормально распре-

х. - р.

деленной стандартной случайной величины Z(z, <Z< z,)' Z, —

хг - Ц

и і2 — —-—• Затем по таблице находим значения функции распределения F(z,) и Fiz,) и определяем вероятность попадания случайной величины Zb заданный интервал РгоЬ{г, <Zz,} = F(Zj) - F(zt), совпадающую с искомой вероятностью попадания случайной величины x в заданный интервал РгоЬ{х, < x < хЛ. Геометрически эта вероятность изображается площадью под графиком функции плотности вероятности в интервале от х, до х2.

Аналогично можно решать и обратную задачу - нахождения интервала, в который нормально распределенная случайная величина попадает с заданной вероятностью. Эта процедура часто используется в задачах теории оценивания и проверки гипотез. Так, например, пусть мы хотим проверить гипотезу о равенстве среднего значения нормально распределенной случайной величины ц (для генеральной совокупности) нулю, допуская вероятность ошибки 0,05 в случае, если эта гипотеза верна. В этом случае выборочное значение стандартной нормально распределенной случайной величины Zдолжно попадать в такой интервал, что вероятность РгоЬ{г, < Z< іЛ = = 0,95. Из этого условия и соображений симметрии можно найти границы интервала - критические значения z^ = £, = -z{, такие,

что вероятность РгоЬ{г, <Z] = Prob{Z< z{) =      = 0,025. Сравнивая

выборочное значение величины z = ———, называемое г-статисти-

а

кой с критическим значением мы принимаем (если г, ^ г < ^) или отвергаем (если z < z{ или z2 ^ z) проверяемую гипотезу с точностью (уровнем значимости) є = 0,05 (5\%).

Естественно, что вышеописанную процедуру можно применять, только если известно стандартное отклонение о или дисперсия о2 исследуемой случайной величины, что редко имеет место на практике. Поэтому при оценивании параметров и проверке гипотез чаще применяют другое распределение, являющееся по сути выборочным аналогом нормального распределения и переходящее в него при бесконечно большом числе наблюдений. Это распределение называют распределением Стьюдента или /-распределением.

15.2.3. Распределение Стьюдента

Рассмотрим основные свойства распределения Стьюдента. Во-первых, аналогом безразмерной величины г-статистики, определяемой выражением z = ^   ^ служит также безразмерная величина

/-статистика, определяемая выражением ґ = * В этом выражении вместо стандартного отклонения для генеральной совокупности у стоит выборочное стандартное отклонение s, являющееся, по сути, случайной величиной (меняющейся от выборки к выборке) и определяемое по данным наблюдений хк с помощью выражения:

Здесь выборочное среднее обозначено х =      хк, а через п обоз-

начено число наблюдений.

Во-вторых, в отличие от стандартного нормального распределения, являющегося функцией лишь одной переменной z, /-распределение является не только функцией переменной t, но также зависит от еще одного параметра - числа степеней свободы v. Число степеней свободы равно общему числу наблюдений, уменьшенному на число линейных связей между ними. Если п выборочных наблюдений связаны s линейными уравнениями, то их распределение имеет v = n-s степеней свободы. Линейной связью является, например,

1 "

формула расчета выборочного среднего х = —      и если выбороч-

Пк-

ное среднее входит в формулу какой-либо статистики, то это уменьшает число степеней свободы на единицу.

Распределение Стьюдента имеет случайная величина, равная отношению двух независимых случайных величин: стандартной нормально распределенной величины Z(c нулевым средним значением

и единичной дисперсией) и величины

п

выражающейся через

случайную величину, имеющую распределение yf с п степенями свободы. Распределение х2 (хи - квадрат, или распределение Пирсона), имеет сумма квадратов п независимых стандартных нормально распределенных случайных величин (с нулевыми средними значениями и единичными дисперсиями). Вводя новую случайную величину

х2(1)

 

х2(»)'

 

мы получим для нее /-распределение Стьюдента с п степенями

свободы с плотностью вероятности f[x,n) - В

1  + X2

График

функции плотности вероятности распределения Стьюдента (рис. 15.4), как и стандартного нормального распределения, имеет симметричный колоколообразный вид, но является более "сплюснутым" по вертикали.

Из симметричности распределения Стьюдента вытекает важное соотношение между критическими точками этого распределения: tin) = t.Jn).

На практике обычно используют не таблицы функции распределения Стьюдента F(z), а таблицы критических точек функции распределения Стьюдента, то есть точек с заданной вероятностью попадания в начинающиеся от них "хвосты" распределения.

Распределение Стьюдента используется, например, при проверке гипотез:

о среднем значении нормальной генеральной совокупности при неизвестной дисперсии;

о линейной независимости двух случайных величин (равенстве нулю коэффициента корреляции) - см. ниже в этой главе;

о статистической значимости коэффициента линейной регрессии.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 |