Имя материала: Эконометрика

Автор: А.И. Новиков

1.6. ковариация и корреляция

Различают выборочную и теоретическую ковариацию.

Выборочной ковариацией двух переменных х, у называется средняя величина произведения отклонений этих переменных от своих средних, т.е.

cov(x, у) = -У (х, - х)0,- - у),  или  cov(x, у) = ху - ху, п

где х, у — выборочные средние переменных х, у.

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Пусть данные наблюдений переменных х, у представлены в виде точечного графика — диаграммы рассеяния наблюдений (рис. 6).

Рис.6

 

Точка (х, у) на диаграмме является центром рассеяния переменных х, у.

Вертикальная и горизонтальная прямые, проведенные через точку (х, у), разделяют диаграмму рассеяния на четыре области.

Наблюдения в областях I, III, в которых (х( - x)(j, - у) > О, дают положительный вклад в ковариацию, а в областях II, IV, в которых (х; - х)(у; - у) < 0, — отрицательный.

Если положительные вклады преобладают над отрицательными, то ковариация будет положительной, в противном случае она будет отрицательной. Положительной ковариации отвечает положительная связь, а отрицательной — отрицательная.

При положительной (прямой) связи с увеличением одной переменной другая переменная в среднем также увеличивается, и наоборот при отрицательной (обратной) связи.

1 , Заметим, чтосоу(х,х) = — Удх/ _ х) = var(A').

п

Правила расчета ковариации:

cov(x, и + v) - cov(x, и) + cov(x, v).

cov(x, a) = 0, если a = const.

cov(x, bu) = bcov(x, и), если b - const.

cov(«, v) = cov(v, u).

var(w + v) = var(w) + var(v) + 2cov(m, v).

Доказательство вытекает из определения ковариации. Например:

cov(x, а) = —У,(х- - х)(а - а) = 0; п^

var(« + v) = cov(« + v, и + v) = cov(w, и) + cov(v, v) + 2cov(w, v) = = var(w) + var(v) + 2cov(«, v).

Теоретической ковариацией случайных величин X, /называется математическое ожидание произведения отклонений этих величин от своих средних значений, т.е.

Cov(Z, Y) = M[{X-ix){Y-Ly)},

Y№ix = M(X),iy = M{Y).

Запись Cov(,Y, У) указывает на то, что ковариация рассматривается по генеральной совокупности.

Заметим, что Cov{X, X) - М(Х- ix)2 = ах.

Свойство. Если случайные величины X, Y независимы, то теоретическая ковариация равна нулю, т.е. Со(Х, Y) = 0.

Более точной мерой зависимости между величинами является коэффициент корреляции. Различают теоретический и выборочный коэффициенты корреляции.

Теоретический коэффициент корреляции определяется выражением

_ Соу(Х, Y) Рхг -    ~Г~1 >

 

где ах, о у— средние квадратичные отклонения случайных величин X, Y.

Коэффициент корреляции является безразмерной величиной, изменяющейся в пределах-1 < р < 1.

Теоретический коэффициент корреляции показывает тесноту линейной связи двух случайных величин:

р > 0 при положительной связи и р = 1 при строгой положительной линейной связи;

р < 0 при отрицательной связи и р - -1 при строгой отрицательной линейной связи;

р = 0 при отсутствии линейной связи.

Случайные величины X, Y называются некоррелированными, если р = 0, и коррелированными, если р ^ 0.

Независимость случайных величин X, Yозначает отсутствие любой связи (линейной и нелинейной), анекоррелиро-ванность — отсутствие только линейной связи.

Свойства. Если случайные величины X, У независимы, то они некоррелированы (р = 0), но из некоррелированности не следует их независимость, т.е. равенство р = 0 указывает на отсутствие линейной связи между переменными, но не на отсутствие связи между ними вообще.

Выборочный коэффициент корреляции определяется выражением

г  = ст(х>У) ху    yjvar(x) var(j)

При каждом конкретном значении рху выборочный коэффициент корреляции является случайной величиной, изменяющейся в пределах -1 < r< 1. Он является безразмерной величиной и показывает степень линейной связи двух переменных.

На рис. 7 отражен геометрический смысл коэффициента корреляции.

Если для генеральной совокупности р = 0, это не всегда означает, что и для выборочной совокупности г = 0.

r<0

X X

 

Рис.7

Проверка гипотезы о корреляции случайных величин. Пусть по данным выборки объема п получен выборочный коэффициент корреляции г^О. Требуется проверить гипотезу о равенстве нулю истинного значения коэффициента корреляции, т.е.

|Я0: р = 0,

[#,: р*0.

В качестве критерия проверки гипотезы Н0 принимается случайная величина

t =

r^jn - 2

 

Величина / при справедливости гипотезы Н0 имеет распределение Стьюдента (/-статистика) с v = п - 2 степенями свободы.

Проверку значимости г выполним двумя способами.

Критическое значение /кр при заданных а и v определяется по таблице /-распределения Стьюдента или в Excel с помощью функции

tKp = СТЬЮДРАСПОБР(ОС; V).

Из сравнения наблюдаемого значения t с критическим получаем:

если 111 < Гкр, то #0 принимается, т.е. г н е з н а ч и м;

если11\>ґкр,тоЩотвергается,т.е.г значим.

Наблюдаемому (расчетному) значению критерия t соответствует значимость t, которая может быть определена в Excel с помощью функции

Значимость t = СТЫОДРАСП (t;  V; 2),

где v = и - 2 — число степеней свободы.

Из сравнения значимости t с заданным стандартным уровнем значимости получаем:

если значимость t больше стандартного уровня, тог незначим;

если значимость t меньше стандартного уровня, то г значим.

Пример 1.2. По приведенным ниже исходным данным вычислить ковариацию и коэффициент корреляции между переменными х, у, установить его значимость:

 

№ п/п

1

2

3

4

5

X

2

6

10

14

18

У

1

2

4

11

12

Представим исходные данные и расчетные показатели в виде следующей расчетной таблицы:

 

 

№ п/п

X

У

X2

ху

У2

1

2

1

4

2

1

2

6

2

36

12

4

3

10

4

100

40

16

4

14

11

196

154

121

5

18

12

324

216

144

Итого

50

30

660

424

286

Среднее

10

6

132

84,8

57,2

X

У

72

ху

7

Окончательно имеем

var(x) = Xі - (ху2 = 132 -100 = 32,

var(>>) = 7-(57)2 = 57,2-36 = 21,2, cov(x, у) = ху - ху = 84,8 - 60 = 24,8,

г=  .^У)    = ;24'8    . 0,952. Vvar(x)var(j) ^32-21,2

Замечание. В Excel можно по исходным данным получить коэффициент корреляции и его квадрат с помощью функций

г = ПИРСОН (массив х; массив у),

г2 = КВГШРСОН (массив х; массив у).

Проверим значимость выборочного коэффициента корреляции. Наблюдаемое значение критерия

t ^ г4п~^2 _ О 952V3 _ 5 Vl-r2    VoT0937     ' '

Выполним проверку' значимости г двумя способами.

При а = 0,05 и v = 3 по таблице или с помощью функции СТЬЮДРАСПОБР (а; v) находим /кр = 3,18. Поскольку |/| = = 5,5 > /кр = 3,18, то г= 0,952 значим при 5\%-ном уровне.

Наблюдаемому (расчетному) значению критерия і - 5,5 соответствует значимость /" = 0,0124, которая может быть определена в Excel с помощью функции

Значимость  t = СТЬЮДРАСП(t;  V; 2),

где v = п - 2 — число степеней свободы.

Поскольку значимость t = 0,0124 < 0,05, то коэффициент г= 0,952 значим при 5\%-ном уровне, следовательно, имеется линейная зависимость между переменными.

 

КОНТРОЛЬНЫЕ ВОПРОСЫ

В чем сходство и отличие генеральной и выборочной совокупностей?

В чем отличие генеральных характеристик генеральной совокупности от выборочных?

Что является численной характеристикой центра распределения случайной величины?

Что является численной характеристикой меры рассеяния случайной величины?

Сколькими параметрами характеризуется нормальное распределение случайной величины?

Что называется статистическим критерием?

Какие случайные величины используются в качестве статистического критерия?

Что характеризуют ковариация и корреляция случайных величин?

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 |