Имя материала: Введение в эконометрику

Автор: Кристофер Доугерти

1.8. коэффициент корреляции

 

В этой главе большое внимание уделено ковариации. Это объясняется тем, что она весьма удобна с математической точки зрения, а вовсе не тем, что ковариация является особенно хорошим измерителем взаимосвязи между величинами. Мы рассмотрим ее недостатки в разделе 1.9. Более точной мерой зависимости является тесно связанный с ней коэффициент корреляции.

Подобно дисперсии и ковариации, коэффициент корреляции имеет две формы — теоретическую и выборочную. Теоретический коэффициент корреляции традиционно обозначается греческой буквой р, которая произносится как «ро» и соответствует латинской «г». Для переменных х и у этот коэффициент определяется следующим образом:

pop.cov(x,,y)       = ох,у ХуУ   >/P0P-var(^)P0p.var(.y)    Ja2a2 (1.23)

Если х и у независимы, то р равно нулю, так как равна нулю теоретическая ковариация. Если между переменными существует положительная зависимость, то <5ху, а следовательно, и р будут положительными. Если существует строгая положительная линейная зависимость, то р примет максимальное значение, равное 1. Аналогичным образом при отрицательной зависимости рху будет отрицательным с минимальным значением — 1.

Выборочный коэффициент корреляции г определяется путем замены теоретических дисперсий и ковариации в выражении (1.23) на их несмещенные оценки. Мы показали, что такие оценки могут быть получены умножением выборочных дисперсий и ковариации на п/(п - 1). Следовательно,

п Со(х,у)

г     _   П - 1

'г V

 

Множители п/(п — 1) сокращаются, поэтому можно определить выборочную корреляцию как

r Cov(x,y)

ХчУ   VVar(x)VarO>)' С1-25)

Подобно величине р, г имеет максимальное значение, равное единице, которое получается при строгой линейной положительной зависимости между выборочными значениями х и у (когда на диаграмме рассеяния все точки находятся точно на восходящей прямой линии). Аналогичным образом г принимает минимальное значение — 1, когда существует линейная отрицательная зависимость (точки лежат точно на нисходящей прямой линии). Величина г = О показывает, что зависимость между наблюдениями хи у в выборке отсутствует. Разумеется, тот факт, что г=0, необязательно означает, что р = 0, и наоборот.

 

Иллюстрация

Для иллюстрации вычисления выборочного коэффициента корреляции мы используем пример о спросе на бензин из раздела 1.1. Данные представлены в табл. 1.1 и показаны нарис. 1.1. Мы уже вычислили Cov (р, у) (см. табл. 1.2), которая составляет -16,24, поэтому нам теперь необходимы только Var (р) и Var (у) (см. табл. 1.7).

В последних двух колонках табл. 1.7 можно найти, что Var(p) составляет 888,58 и Var (у) равна 1,33. Следовательно,

-16,24 -16,24

г =       =          = -0,47. /і

7888,58x 1,33    34,38 U*ZD;

Упражнения

На с. 50 представлены данные о темпах прироста численности занятых — ей темпах прироста производительности труда — р (выпуска продукции за один человеко-час) для промышленности 12 стран за период с 1953—1954 по 1963—1964 гг. (годовые экспоненциальные темпы прироста). Постройте диаграмму рассеяния и вычислите выборочный коэффициент корреляции между е и р. [Рекомендуется сделать его, используя уравнения (1.8) и (1.16) для выборочной ковариации и дисперсии, и сохранить вычисления, поскольку это сэкономит вам время при рассмотрении другого примера, представленного в главе 2.] Объясните полученные результаты и прокомментируйте возможные причины положительной корреляции между двумя переменными.

Пусть наблюдения двух случайных переменных х и у находятся на прямой линии:

y = a+bx.

Покажите, что Cov (х, у) = b Var (х) и что Var (у) = Ь1 Var (х), а следовательно, выборочный коэффициент корреляции равен 1, если наклон линии положителен, и —1, если этот наклон отрицателен.

1.5.      Пусть переменная у определяется строгой линейной зависимостью:

у = a + bx,

и предположим, что для х, у и третьей переменной z получена выборка наблюдений. Покажите, что если коэффициент Ъ положителен, то выборочный коэффициент корреляции для у и z должен быть таким же, как и для х и &

 

Занятость

Производительное ть

Австрия

2,0

4,2

Бельгия

1.5

3,9

Канада

2,3

1.3

Дания

2,5

3,2

Франция

1.9

3,8

Италия

4,4

4,2

Япония

5,8

7,8

Нидерланды

1,9

4,1

Норвегия

0,5

4,4

ФРГ

2,7

4,5

Великобритания

0,6

2,8

США

0,8

2,6

Источник: Kaldor, 1966.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 |