Имя материала: Эконометрика

Автор: Кремер Н.Ш.

3.8. коэффициент ранговой корреляции спирмена

До сих пор мы анализировали зависимость между двумя количественными переменными. Вместе с тем в практике эконометрика иногда встречаются случаи, когда необходимо установить тесноту связи между ординальными (порядковыми) переменными (например, качество жилищных условий, тестовые баллы, экзаменационные оценки и т. п.). В этом случае объекты анализа упорядочивают или ранжируют по степени выраженности измеряемых переменных. При этом каждому объекту присваивается определенный номер, называемый рангом. Например, объекту с наименьшим проявлением (значением) признака присваивается ранг 1, следующему за ним — ранг 2 и т. д. Если объекты ранжированы по двум признакам, то имеется возможность оценить тесноту связи между переменными, основываясь на рангах, т. е. тесноту ранговой корреляции.

Коэффициент ранговой корреляции Спирмена находится по формуле

P = l—^            , (3.49)

где г/ и Sf ранги /-го объекта по переменным X и У; л — число пар наблюдений.

Если ранги всех объектов равны (г/ = 5/, /=1,2,..., я), то р=1, т. е. при полной прямой связи р=1. При полной обратной связи, когда ранги объектов по двум переменным расположены в обратном порядке, можно показать, что р=—1. Во всех остальных случаях |р| < 1.

При ранжировании иногда сталкиваются со случаями, когда невозможно найти существенные различия между объектами по величине проявления рассматриваемого признака: объекты, как говорят, оказываются связанными. Связанным объектам приписывают одинаковые средние ранги, такие, чтобы сумма всех рангов оставалась такой же, как и при отсутствии связанных рангов. Например, если четыре объекта оказались равнозначными в отношении рассматриваемого признака и невозможно определить, какие из четырех рангов (4,5,6,7) приписать этим объектам, то каждому объекту приписывается средний ранг, равный (4+5+6+7)/4=5,5. В модификациях формулы (3.49) на связанные ранги вводятся поправки.

При проверке значимости р исходят из того, что в случае справедливости нулевой гипотезы об отсутствии корреляционной связи между переменными при я>10 статистика

г^-Щ- (3.50)

 

имеет /-распределение Стьюдента с (п—2) степенями свободы.

Поэтому р значим на уровне а, если |/| > /і_а;„_2, где t-a; п-2 —

табличное значение /-критерия Стьюдента, определенное на уровне значимости а при числе степеней свободы (я—2).

► Пример 3.6. По результатам тестирования 10 студентов по двум дисциплинам А и В на основе набранных баллов получены следующие ранги (табл. 3.4). Вычислить коэффициент ранговой корреляции Спирмена и проверить его значимость на уровне а=0,05.

Для проверки значимости р по формуле (3.50) вычислим

t - 0,763—в       - 3534   и найдем по табл. II приложений Vl-0,7632

*b,95;8= 2,31. Так как t > /Ь,95;8> то коэффициент ранговой корреляции р значим на 5\%-ном уровне. Связь между оценками дисциплин достаточно тесная. ►

 

Ранговый коэффициент корреляции р может быть использован и для оценки тесноты связи между обычными количественными переменными. Достоинство р здесь заключается в том, что нахождение этого коэффициента не требует нормального распределения переменных, линейной связи между ними. Однако необходимо учитывать, что при переходе от первоначальных значений переменных к их рангам происходит определенная потеря информации. Чем теснее связь, чем меньше корреляционная зависимость между переменными отличается от линейной, тем ближе коэффициент корреляции Спирмена р к коэффициенту парной корреляции г.

 

Упражнения

3.7. Имеются следующие данные об уровне механизации работ Х(\%) и производительности труда Y (т/ч) для 14 однотипных предприятий:

Xi

32

30

36

40

41

47

56

54

60

55

61

67

69

76

Уі

20

24

28

ЗО

31

33

34

37

38

40

41

43

45

48

Необходимо: а) оценить тесноту и направление связи между переменными с помощью коэффициента корреляции; б) найти уравнение регрессии Y по X.

При исследовании корреляционной зависимости между ценой на нефть X и индексом нефтяных компаний Y получены следующие данные:

х =16,2(ден.ед.), у = 4000(усл.ед.), s2=4,sj = 500, G5v{x,y)=40.

Необходимо: а) составить уравнение регрессии Fno Х б) используя уравнение регрессии, найти среднее значение индекса при цене на нефть 16,5 ден. ед.

По данным примера 3.7: а) найти уравнение регрессии Y по X; б) найти коэффициент детерминации R2 и пояснить его смысл; в) проверить значимость уравнения регрессии на 5\%-ном уровне по /"-критерию; г) оценить среднюю производительность труда на предприятиях с уровнем механизации работ 60\% и построить для нее 95\%-ный доверительный интервал; аналогичный доверительный интервал найти для индивидуальных значений производительности труда на тех же предприятиях.

 

По данным 30 нефтяных компаний получено следующее уравнение регрессии между оценкой У (ден. ед.) и фактической стоимостью X (ден. ед.) этих компаний: ух = 0,8750х + 295. Найти: 95\%-ные доверительные интервалы для среднего и индивидуального значений оценки предприятий, фактическая стоимость которых составила 1300 ден. ед., если коэффициент корреляции между переменными равен 0,76, а среднее квадратиче-ское отклонение переменной Нравно 270 ден. ед.

При приеме на работу семи кандидатам было предложено два теста. Результаты тестирования приведены в таблице:

 

Тест

Результаты тестирования кандидатов {в баллах)

 

1-й

2-й

3-й

4-й

5-й

6-й

7-й

1

31

82

25

26

53

30

29

2

21

55

8

27

32

42

26

Вычислить коэффициент ранговой корреляции Спирмена между результатам тестирования по двум тестам и на уровне а=0,05 оценить его значимость.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 |