Имя материала: Эконометрика : учебное пособие в схемах и таблицах

Автор: С. А. Орехов

Тема 2 парная регрессия и корреляция план лекции

Статистическая зависимость (независимость) случайных переменных.

Анализ линейной статистической связи экономических данных.

Нелинейные модели и их линеаризации.

 

Экономические явления, обладая большим разнообразием, характеризуются множеством признаков, отражающих те или иные их свойства. Эти признаки изменяются (варьируются) во времени и пространстве. Нередко изменения признаков взаимозависимы и взаимообусловлены. В одних случаях связь (зависимость) между признаками оказывается очень тесной (например, часовая выработка и заработная плата), а в других случаях связь между признаками вовсе не обнаруживается или выражается очень слабо (например, пол студентов и их успеваемость). Чем теснее связь между признаками, тем точнее принимаемые решения и легче управление системами.

Среди многих форм связей явлений важнейшую роль играет причинная, определяющая все другие формы. Сущность причинности состоит в порождении одного явления другим. В любой конкретной связи одни признаки выступают в качестве факторов, воздействующих на другие и обусловливающие их изменение, другие — в качестве результатов действия этих факторов. Иными словами, одни представляют собой причину, другие — следствие. Признаки, характеризующие следствие, называются результативными (зависимыми, объясняемыми переменными у), признаки, характеризующие причины — факторными (независимыми, объясняющими переменными х).

Различают два типа зависимости между явлениями и их признаками: функциональную, или жестко детерминированную (на-

пример, зависимость выработки продукции на одного рабочего от объема выпушенной продукции и численности рабочих), и статистическую, или стохастически детерминированную (например, зависимость между производительностью труда и себестоимостью единицы продукции).

 

Понятие функциональной и статистической зависимости

Подпись: —к
— это )
Функцио-

налышя

— это

зависимость

связь, при которой каждому значению независимой переменной х соответствует точно определенное значение зависимой переменной у

Функциональная зависимость чаще всего встречается в естественных науках. Реже подобные связи наблюдаются в общественной жизни, в частности в экономических процессах.

Для социально-экономических явлений характерно то, что наряду с существенными факторами на них оказывают воздействие многие другие, в том числе случайные факторы. В связи с этим существующая зависимость не проявляется здесь в каждом отдельном случае, как при функциональных связях, а лишь «в общем и среднем» при большом числе наблюдений. В этом случае говорят о статистической зависимости.

Подпись: —к
— это )

Статис-

тическая

— это

зависимость

связь, при которой каждому значению независимой переменной х соответствует множество значений зависимой переменной у, причем неизвестно заранее, какое именно значение примет у

 

Частным случаем статистической зависимости является корреляционная зависимость.

Подпись: —\
— это і
Корреля-

1

ционная

— это

зависимость

связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у

 

Корреляционная связь является «неполной» зависимостью, которая проявляется не в каждом отдельном случае, а только в средних величинах при достаточно большом числе случаев.

Известно, например, что повышение квалификации работника ведет к росту производительности труда. Это положение подтверждается в массе явлений и не означает, что у двух или более рабочих одного разряда, занятых ан&чогичным процессом, будет одинаковая производительность труда. Уровни их выработки будут различаться, хотя и незначительно, так как у этих рабочих могут быть различными стаж работы, техническое состояние станка, состояние здоровья и т.д.

Из этого следует, что статистическая зависимость — свойство совокупности в целом, а не отдельных ее единиц.

 

Особенности зависимости

£

£

Функциона.шшя

Корреляционная

 

Всегда выражается формулами, что в большей степени присуще точным наукам (математике, физике) С одинаковой силой проявляется у всех единиц совокупности Является полной и точной, так как обычно известен перечень всех факторов и механизм их воздействия на переменную в виде уравнения

Разнообразие факторов, их взаимосвязи и противоречивые действия вызвают широкое варьирование переменной у Обнаруживается не в единичных случаях, а в массе и требует для своего исследования массовых наблюдений Связь между переменными х и у неполная и проявляется лишь в средних величинах

 

Виды функциональной и корреляционной зависимости

Функциональная и корреляционная связь в зависимости от направления действия бывает прямая и обратная.

Функциональная и корреляционная зависимость

£

Прямая

£

£

С увеличением (уменьшением) значений факторного признака происходит увеличение (уменьшение) результативного признака

С увеличением (уменьшением) значений факторного признака происходит уменьшение (увеличение) результативного признака

 

По аналитическому выражению зависимость может быть прямолинейной (линейной) и криволинейной (нелинейной).

 

Функциональная и корреляционная зависимость

 

 

 

 

 

 

Прямолинейная

 

Криволинейная

* <

 

 

 

С возрастанием величины факторного признака происходит равномерное возрастание (или убывание) величин результативного признака (выражаются уравнением прямой линии)

 

С возрастанием величины факторного признака возрастание (или убывание) результативного признака происходит неравномерно (выражаются уравнениями кривых линий)

 

В зависимости от количества признаков, включенных в модель, корреляционные связи делят на однофакторные и многофакторные.

 

Корреляционные связи

 

V

 

 

Однофакторные (парные)

 

Многофакторные (множественные)

V

 

 

Связь между одним признаком-фактором и результативным признаком (при абстрагировании влияния других)

 

Связь между несколькими факторными признаками и результативным признаком (факторы действуют комплексно, т.е. одновременно и во взаимосвязи)

 

Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализа.

Корреляционно-регрессионный анализ

Корреляционно-регрессионный анализ проводится поэтапно в определенной логической последовательности.

 

'Этапы проведения комплексного корреляционно-регрессионного анализа

            J         

Предварительный анализ явлений и выявление причин возник-

новения взаимосвязей между признаками, характеризующими эти

явления           

*

Разделение признаков на факторные и результативные, выбор наиболее существенных признаков для их исследования на предмет включения в корреляционно-регрессионные модели

I

Построение матрицы коэффициентов парной корреляции и оценка возможных вариантов группировки признаков корреляционно-регрессионных моделей

Предварительная оценка формы уравнения регрессии

I

Решение уравнения регрессии, вычисление коэффициентов регрессии и их смысловая интерпретация

I          

Расчет теоретически ожидаемых (воспроизведенных по уравнению регрессии) значений результативного признака

Определение и сравнительный анализ дисперсий: обшей, факторной и остаточной; оценка тесноты связи между признаками, включенными в регрессионную модель

Общая оценка качества модели, отсев несущественных (или включение дополнительных) факторов, построение модели, т.е. повторение п. 1—7

I          

Статистическая оценка достоверности параметров уравнения регрессии, построение доверительных границ для теоретически ожидаемых по уравнению регрессии значений функции

 

10.        Практические выводы из анализа

Наиболее разработанной в эконометрике является методология парной линейной корреляции, рассматривающая влияние вариации переменной х на переменную у и представляющая собой однофакторный корреляционный и регрессионный анализ.

Понятие корреляционного анализа

раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами. Применяется тогда, когда данные наблюдений можно считать случайными и выбранными из генеральной совокупности, распределенной по многомерному нормальному закону

Подпись:  Корреляционный анализ заключается в количественном определении тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи)

 

Понятие корреляции

 

Корреляция

статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой

Варианты корреляции

Теснота связи количественно выражается величиной коэффициентов корреляции. Построение коэффициентов корреляции основано на сумме произведений отклонений индивидуальных значений признаков х и у: от их средних значений х и у:

- х)(Уі - ?)уЭта величина, деленная на число единиц сово-

купности п, называется ковариацией. Она характеризует сопряженность вариации двух признаков и представляет собой статистическую меру взаимодействия двух случайных переменных.

 

Формула определения ковариации

Подпись:

 

Х(х,- -х)(у,- - у)

cov(_y, х) = —  ,

п

где п — объем исследуемой совокупности; х. — /-е значение независимой переменной (;' = 1, 2, я); yt — г'-е значение зависимой переменной = 1, 2, .... и);

х — среднее значение независимой переменной. Определяется по формуле

 

у — среднее значение зависимой переменной. Определяется по формуле

_    1 "

При наличии прямой связи большие значения х должны сочетаться с большими значениями у, следовательно, отклонения (х,- - х) и (у; - у) будут положительными.

Для малых значений х и у эти отклонения будут отрицательными, а их произведения — положительными. Значит, при прямой связи ковариация будет величиной положительной.

При наличии обратной связи отклонения (х, - х) и (у, - у) будут иметь разные знаки (большие значения х сочетаются с меньшими значениями у и наоборот). Ковариация будет отрицательной величиной.

Наконец, при отсутствии связи сочетание знаков отклонений (х, - х) и (уі - у) будет беспорядочным, при суммировании отрицательные и положительные произведения (х, - х) и (уі - у) будут взаимно погашаться и ковариация будет близка к нулю.

Размер ковариации зависит от масштаба признаков х и у. Для получения относительной характеристики связи ковариа-цию делят на максимально возможное значение, равное произведению средних квадратических отклонений двух признаков ах, ау. В результате получают линейный коэффициент корреляции.

 

Формула линейного коэффициента корреляции

 

_ cov(y, х) _ f-[ 

Линейный

коэффициент

 

корреляции

где о,, о — средние квадратические отклонения случайных величин хну.

Определяются по формулам

 

low)2

 

Для расчета линейного (парного) коэффициента корреляции можно воспользоваться также следующими формулами:

1)

•ух

 

*х<*у

ху - X ■ у

 

где ху — средняя арифметическая произведения двух величин.

 

Определяется по формуле

             ] "

Подпись: -х){у, -у)
Подпись: 2)

 

3)

 

 

ВАЖНО!

Коэффициент корреляции принимает значение от — 1 до +1. Положительное значение коэффициента свидетельствует о наличии прямой связи, отрицательное — обратной. Если г = + 1, корреляционная связь представляется линейной функциональной зависимостью. При г = 0 линейная корреляционная связь отсутствует

Коэффициенты корреляции как статистические величины подвергаются в анализе оценке на достоверность. Это объясняется тем, что любая совокупность наблюдений представляет собой некоторую выборку, следовательно, значение любого показателя, вычисленное на основе выборки, не может рассматриваться как истинное, а является только более или менее точной его оценкой. В связи с этим возникает необходимость проверки существенности (значимости) показателей.

Для оценки значимости коэффициента корреляции используют t-критерий Стьюдента (1-статистику), который применяется при /-распределении, отличном от нормального. При этом выдвигается и проверяется нулевая гипотеза (Н{)) о равенстве rv нулю, т.е. Hf) : rvx = 0. Если нулевая гипотеза отвергается, то коэффициент корреляции признается значимым, а связь между переменными существенной.

 

Формула расчета ^-критерия Стьюдента

(-критерий

і

Стьюдента

 

(1-статис-

 

тша)

 

In-к-]

 

где к — число факторных признаков, включенных в модель

 

 

Значение /-критерия сравнивают с табличным /и.,, где а — заданный уровень значимости (обычно принимается равным 0,05 или 0,01); у = (п — к — 1) — число степеней свободы.

 

Если выполняется неравенство / > ta , то значение коэффициента корреляции признается значимым, .  т.е. нулевая гипотеза, утверждающая равенство ВАЖНО!   у| нулю коэффициента корреляции, отвергается и делается вывод о том, что между исследуемыми переменными есть тесная статистическая взаимосвязь

 

Зная линейный коэффициент корреляции, можно определить парный коэффициент детерминации, он представляет собой .

Парный коэффициент детерминации

'ух

$1

показывает, какая доля вариации переменной у учтена в модели и обусловлена влиянием на нее переменной х

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 |