Имя материала: Общая теория статистики

Автор: Елисеева Ирина Ильинична

6.2. виды группировок

 

Группировка производится с целью установления статистических связей и закономерностей, построения описания объекта, выявления структуры изучаемой совокупности. Различия в целевом назначении группировки выражаются в существующей в отечественной статистике классификации группировок: типологические, структурные, аналитические.

Типологическая группировка служит для выделения социально-экономических типов. Этот вид группировок в значительной степени определяется представлениями экспертов о том, какие типы могут встретиться в изучаемой совокупности. Чтобы пояснить особенность этой группировки, остановимся на последовательности действий для ее проведения:

1) называются те типы явлений, которые могут быть выделены;

2) выбираются группировочные признаки, формирующие описание типов;

3) устанавливаются границы интервалов;

4) группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков) объединяются в намеченные типы, и определяется численность каждого из них.

Рассмотрим пример. Поставлена задача выделить типы акционерных компаний с высокими, средними и низкими дивидендами и установить распространенность каждого типа в данном регионе.

Показатель выплаты дивидендов характеризует долю прибыли на акцию или долю чистого дохода, выплачиваемого как дивиденды.

 

Этот коэффициент зависит от структуры акционерного капитала фирмы, длительности существования фирмы и перспектив ее роста. Обычно молодые, быстрорастущие компании выплачивают низкие дивиденды, если вообще их выплачивают; тогда как зрелые компании стремятся дать более высокие дивиденды. Структура капитала и выплата дивидендов зависят от отраслевой принадлежности фирмы. Поэтому при классификации фирм по уровню выплаты дивидендов мы должны использовать в качестве группировочных признаков, во-первых, отрасль (подотрасль), во-вторых, показатель выплаты дивидендов.

Первый группировочный признак выполняет роль характеристики условий, второй непосредственно характеризует тип фирмы. Границы интервалов для второго группировочного признака могут изменяться при переходе от одной отрасли к другой, так как то, что для одной отрасли может рассматриваться как высокий уровень выплаты, для другой может оцениваться иначе.

Изменение границ интервалов группировочного признака при выделении одних и тех же типов в разных условиях называется специализацией интервалов группировочного признака.

Иногда условия формирования типов приводят к различиям в их описании, в самом круге признаков. Например, выделение крупных, средних, мелких предприятий в разных отраслях должно производиться по разным характеристикам: в энергоемких отраслях - по потреблению электроэнергии; в сырьеемких - по величине товарно-материальных запасов; в трудоемких — по численности рабочих; в капиталоемких - по стоимости оборудования. Изменение круга группировочных признаков при выделении одних и тех же типов в разных условиях называется специализацией группировочных признаков.

Вернемся к нашему примеру. Предположим, что мы располагаем данными 15 фирм, представляющих три подотрасли промышленности. Проведем их группировку с учетом двух выше названных признаков (табл. 6.3).

В табл. 6.3 (гр. В) для краткости использованы условные обозначения типов компаний: н - компании с низким показателем выплаты дивидендов, с - средним, в - высоким показателем выплаты.

Таблица 6.3

Группировка акционерных компаний п-гс района по уровню

 выплаты дивидендов за 19_ г.

 

Подотрасль промышленности

Показатель выплаты дивидендов,\%

Тип компании

Число

компаний

А

Б

В

Г

Производство детских игрушек

до 30

30-50

50 и выше

н

с

в

-

1

4

Производство животного масла

до 20

20 - 40

40 и выше

н

с

в

1

2

-

Производство хлопчатобумажных тканей

до 10

10 - 30

30 и выше

Н

 с

в

2

4

1

 

Использование специализации интервалов как бы уравнивает наши оценки компаний в разных отраслях, что позволяет объединить выделенные группы в три типа независимо от отрасли (табл. 6.4). Это последний шаг типологической группировки.

Как видим, этот метод группировки позволяет избавиться от чрезмерного дробления совокупности, но он слишком субъективен: эксперт определяет, какие типы должны быть выделены, по каким признакам, какими должны быть границы интервалов. К тому же число группировочных признаков ограничено двумя-тремя. Однако, если объект исследования хорошо изучен, если имеется развитая теория, то этот метод может дать хорошо интерпретируемые результаты.

Таблица 6.4

Распределение акционерных компаний л-го района по уровню

выплаты дивидендов в 19 г.

Тип

   компаний

Число компаний

абсолютное

в процентах к итогу

н

3

20,0

с

7

46,7

в

5

33.3

Итого

15

100,0

 

В любом случае правильность проведения типологической группировки требует проверки. С этой целью рассчитываются сводные показатели' по группам (средние, относительные величины); если различие между группами статистически незначимо (по /-критерию Стьюдента или F-критерию, или критерию /2 и т.д., см. гл. 7), то схема группировки должна быть пересмотрена - схожие группы могут быть объединены, изменены границы интервалов и т. д.

Таблица 6-5

Распределение населения Российской Федерации по

среднедушевому денежному доходу*

(\%)

 

Среднедушевой денежный доход в месяц,

тыс. руб.

1995

1996

400 и менее

47,4

25,3

400,1 - 600,0

22,3

22,4

600,1 - 800,0

12.6

16,9

800,1 - 1000,0

7,1

11,5

1000,1 - 1200,0

4,0

7,6

1200,1 - 1600,0

3,9

8,4

1600,1 -2000,0

1.5

3,9

Свыше 2000,0

1,2

4,0

Всего

100

100

*Источник. Российский статистический ежегодник. 1977. – М.: Госкомстат России, 1997. – С. 139.

 

 

Структурная группировка характеризует структуру совокупности по какому-либо одному признаку. Пример такой группировки представлен в табл. 6.5.

Если для типологической группировки чаще используются открытые и неравные ин-тервалы, то для структурной группировки более характерны закрытые равные интервалы. Структурная группировка позволяет изучать интенсивность вариации группировочного признака (см. гл. 5). На основе  структурной группировки можно изучать динамику структуры совокупности.

Если известны структурные характеристики совокупности в одном и другом периодах: wi0 и wi1 – доли i-й группы в период «0» и в период «1», то можно рассчитать показатель среднего абсолютного изменения структуры:

где k — число групп.

 

Другой сводный показатель абсолютных структурных сдвигов строи гся на основе формулы среднего квадратического отклонения:

 

Если показатели структуры выразить не в долях, а в процентах, то, так же как и первый показатель, квадратичный коэффициент абсолютных структурных сдвигов оценивает на сколько процентных пунктов в среднем различаются удельные веса отдельных групп сравниваемых структур. При отсутствии структурных сдвигов оба эти показателя равны нулю; их величина тем больше, чем значительнее абсолютные изменения удельных весов групп. Квадратичный коэффициент более чутко реагирует на структурные изменения. Существуют и другие показатели для измерения структурных сдвигов (см., например, индекс структуры в гл. 10). При сравнениях предполагается, что число групп в одном и другом периодах остается одним и тем же. По данным табл. 6.5, 

 процентных пункта.

Деление группировок на типологические и структурные достаточно условие. Если задать, например, границы среднедушевого дохода, соответствующие определенным типам благосостояния, то можно с полным правом назвать группировку типологической.

Аналитическая группировка характеризует взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой (другие) — как фактор (факторы).

Пример однофакторной аналитической группировки представлен в табл. 6.6.

В данном примере оборачиваемость в днях - фактор, обозначенный х, прибыль - результат - у. Очевидно, что при одном и том же сроке оборота предприятия могут иметь разную прибыль. Чтобы установить связь между признаками, данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение результата. По обобщенным данным гораздо легче увидеть, есть связь между признаками или нет, прямая связь или обратная, линейная или нелинейная. Эти выводы делаются через сопоставление изменений средних значений результата по группам с изменениями фактора. Чтобы эти изменения были сравнимыми, следует проводить группировку с равными интервалами или рассчитывать изменения результата наединицу изменений фактора.

Таблица 6.6

Характеристика зависимости прибыли малых предприятий от

оборачиваемости оборотных средств за 19_ г.

 

Продолжитель-ность оборота средств в днях

Число малых предприятий

Середина интервала, дни

Средняя прибыль, млн руб.

Изменение средней прибыли, млн руб.

х

nj

xj’

y̅j

y̅j - y̅j-1

20 - 30

6

25

14,57

-

 

31 -50

8

40

12,95

- 1,62

51 - 80

6

65

7,40

- 5.55

Итого

20

43

11,77

×

 

В примере средняя прибыль изменяется от группы к группе, следовательно, связь между оборачиваемостью и прибылью существует, причем обратная: чем медленнее оборачиваются оборотные средства, тем меньше прибыль.

Рассчитаем, насколько снижается прибыль при замедлении оборачиваемости от 40-50 до 51-70 дней и при замедлении оборачиваемости от 51-70 до 71-101 дня:

 

Полученные значения показывают величину снижения прибыли при замедлении оборачиваемости на 1 день. Такие показатели называются показателями силы связи. Различие в их значениях свидетельствует, что сила влияния оборачиваемости на прибыль не является постоянной - она возрастает при сроках оборачиваемости свыше 50 дней, т.е. связь признаков нелинейная.

В случае линейной связи важным показателем является характеристика средней силы связи:

где  y̅m, y̅l - средние значения результативного признака в последней и первой группах соответственно; х'm, x’l - середины интервалов (или средние значения) факторного признака в последней и первой группах. В случае прямой связи byx > 0, обратной – byx < 0. По данным табл. 6.5

 

 

Для нелинейной связи показатель средней силы связи не имеет значения (или имеет ограниченное значение).

По аналитической группировке можно измерить связь с помощью еще одного показателя: эмпирического корреляционного отношения. Этот, показатель обозначается греческой буквой h (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия s2 равна сумме внутригрупповой и межгрупповой дисперсий.

Дисперсия результативного признака внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучаемым). Эта дисперсия называется остаточной (та колеблемость, которая осталась при закреплении изучаемого фактора х). Она определяется по формуле:

где уij - значение признака у для i-й единицы в j-й группе;

у̅j - среднее значение признака у ву-й группе;

nj - число единиц ву-й группе;

j = 1, 2, 3, ..., т.

 

Внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине внутригрупповой дисперсии:

 

Межгрупповая дисперсия относится на счет изучаемого фактора (и факторов, связанных с ним), поэтому эта дисперсия называется факторной. Она определяется по формуле

 

Правило сложения дисперсий может быть записано:

 

или

 

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака:

 

             

 

Этот показатель принимает значения в интервале [0,1]: чем ближе к 1, тем теснее связь, и наоборот.

По данным табл. 6.6 этот показатель равен h = 0,881, связь тесная.

Для изучения влияния нескольких факторов на результат проводится многофакторная аналитическая группировка. Она строится как комбинационная группировка по признакам-факторам, и для каждой подгруппы рассчитывается среднее значение результативного признака.

Обратимся к рассмотренному выше примеру, который дополним вторым фактором формирования прибыли - величиной запаса оборотных средств (г); по этому фактору выделены три группы (табл. 6.7).

 

Таблица 6.7

Характеристика зависимости прибыли малых предприятий от

величины запаса и оборачиваемости оборотных средств за 19_ г.

 

Средний запас оборотных средств, млн руб.

Оборачиваемость в днях

Число предприятий

Средняя прибыль, млн руб.

Колеблемость прибыли по группам

zk

xj

njk

yjk

(y̅jk - y̅)2∙njk

55-85

 

 

20 - 30

31 - 50

51 -80

1

2

1

11,00

10,85

7,05

0,5929

1,6928

22,2784

85 - 115

 

 

20-30

31 -50

51 -80

2

4

2

11,85

11,90

5,75

0,0128

0,0676

72,4808

115- 145

 

 

20-30

31 -50

51-80

3

2

3

17,60

17,00

8,62

101,9667

54,7058

29,7675

Итого

X

20

11,77

283,5653

 

Эта группировка позволяет проследить колеблемость прибыли под влиянием двух факторов. Конечно, уверенность нашего заключения е, том, что прибыль изменяется от группы к группе именно за счет изменений запаса оборотных средств и скорости их обращения, зависит от того, насколько обеспечено погашение влияния прочих факторов, т.е. от числа единиц в подгруппах (Ид). В данном примере наполненность групп недостаточна для того, чтобы выявить «чистое» влияние изучаемых факторов.

При njk > 5 многjфакторная аналитическая группировка позволяет измерить силу связи между результатом и одним из факторов при постоянстве второго фактора, т.е. получить так называемые частные (или чистые) показатели силы связи.

По данным табл. 6.7 рассчитаны показатели силы связи между прибылью и оборачиваемостью при закреплении уровня запасов оборотных средств. Таких показателей три (по числу групп по фактору z):

 

 

Точно так же могут быть вычислены показатели силы связи между прибылью и запасом оборотных средств при закреплении оборачиваемости:

 

Чистое влияние первого фактора (обратное) возрастает при увеличении уровня закрепленного фактора (величины запасов оборотных средств), а второго - снижается.

Можно рассчитать и показатель множественной тесноты связи -совокупное эмпирическое корреляционное отношение. Для трех признаков, как в нашем примере, его формула следующая: .

Так же как и показатель парной связи, hxyz принимает значение в интервале [0,1]. В числителе подкоренного выражения находится факторная дисперсия результативного признака:

 

Можно с некоторыми оговорками заключить, что на 92\% (0,962) вариация прибыли в этой совокупности предприятий определяется вариацией изучаемых факторов.

Многофакторная аналитическая группировка — очень гибкий прием изучения связей. Она позволяет уловить влияние факторов на результат с изменением условий (закреплением прочих факторов на разных уровнях).

Однако при всех отмеченных плюсах этот метод имеет огромный минус - дробление совокупности, в результате чего выделяются подгруппы с малым числом единиц. В этом случае средние значения результативного признака неустойчивы, не достигается погашение прочих факторов, соответственно, ненадежными становятся и показатели связи. Но если совокупность большого объема и распределение признаков-факторов не являются крайне асимметричными, этот метод, как никакой другой, позволяет получить много информации об отношениях между переменными.

В какой-то мере избежать дробления данных и при этом получить «чистые» характеристики связей между переменными позволяет применение метода стандартизации распределений в комбинационной таблице. Если в группах по одной переменной, скажем, по г в табл. 6.7, распределение по другой переменной х принять стандартным и на его основе рассчитать групповые средние величины результативного признака, то они будут отличаться за счет принадлежности к разным группам по признаку z при элиминировании признака х. В качестве стандартного применяется распределение в целом по совокупности. Так, по данным табл. 6.7 стандартное распределение по х следующее:

x1 - 6 ед., х2 - 8 ед., х3 - 6 ед. или в относительном выражении: 0,3; 0,4; 0,3. Тогда средняя прибыль при заданном значении переменной z при стандартизации распределения по переменнбй х равна:

в первой группе:

во второй группе:

в третьей группе:

На основе полученных стандартизованных средних можно рассчитать показатели «чистой» связи между величиной прибыли и средним запасом оборотных средств. Попробуйте сделать такой расчет. Стандартизация распределения по переменной z, расчет стандартизованных средних результативного признака и показателей «чистой» связи между у и х при элиминировании z проводится аналогично. Заметим, что рассмотренные приемы анализа не входят пока в ППП для ЭВМ. Возможно, это сделает кто-то из вас.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 |