Имя материала: Общая теория статистики

Автор: Елисеева Ирина Ильинична

6.1. значение и сущность группировки

 

Русский статистик Д. П. Журавский (1810 - 1856) очень точно определил статистику как «счет по категориям». Действительно, среди бесконечного разнообразия явлений мы, как правило, улавливаем наличие некоторого конечного числа групп или типов.

Лицо каждого человека неповторимо, и все-таки можно классифицировать лица по типам (скуластое, продолговатое, круглое и т.д.); предприятия образуют группы по формам собственности, характеру производимой продукции, размерам (крупные, средние, мелкие), финансовому положению; государства делятся на группы по уровню экономического развития и т.д. Примеры можно продолжить, но ясно, что какую бы совокупность мы не изучали, она всегда подразделяется на группы. Это обусловлено такими объективными свойствами явлений, как вариация, наличие частных совокупностей (см. гл. 1).

Группировка - это распределение единиц по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам.

Группировка лежит в основе всей дальнейшей работы с собранной информацией. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Если рассчитать сводные показатели только в целом по совокупности, то мы не сможем уловить ее структуры, роли отдельных групп, их специфики.

Однородность (гомогенность) данных является исходным условием их статистического описания и анализа - вычисления и интерпретации обобщающих показателей, построения уравнения регрессии, измерения корреляции (см. гл. 8), статистического умозаключения (см. гл. 7)..

Таким образом, значение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде. Кроме того, группировка создает основу для последующей сводки и анализа данных.

Для изучения структурных изменений в экономике государственная статистика использует группировку хозяйственных субъектов по формам собственности и организационно-правовым формам, представленную в табл. 6.1.

Сводные показатели для отдельных групп являются типичными и устойчивыми, если, во-первых, группировка проведена правильно, во-вторых, группы имеют достаточную численность. Первое условие связано с тем, что деление на группы далеко не всегда очевидно. Выполнение второго условия необходимо, так как при достаточно большом числе единиц (не менее 5 единиц в группе) в сводных показателях взаимопогашаются случайные характеристики и проявляются закономерные, типичные.

Для решения задачи группировки нужно установить правила отнесения каждой единицы к той или иной группе.

В эти правила входят определения тех характеристик (признаков), по которым будет проводиться группировка (так называемых группированных признаков), и их значений, отделяющих одну группу от другой (интервалов группировки).

Группировка называется простой (монотетической), если для ее построения используется один группировочный признак. Если группировка проводится по нескольким признакам, она называется сложной (политетической). Обычно такая группировка проводится как комбинационная, т.е. группы, выделенные по одному признаку, подразделяются на подгруппы по другому признаку. Казалось бы, этот метод выделения групп должен быть лучше простой группировки - ведь трудно ожидать, что различия между группами можно уловить лишь на основе одного признака. Однако комбинация признаков приводит к дроблению совокупности в геометрической прогрессии: число групп будет равно произведению числа группировочных признаков (l) на число выделенных категорий по каждому из них (т): k = l∙ т. Данные становятся труднообозримыми, группы включают малое число единиц, групповые показатели становятся ненадежными.

Альтернативой является проведение многомерных группировок или многомерных классификаций (см. п. 6.3).

Остановимся на определении интервалов группировочных признаков. Используются интервалы открытые и закрытые. В первом случае указываются верхняя и нижняя границы интервала. Например, группы предприятий по численности работников, человек: 200 - 600, 600 - 1000, 1000 - 2000. Такая запись предполагает, что единица, у которой значение признака совпадает с верхней границей интервала, относится к следующей группе, т.е. интервал читается как «от - до».

Иногда границы закрытых интервалов предполагают включение единиц с нижней и верхней границами. Например, группировка населения по возрасту, лет: 0-4,5-9,10-14,15-19,20-24, 25-29 и т.д. Интервал называется открытым, если указана либо только верхняя, либо только нижняя граница: до 200 человек или 2000 человек и более.

Закрытые интервалы подразделяются травные и неравные. Как указывалось в гл. 5, величина равного интервала находится по формуле

                         

 

Неравные интервалы могут определяться как равнонстолненные. При этом совокупность разделяется на группы равного объема с числом единиц в каждой j-й группе: пj = п: т, где п - общее число единиц; т - число групп. Данные ранжируются, отсчитывается число единиц, составляющих первую группу n1, затем - вторую п2 и т.д. Границы интервалов будут соответствовать фактическим значениям признака в каждой группе.

Таблица 6.1

Организационно-правовые формы и формы собственности

хозяйственных субъектов Российской Федерации

   

 

Бывает, что число групп заранее неизвестно и определяется опытным путем на основе перебора вариантов группировки, выявления такого варианта, который наилучшим образом позволяет увидеть различия между группами.

При определении числа групп следует обращать внимание на то, чтобы в одну группу не попало бы свыше половины всех единиц совокупности и в средних группах было больше единиц, чем в крайних.

Если группировочный признак неколичественный, или количественный дискретный с малым числом значений, то группировка данных производится путем подсчета числа единиц с данным значением признака. Примером такой группировки является табл. 6.2.

Таблица 6.2

Группировка станкостроительных заводов по числу

производимых типов станков

 

Число типов станков

 

Число заводов

1

 

19

2

 

10

3

 

7

4

 

3

5 и более

 

1

 

Очевидно, что метод группировок тесно связан с представлением данных в виде групповых или комбинационных таблиц, а также с графическим представлением структуры совокупности ее частей и соотношений между ними.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 |