Имя материала: Общая теория статистики

Автор: Елисеева Ирина Ильинична

5.2. средняя арифметическая величина

 

Понятие средней арифметической

 

Виды средних величин различаются прежде всего тем, какое свойство, какой параметр исходной варьирующей массы индивидуальных значений признака должен быть сохранен неизменным.

Средней арифметической величиной называется такое среднее значение признака, при вычислении которого общий объем признака в совокупности сохраняется неизменным.

Иначе можно сказать, что средняя арифметическая величина -среднее слагаемое. При ее вычислении общий объем признака мысленно распределяется поровну между всеми единицами совокупности. Например, средняя заработная плата или средний доход работников предприятия - это такая сумма денег, которая приходилась бы на каждого работника, если бы весь фонд оплаты труда (или все доходы, направленные на личное потребление) был распределен между работниками поровну.

Исходя из определения, формула средней арифметической величины имеет вид:

Средняя арифметическая

,                                    (5.1)

где  х̅ - средняя величина;

       п – численность совокупности.

 

По формуле (5.1) вычисляются средние величины первичных (объемных) признаков, если известны индивидуальные значения признака. Если изучаемая совокупность велика, исходная информация чаще представляет собой ряд распределения или группировку, как, например, табл. 5.1.

Таблица 5.1

Распределение футбольных матчей высшей лиги России по числу забитых за матч обеими командами мячей в 1996 г.

 

Число забитых мячей, х

0

1

2

3

4

5

6

7

8

9

Итого

Число матчей,

fi

30

56

71

59

49

24

12

3

0

2

306

 

Среднее число мячей, забитых за одну игру, должно представлять собой результат равномерного распределения общего числа забитых мячей по всем 306 матчам розыгрыша первенства. Общее число забитых мячей, согласно исходной информации табл. 5.1, можно получить как сумму произведений значений признака в каждой группе хi, на число игр с таким количеством забитых мячей fi (частоты). Получим формулу (5.2)

                          ,

 

где п — число групп.

 

Такую форму средней арифметической величины называют взвешенной арифметической средней в отличие от простой средней, рассчитанной по формуле (5.1). В качестве весов выступают здесь числа единиц совокупности в разных группах. Название «вес» выражает тот факт, что разные значения признака имеют неодинаковую «важность» при расчете средней величины. «Важнее», весомее число забитых мячей, которое встречалось чаще: 1, 2, 3 мяча, а такие значения, как 7 или 9 забитых мячей, как бы ни радовались таким результативным матчам болельщики, при расчете средней не играют большой роли: их «вес» мал.

Имеем: х̅ = 802 : 306 = 2,62 мяча за игру.

Как видим, средняя арифметическая величина может быть дробным числом, если даже индивидуальные значения признака могут принимать только целые значения (дискретный признак). Ничего «предосудительного» для метода средних в этом не заключено; из сущности средней не вытекает, что она обязана быть реальным значением признака, которое могло бы встретиться у какой-либо единицы совокупности.

 

Виды средней арифметической

 

Если при группировке значения осредняемого признака заданы интервалами, то при расчете средней арифметической величины в качестве значения признака в группах принимают середины этих интервалов, т.е. исходят из гипотезы о равномерном распределении единиц совокупности по интервалу значений признака. Для открытых интервалов в первой и последней группе, если таковые есть, значения признака надо определить экспертным путем исходя из сущности, свойств признака и совокупности. Например, по табл. 5.2 можно минимальный возраст рабочих считать 17 лет. Тогда первый интервал будет от 17 до 20 лет, а максимальный возраст - 65 лет, тогда последний интервал - 50-65 лет.

 Таблица 5.2

Распределение рабочих предприятия по возрасту

 

 

 

Группы рабочих по возрасту, лет

Число рабочих

fj

Середина интервала х'j

xjfj

До 20

48

18,5

888

20-30

120

25

3000

30-40

75

35

2625

40 - 50

62

45

2790

Старше 50

54

57,5

3105

Итого

359

34,56

12408

 

Средний возраст рабочих, рассчитанный по формуле (5.2) с заменой точных значений признака в группах серединами интервалов, составил:

                   

что и записано в итоговую строку по графе 3 табл. 5.2. Напомним, итог объемного показателя — это сумма, итогов по графе относительных показателей или средних групповых величин — средняя. Числитель дроби - это общая сумма человеко-лет, прожитых рабочими предприятия; разделив ее на число работников, получаем возраст в годах, так что логика показателя средней величины соблюдена.

Перейдем к рассмотрению средних вторичных (относительных) признаков. Сумма таких показателей сама по себе реальной величиной какого-либо признака в совокупности не является. Однако общее определение арифметической средней сохраняет силу и в этом случае. При вычислении таких средних величин необходимо, чтобы сохранялась сумма величины объемного признака, который является числителем при построении осредняемого относительного показателя. Например, при вычислении средней величины урожайности какой-либо сельскохозяйственной культуры (по формуле (5.2)) необходимо, чтобы общий объем валового сбора этой культуры остался неизменным при замене индивидуальных величин урожайности средней величиной. Нельзя менять реальную величину объемного признака - она является базой расчета средней. Чтобы выполнить указанное условие, в качестве весов при расчете средней величины относительного показателя необходимо принять значения того признака, который является знаменателем при определении относительного показателя. Так, при вычислении средней урожайности по совокупности хозяйств весами должны служить размеры площади данной культуры.

Рассмотрим пример расчета средней доли предметов народного потребления в общем выпуске промышленной продукции по совокупности предприятий (табл. 5.3). В этом случае весом должен являться общий объем всей продукции предприятия.

Тогда средняя доля предметов народного потребления в продукции четырех предприятий равна: х = (615,5: 2047) • 100\% = 30,07\%. Средняя доля ближе к долям у тех предприятий, которые имеют большой объем всей продукции (предприятия № 2 и 3). Числитель средней величины  - это объем выпуска предметов потребления всеми предприятиями - величина, которая должна сохраняться неизменной при замене разных четырех долей на среднюю долю. Расчет по данным табл. 5.3 проведен на основе известных индивидуальных значений осредняемого признака и весов.

Таблица 5.3

Объем и структура промышленной продукции

 

Номера

предприятий

 

 

Объем всей

продукции, млн

руб.,  fj

 

 

Доля товаров

народного потребления,

\% xj,

Объем выпуска

товаров народного потребления,

млн руб., xj fj

1                                     138                                    75                                     103,5

2                                     650                                    38                                     247,0

3                                   1040                                    12                                     124,8

4                                     219                                    64                                     140,2

Итого                          2047                                     30,07                                615,5

 

Однако исходная информация может иметь другую форму: индивидуальные значения осредняемого признака могут быть неизвестны, зато известны индивидуальные или суммарные значения объемных признаков как числителя, так и знаменателя относительной величины. Например, известно, что в акционерном сельхозпредприя-тии было посажено 145 га картофеля и собрано с них 2595,5 т продукции. При этом совершенно неизвестно, сколько было собрано с каждого гектара из 145 га в отдельности, хотя на самом деле, конечно, индивидуальные величины продукции, полученные на каждом гектаре, существовали объективно. Однако никакой потребности в их раздельном учете нет; учет продукции ведется по бригадам, по отдельным полям севооборота, но не по каждому гектару. Среднюю урожайность картофеля получают попросту делением массы собранной продукции на площадь посадки, т. е. как относительную величину, характеризующую хозяйство в целом:

По отношению к предприятию это относительный показатель. Но существуют и сами значения урожайности с каждого из 145 га, хотя и неучтенные. По отношению к ним 17,9 т с 1 га - это средняя величина. Такую форму определения средней арифметической величины, при которой остаются неизвестными индивидуальные значения осредняемого признака, следует называть Неявной формой средней. Формула такой средней имеет вид:

 

Свойства арифметической средней величины

 

Знание некоторых математических свойств средней арифметической полезно как при ее использовании, так и при ее расчете.

1. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю.

Доказательство:

Примечание. Для взвешенной средней сумма взвешенных отклонений равна нулю.

                       Попробуйте доказать это самостоятельно.

2. Если каждое индивидуальное значение признака умножить или разделить на постоянное число, то и средняя увеличится или уменьшится во столько же раз.

Доказательство:

Вследствие этого свойства индивидуальные значения признака можно сократить в с раз, произвести расчет средней и результат умножить на с.

3. Если к каждому индивидуальному значению признака прибавить или из каждого значения вычесть постоянное число, то средняя величина возрастет или уменьшится на это же число.

Доказательство:

Это свойство полезно использовать при расчете средней величи-ны из многозначных и слабоварьирующих значений признака, например роста группы лиц: х1 = 179 см; х2 = 183 см;  х3= 171 см; х4 = 180 см; х 5= 169 см. Для вычисления среднего роста из каждого значения вычитаем 170 см и находим среднюю из остатков:

(9+ 13 + 1 + 10 - 1) : 5 = 6,4. Средний рост = 6,4 + 170 = 176,4 см.

4. Если веса средней взвешенной умножить или разделить на постоянное число, средняя величина не изменится.

Доказательство:

Используя это свойство, при расчетах следует сокращать веса на их общий сомножитель либо выражать многозначные числа весов в более крупных единицах измерения.

В табл. 5.4 приведен пример комплексного использования свойств средней арифметической для облегчения расчетов.

        Таблица 5.4

Расчет средней продуктивности коров на ферме

 

Группы коров

по надою за

год, кг хj

Число

Коров fj

 

 

Середина

интервала,

кг, x’j

    

 

3000 – 3400             43                      3200                            - 8                             - 344

3400 - 3800              71                      3600                            - 4                             - 284

3800-4200              102                      4000                              0                                 0

4200-4600                64                      4400                              4                                256

4600 - 5000              27                      4800                              8                                216

Итого                     307                         -                                  -                                -156

 

          83

Средний надой молока на корову находим так:

5. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа.

Доказательство. Составим сумму квадратов отклонений от переменной а:

Чтобы найти экстремум этой функции, нужно ее производную по а приравнять нулю:

Отсюда имеем:

Таким образом, экстремум суммы квадратов отклонений достигается при а = х. Так как логически ясно, что максимума функция не может иметь, этот экстремум является минимумом.

 

                 Применение простой и взвешенной средней

 

Простая и взвешенная средние величины различаются не только по величине (не всегда), по способу вычисления, но и по своей роли в решении различных задач статистического анализа. Рассмотрим, например, среднюю величину урожайности картофеля в группе хозяйств. Если эта средняя при решении поставленной задачи входит в систему показателей площади посадки, валового сбора, себестоимости, суммы затрат и других характеристик производства, то следует применять взвешенную среднюю, так как произведение невзвешенной средней на общую сумму площадей не даст суммы валового сбора.

Если же нас интересуют такие задачи, как измерение вариации урожайности между хозяйствами или связь урожайности с дозой органических удобрений, то следует применять простую среднюю величину урожайности, полностью абстрагируясь от размеров площадей посадки. Иначе на полученный результат повлияют различия площадей, совершенно не касающиеся этого признака. Точно так же, если необходимо изучить колебания урожайности за ряд лет и выявить их связь с температурой июня и суммой осадков за лето, нужно применять простую среднюю урожайность за ряд лет, абстрагируясь от различия размеров площадей в разные годы.

Чтобы правильно применять средние величины, следует знать, от каких причин зависит различие между простой и взвешенной средними. Рассмотрим этот вопрос на примере арифметической средней. Пусть x̅ - простая средняя, х̅z - взвешенная средняя, в которой весами выступают значения признака z, п - число единиц совокупности. Отклонения индивидуальных значений признака хi от простой средней х̅ обозначим ∆xi = хi - х̅. Отклонения признака веса ∆zi = zi -z̅. Тогда индивидуальные значения признаков х и z можно выразить через их средние и отклонения: хi = х̅ + ∆xi; zi = z̅ + ∆zi, а взвешенную среднюю х, представить в виде

Перемножим величины в скобках и просуммируем почленно, имея в виду, что . Средние величины можно вынести за знак суммирования, как константы. Получим:

Так как суммы отклонений индивидуальных значений признака от средней арифметической согласно первому ее свойству равны нулю, то второе и третье слагаемые числителя также равны нулю.

Остается:

Числитель второго слагаемого в формуле (5.4) - это числитель коэффициента корреляции между осредняемым и весовым признаками (см. формулы 8.11 и 8.14). Подставив выражение коэффициента корреляции /^ в (5.4), получим:

Итак, средняя арифметическая взвешенная равна простой средней плюс произведение среднего квадратического отклонения ос-редняемого признака на коэффициент вариации весового признака и на коэффициент корреляции между этими признаками. Если обе части равенства (5.5) разделить на простую среднюю х, получим:

(О среднем квадратическом отклонении и коэффициенте вариации см. ниже в этой главе.)

Из (5.5) следует, что взвешенная средняя равна простой в трех случаях:

• а) если не варьирует изучаемый признак, σх = 0 - тривиальная ситуация, когда и сами средние не нужны;

• б) при условии, что не варьирует признак-вес vz = 0;

• в) в случаях, когда между осредняемым и признаком-весом нет линейной корреляции, rxz = 0.

Взвешенная средняя больше простой, если эта корреляция прямая. Взвешенная средняя меньше простой средней, если эта корреляция обратная.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 |