Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СтатистикаЛевина 2012

.pdf
Скачиваний:
147
Добавлен:
10.05.2015
Размер:
4.83 Mб
Скачать

Таблица 2.2 Плотность населения регионов сибирского федерального округа за 2002 г.

Регионы

Число жителей на 1 км2

Республика Тыва

1,1

Красноярский край

1,3

Республика Алтай

2,2

Читинская область

2,7

Республика Бурятия

2,8

Томская область

3,3

Иркутская область

3,4

Республика Хакасия

8,8

Омская область

14,9

Новосибирская область

15,1

Алтайский край

15,4

Кемеровская область

30,3

в) непрерывные (интервальные), где значения заданы в виде интервала. В качестве примера приведем распределение численности работников по размерам начисленной заработной платы (табл. 2.3).

Таблица 2.3 Распределение численности работников Кемеровской области по

размерам начисленной заработной платы за апрель 2002 г. (в процентах от общей численности работающих)

 

 

 

В том числе:

 

Группы работников

Вся

 

 

 

химиче-

по размерам начис-

Электро-

 

 

ская

промыш-

топлив-

метал-

ленной заработной

энергети-

и нефте-

ленность

ная

лургия

платы, р.

ка

химиче-

 

 

 

 

 

 

 

 

ская

Всего работников

100

100

100

100

100

До 300

0,1

0,0

0,1

300,1–400,0

0,1

0,1

0,1

400,1–600,0

0,4

0,2

0,2

0,0

0,0

600,1–800,0

0,7

0,3

0,3

0,0

0,1

800,1–1000,0

1,1

0,2

0,4

0,1

0,5

1000,1–1400,0

3,6

0,7

1,8

0,5

2,5

1400,1–1800,0

4,6

1,7

3,0

1,2

3,3

1800,1–2200,0

5,2

2,6

3,5

2,5

5,3

2200,1–2600,0

6,1

3,6

4,2

3,4

9,1

2600,1–3000,0

5,9

5,3

4,1

4,1

10,6

3000,1–3400,0

6,1

4,2

4,8

4,7

15,9

 

 

40

 

 

 

Продолжение таблицы

3400,1–4200,0

11,4

9,3

11,3

10,8

20,4

4200,1–5000,0

10,4

13,1

10,7

11,5

14,1

5000,1–5800,0

8,9

11,3

10,0

11,4

7,7

5800,1–7400,0

13,8

20,0

17,2

18,7

6,1

7400,1–9000,0

8,3

11,4

10,2

12,8

2,1

9000,1–10600,0

5,4

6,4

7,0

7,9

1,0

10600,1–13800,0

4,8

5,6

6,6

6,7

0,7

13800,1–17000,0

1,6

2,3

2,4

1,9

0,3

17000,1–20200,0

0,7

0,9

1,1

0,8

0,1

20200,1–5000,0

0,4

0,3

0,6

0,6

0,1

Свыше 25000

0,4

0,5

0,4

0,4

0,1

2.2.2. Графическое изображение рядов распределения

Графическое изображение рядов распределения облегчает их анализ и позволяет судить о форме распределения. Дискретные ряды изображают с помощью полигона распределения, а интервальные – с помощью гистограммы распределения. Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого вариационного ряда называется полигоном распределения. Для его построения на оси абсцисс отмечают точки, соответствующие величине вариантов значений признака, из них восстанавливаются перпендикуляры, длина которых соответствует частоте (частости) этих вариантов по принятому масштабу на оси ординат. Вершины перпендикуляров в последовательном порядке соединяются отрезками прямых. Для замыкания полигона крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе от хmax и xmin. Такое построение полигона облегчает восприятие его графического изображения (рис.2.2).

Рассмотрим построение полигона распределения на основе данных, представленных в таблице 2.1 о распределении рабочих по тарифному разряду.

41

35

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

25

 

 

 

30

 

25

 

20

 

 

 

 

 

 

 

fi

 

 

 

 

 

 

 

15

 

 

20

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

10

5

 

10

 

 

 

 

 

 

 

 

 

 

 

 

0

5

 

 

 

 

 

0

 

1

2

3

4

5

6

7

 

 

 

 

xi

 

 

 

Рис. 2.2. Распределение рабочих по тарифному разряду:

 

хi – тарифный разряд; fi – число рабочих, чел.

Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные на оси абсцисс – это интервалы значений варьирующих признака, а высоты столбиков – частоты (частости), соответствующие масштабу по оси ординат. Диаграмма этого рода часто называется гистограммой (рис. 2.3). Для ее построения воспользуемся данными о распределении предприятий по объему добычи угля (табл. 2.4).

42

Таблица 2.4 Распределение горных предприятий Кемеровской области

по объему добычи угля в 2003 г. (январь-сентябрь)

Предприятия с годовым

Количество

Накопленные (кумуля-

объемом добычи

предприятий

тивные) частоты Si

(варианта) хi, тыс. т

(частота) fi

 

251-500

8

8

501-750

10

18

751-1000

10

28

1001-1250

6

34

1251-1500

5

39

Всего:

39

 

fi

12

 

 

 

 

 

10

 

 

 

 

 

8

 

 

 

 

 

6

 

 

 

 

 

4

 

 

 

 

 

2

 

 

 

 

 

0

 

 

 

 

 

250

500

750

1000

1250

1500

 

 

 

xi

 

 

Рис. 2.3. Распределение горных предприятий Кемеровской области по объему добычи угля в 2003 г. (январь–сентябрь):

хi – объем добычи, тыс. т; fi – количество предприятий

Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединяются отрезками прямых. Площадь полигона должна быть равна площади гистограммы, поэтому должны быть точки с нулевыми частотами и значениями xi в условных интервалах до первого и после последнего (их середины).

При построении гистограммы для вариационного ряда с неравными интервалами нужно по оси ординат наносить показатели плотности интервалов (абсолютные или относительные). В этом случае высоты прямоугольников гистограммы будут соответствовать величине плотности распределения. Отношение высоты полигона

43

или гистограммы к основанию удобнее брать в пропорции 5 к 8.

При увеличении числа наблюдений из одной и той же совокупности увеличивается число групп интервального ряда, что соответственно приводит к уменьшению величины интервала. При этом ломаная линия имеет тенденцию превращения в плавную кривую, которая называется кривой распределения. Кривая распределения характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри однокачественной совокупности.

Преобразованной формой вариационного ряда является ряд накопленных (кумулятивных) частот (рис. 2.4). См. графа 3 табл. 2.4 распределения горных предприятий Кемеровской области по объему добычи угля в 2003 г. (январь–сентябрь).

По данным частотам можно судить о том, какое число единиц совокупности обладает значением признака «не меньше, чем» или «не больше, чем». Так в нашем примере можно сказать, что 28 предприятий из 39, имеют добычу, объем которой не превышает 1000 тыс. тонн. В первом случае график кумулятивного распределения называется кумулятой, во втором – огивой.

При графическом изображении кумуляты накопленные частоты наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервала. Длина этих перпендикуляров равна сумме накопленных частот в данном интервале. Перпендикуляры затем соединяют прямыми, в результате чего получаем ломаную линию, которая, начиная от 0, все время возрастает до тех пор, пока не достигает высоты, равной объему данной совокупности, т.е. сумме частот ряда.

44

45

 

 

 

 

 

 

 

40

 

39

 

 

 

39

 

 

 

 

 

 

 

35

 

 

34

 

34

 

 

 

 

 

 

 

 

30

 

 

 

28

 

 

 

 

 

 

 

 

 

 

25

 

 

 

 

 

 

 

si

 

 

 

 

 

 

 

20

 

 

18

 

18

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

10

 

8

 

 

 

8

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

0

0

 

 

 

 

 

0

0

250

500

750

1000

1250

1500

1750

 

 

 

 

xi

 

 

 

Рис. 2.4. Огива и кумулята распределения предприятий по объему добычи угля в 2003 г. Кемеровской области:

хi – объем добычи, тыс. т; Si – накопленные частоты

2.2.3. Построение группировки

Ряды распределения позволяют систематизировать и обобщить полученный материал. Однако они не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явлений, обнаружить тенденции, установить зависимости, параллельно произвести группировку исходных данных.

Для этой цели выбирается группировочный признак и разрабатывается система показателей сводки, которыми будут характеризоваться выделенные группы.

Определение и обоснование показателей целиком зависит от цели исследования и поставленной задачи. В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные, аналитические.

Типологические группировки позволяют расчленить всю изучаемую совокупность на качественно однородные экономические группы. Примером типологической группировки могут служить данные табл. 2.5.

45

Таблица 2.5 Распределение умерших в возрасте до 1 года Кемеровской облас-

ти по основным классам причин смертности

Основные классы

Число умерших в воз-

В % к итогу

расте до 1 года

причин смертности

 

 

2008 г.

2009 г.

2008 г.

2009 г.

 

Всего умерших в возрасте до 1

 

 

 

 

года

314

313

100

100

из них от:

 

 

 

 

- врожденных аномалий

66

78

21,0

24,9

- состояний, возникающих в пе-

 

 

 

 

ринатальный период

97

96

30,9

30,7

- внешних причин смерти

49

53

15,6

16,9

- болезней органов дыхания

11

4

3,5

1,3

- прочие

91

82

29,0

26,2

Структурная группировка дает возможность определить структуру явления, а также проанализировать структурные сдвиги (табл. 2.6).

Таблица 2.6 Прерывание беременности (аборты) по возрастным группам

женщин Кемеровской области

Показатели

Число абортов

В % к итогу

 

 

 

 

2008 г.

2009 г.

2008 г.

2009 г.

 

Число абортов у женщин в возрасте, лет:

21

26

0,1

0,1

до 14

 

 

 

 

15–19

3227

2856

9,1

8,3

20–34

26722

26116

75,2

75,6

35 лет и более

5557

5532

15,6

16,0

Итого:

35527

34530

100

100

Если известны структурные характеристики совокупности в одном и другом периодах: Wi0 и Wi1 – доли i-ой группы соответственно в базисном периоде («0») и в отчетном периоде («1»), то можно рассчитать показатель среднего абсолютного изменения структуры:

 

 

n

 

 

 

 

 

 

 

 

Wi1

Wi 0

 

 

 

 

 

 

 

 

dw1 w0

i 1

 

 

 

 

.

(2.1)

 

 

n

 

 

 

 

 

 

 

 

Другой сводный показатель абсолютных структурных сдвигов

46

строится на основе формулы среднеквадратического отклонения:

n

Wi1 Wi0 2

Sw1 w0

 

i 1

 

.

(2.2)

 

n

 

 

 

 

 

Если показатели структуры выразить в процентах, то также как и первый показатель, квадратичный коэффициент структурных абсолютных сдвигов оценивает, на сколько процентных пунктов в среднем различаются удельные веса отдельных групп сравниваемых структур. При отсутствии структурных сдвигов оба эти показателя равны 0; их величина тем больше, чем значительнее абсолютные изменения удельных весов групп. Квадратический коэффициент более чутко реагирует на структурные изменения. При сравнениях предполагается, что число групп в одном и другом периодах остается одним и тем же.

В нашем примере показатель среднего абсолютного изменения структуры составит:

dw1 w0

 

 

 

0,1 0,1

 

 

 

8,3 9,1

 

 

 

75,6 75,2

 

 

 

16 15,6

 

 

 

0,16

0,4 % ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

а сводный показатель абсолютных структурных сдвигов будет равен:

 

 

 

 

 

 

 

 

 

 

 

 

0,1 0,1 2 8,3 9,1 2 75,6 75,2 2 16 15,6 2

 

 

 

 

 

S

 

 

 

0,96

 

0,49 %

w1 w0

4

4

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, удельные веса возрастных групп женщин, осуществивших прерывание беременности различаются в сред-

нем на 0,4–0,49 %.

Деление группировок на типологические и структурные достаточно условно. Если задать, например, границы среднедушевого дохода, соответствующие определенным типам благосостояния, то можно с таким же правом назвать группировку типологической.

Аналитическая группировка характеризует взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой (другие) – как фактор (факторы).

Основные этапы проведения аналитической группировки:

1)обоснование и выбор факторного и результативного при-

знаков;

2)определение числа групп и величины интервала;

47

3)подсчет числа единиц в каждой из образованных групп;

4)определение объема варьирующих признаков в пределах созданных групп;

5)исчисление средних размеров результативного показателя. Для нахождения числа групп служит формула Стерджесса:

n 1 3,322 lg N ,

(2.3)

где N – количество элементов совокупности.

В случае равных интервалов величина интервала может быть определена следующим образом:

h

X max X min

 

(2.4)

n

 

 

 

 

или

 

 

 

 

h

X max X min

,

(2.5)

 

 

1 3,322 * lg N

где Х max – максимальное значение признака; Х min – минимальное значение признака.

В зависимости от числа положенных в основу группировки признаков различают: простые и многомерные. Группировка, выполненная по одному признаку, называется простой.

Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи, в комбинации.

По отношениям между признаками выделяют: иерархические и неиерархические группировки.

Иерархические группировки выполняются двум и более признакам, при этом значения 2-го признака определяются областью значений 1-го (например, классификация отраслей промышленности по подотраслям).

Неиерархические группировки строятся, когда строгой зависимости значений 2-го признака от 1-го не существует.

Среди простых группировок особо выделяют ряды распределения. По очередности обработки информации группировки бывают первичные (составленные на основе первичных данных) и

вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала.

Относительно временного критерия группировки бывают

48

статические, дающие характеристику совокупности на определенный момент времени или за определенный период, и динамические. Последние – это группировки, показывающие переходы единиц из одних групп в другие (и вход и выход из совокупности). Количество таких переходов, рисующие внутреннюю динамику совокупности, удобно располагать в «шахматную» таблицу, которую называют матрицей перехода (или миграционная матрица или матрица мобильности).

Для наглядности представим этапы сводки и группировки с краткими определениями и пояснениями в виде рис. 2.5.

49