Задача 1.3
По данным информационной таблицы варианта 3 произвести группировку индивидуальных данных, приняв за основу группировки количественный признак Х1. Группы образуйте с равными и неравными интервалами в следующей последовательности.
1. Образуйте группы с равными интервалами. По каждой группе определите:
а) число единиц наблюдения в абсолютных и относительных величинах (в % к итогу);
б) групповые обозначающие итоговые показатели признаков х1,х2,х3,х4 в абсолютных и относительных величинах (в % к итогу);
в) групповые средние величины и групповые частные дисперсии признаков х1,х2,х3,х4.
2. Образуйте группы с неравными (равнонаправленными) интервалами – 10 групп по 10 % единиц наблюдения в каждом интервале и 5 групп по 20 % единиц наблюдения в каждом интервале. По каждой группе для признаков х1,х2,х3,х4 рассчитать групповые итоговые значения названных признаков в абсолютных и относительных величинах (в % к итогу).
3. Образуйте 5 групп с интервалами, меняющимися по правилу арифметической прогрессии. Рассчитать абсолютные и относительные показатели плотности распределения. Все полученные результаты (пункты 1, 2, 3) представьте в статистических таблицах.
Решение
Во-первых проведем ранжирование данных по возрастанию признака х1. Для этого составим промежуточную таблицу 1.
Таблица 1
Подсчет итоговых показателей ранжированных данных по признаку х1
№ п/п единиц наблюдения |
Денежные доходы семьи за месяц, руб. Х1 |
Результативные признаки |
||
Расходы на питание семьи за месяц, руб. Х2 |
Размеры семьи, чел. Х3 |
Альтернативный признак Х4 |
||
1 |
2 |
3 |
4 |
5 |
1 |
14400 |
10244 |
3 |
1 |
2 |
15250 |
18095 |
3 |
1 |
3 |
26800 |
25102 |
4 |
0 |
4 |
26900 |
5048 |
2 |
0 |
5 |
27640 |
10251 |
2 |
1 |
6 |
29680 |
20055 |
6 |
1 |
7 |
30200 |
6255 |
3 |
0 |
8 |
38100 |
10251 |
2 |
1 |
9 |
38250 |
15190 |
3 |
0 |
10 |
38900 |
10249 |
4 |
0 |
11 |
39600 |
10360 |
3 |
1 |
12 |
39600 |
12158 |
3 |
0 |
13 |
39680 |
15137 |
4 |
1 |
14 |
44400 |
13138 |
5 |
1 |
15 |
44800 |
10108 |
4 |
1 |
16 |
45000 |
23500 |
6 |
0 |
17 |
45400 |
10108 |
3 |
1 |
18 |
46560 |
20138 |
5 |
1 |
19 |
47100 |
13575 |
3 |
1 |
20 |
48500 |
23255 |
4 |
0 |
21 |
48500 |
11254 |
3 |
1 |
22 |
48700 |
10249 |
6 |
0 |
23 |
55800 |
21100 |
3 |
1 |
24 |
56450 |
7190 |
4 |
0 |
25 |
57100 |
11267 |
5 |
0 |
26 |
58900 |
11267 |
3 |
0 |
27 |
65240 |
15048 |
5 |
0 |
Окончание таблицы 1
1 |
2 |
3 |
4 |
5 |
28 |
67215 |
15137 |
4 |
0 |
29 |
68760 |
11254 |
3 |
0 |
30 |
76890 |
12158 |
4 |
1 |
Итого |
1330315 |
408141 |
112 |
15 |
1) Для построения равноинтервального ряда распределения определим число групп, величину интервала, установим полную шкалу интервалов, в соответствии с ней сгруппируем результаты наблюдений. Группировочный признак – Х1 – денежные доходы семьи за месяц.
Число групп и величину интервала определим по формуле Стэрджеса:
К = 1+3,222 lq n (1),
где K – число групп,
n – число единиц наблюдения.
К = 1+3,222 lq 30 = 5,76 ≈ 6 групп
Величину интервала рассчитаем по формуле:
i =(Xmax – Xmin)/K (2),
где Xmax – максимальное значение группировочного признака,
Xmin – минимальное значение группировочного признака.
При xmax =76890 руб., xmin = 14400 руб. и n = 6 величина интервала равна:
i =(76890 – 14400)/6 = 10415 (руб.)
За начало первого интервала примем минимальную варианту рассматриваемого признака – 14400. Начало второго интервала совпадает с концом первого и равно xmin + i =14400+10415 = 24815. Начало третьего интервала совпадает с концом второго и равно 35230 (24815+10415) и т. д. Тогда интервалы будут иметь вид:
Таблица 2 Расчет нижних и верхних границ интервалов |
||
Номер группы |
Нижняя граница признака |
Верхняя граница признака |
1 |
14400 |
24815 |
2 |
24815 |
35230 |
3 |
35230 |
45645 |
4 |
45645 |
56060 |
5 |
56060 |
66475 |
6 |
66475 |
76890 |
Границы последовательных интервалов записываются в первую графу таблицы, в интервал включаются данные, большие или равные нижней границе интервала и меньшие верхней границы.
а) по каждой группе определяем число единиц наблюдения. Относительные величины, выраженные в % исчисляются по общим арифметическим правилам:
х% = а*100/А (3)
например, в первую группу попало 8 единиц наблюдения, тогда х1% = 8*100/30 =2 6,7 %, во второй интервал - 6 единиц, т. е. Х2%=6*100/30=20 %, в третью группу – 7 единиц, т. е. Х3% = 7*100/30=23,3 % и т. д. Результат группировки представлен в таблице 3.
Таблица 3 Число единиц наблюдения по группам (в абсолютных и относительных величинах) |
|||
Номер группы |
Нижняя и верхняя граница признака Х1, руб. |
Число единиц наблюдения |
|
Абсолютные величины |
% |
||
1 |
14400-24815 |
2 |
6,7 |
2 |
24815-35230 |
5 |
16,7 |
3 |
35230-45645 |
10 |
33,3 |
4 |
45645-56060 |
6 |
20,0 |
5 |
56060-66475 |
4 |
13,3 |
6 |
66475-76890 |
3 |
10,0 |
Итого |
|
30 |
100,0 |
б) групповые обозначающие итоговые показатели признаков х1,х2,х3,х4 в абсолютных и относительных величинах (в % к итогу) представлены в таблице 5 с использованием данных вспомогательной таблицы 4.
Таблица 4
Группировка исходных данных
№ п/п единиц наблюдения |
Денежные доходы семьи за месяц, руб. Х1 |
Результативные признаки |
||
Расходы на питание семьи за месяц, руб. Х2 |
Размеры семьи, чел. Х3 |
Альтернативный признак Х4 |
||
1 |
2 |
3 |
4 |
5 |
1 |
14400 |
10244 |
3 |
1 |
2 |
15250 |
18095 |
3 |
1 |
Итого по группе 1 |
29650 |
28339 |
6 |
2 |
3 |
26800 |
25102 |
4 |
0 |
4 |
26900 |
5048 |
2 |
0 |
5 |
27640 |
10251 |
2 |
1 |
6 |
29680 |
20055 |
6 |
1 |
7 |
30200 |
6255 |
3 |
0 |
Итого по группе 2 |
141220 |
66711 |
17 |
2 |
8 |
38100 |
10251 |
2 |
1 |
9 |
38250 |
15190 |
3 |
0 |
10 |
38900 |
10249 |
4 |
0 |
11 |
39600 |
10360 |
3 |
1 |
12 |
39600 |
12158 |
3 |
0 |
13 |
39680 |
15137 |
4 |
1 |
14 |
44400 |
13138 |
5 |
1 |
15 |
44800 |
10108 |
4 |
1 |
16 |
45000 |
23500 |
6 |
0 |
17 |
45400 |
10108 |
3 |
1 |
Итого по группе 3 |
413730 |
130199 |
37 |
6 |
18 |
46560 |
20138 |
5 |
1 |
19 |
47100 |
13575 |
3 |
1 |
20 |
48500 |
23255 |
4 |
0 |
21 |
48500 |
11254 |
3 |
1 |
22 |
48700 |
10249 |
6 |
0 |
23 |
55800 |
21100 |
3 |
1 |
Итого по группе 4 |
295160 |
99571 |
24 |
4 |
24 |
56450 |
7190 |
4 |
0 |
25 |
57100 |
11267 |
5 |
0 |
26 |
58900 |
11267 |
3 |
0 |
27 |
65240 |
15048 |
5 |
0 |
|
|
|
|
|
Итого по группе 5 |
237690 |
44772 |
17 |
0 |
28 |
67215 |
15137 |
4 |
0 |
Окончание таблицы 4
1 |
2 |
3 |
4 |
5 |
30 |
76890 |
12158 |
4 |
1 |
Итого по группе 6 |
212865 |
38549 |
11 |
1 |
Итого |
1330315 |
408141 |
112 |
15 |
Таблица 5 Групповые обобщающие итоговые показатели признаков х1,х2,х3,х4 (в абсолютных и относительных величинах) |
||||||||
№ группы |
Показатели |
|||||||
Х1 |
х2 |
х3 |
х4 |
|||||
руб. |
% |
руб. |
% |
чел. |
% |
чел. |
% |
|
1 |
29650 |
2,2 |
28339 |
6,9 |
6 |
5,4 |
2 |
13,3 |
2 |
141220 |
10,6 |
66711 |
16,3 |
17 |
15,2 |
2 |
13,3 |
3 |
413730 |
31,1 |
130199 |
31,9 |
37 |
33,0 |
6 |
40,0 |
4 |
295160 |
22,2 |
99571 |
24,4 |
24 |
21,4 |
4 |
26,7 |
5 |
237690 |
17,9 |
44772 |
11,0 |
17 |
15,2 |
0 |
0,0 |
6 |
212865 |
16,0 |
38549 |
9,4 |
11 |
9,8 |
1 |
6,7 |
Итого |
1330315 |
100,0 |
408141 |
100,0 |
112 |
100,0 |
15 |
100,0 |
в) групповые средние величины и групповые частные дисперсии признаков х1,х2,х3,х4 определяются по формулам (1) и (5) задачи 1.2. Расчеты групповых частных дисперсий проводятся по каждому признаку и по каждой группе в отдельности с использованием статистических функций программы Excel. Результаты расчетов представлены в таблицах 6 и 7.
Таблица 6 Групповые средние величины признаков х1,х2,х3,х4 |
||||
№ группы |
х1 |
х2 |
х3 |
х4 |
1 |
14825,00 |
14169,50 |
3,00 |
1,00 |
2 |
28244,00 |
13342,20 |
3,40 |
0,40 |
3 |
41373,00 |
13019,90 |
3,70 |
0,60 |
4 |
49193,33 |
16595,17 |
4,00 |
0,67 |
5 |
59422,50 |
11193,00 |
4,25 |
0,00 |
6 |
70955,00 |
12849,67 |
3,67 |
0,33 |
Таблица 7
Групповые частные дисперсии признаков
№ группы |
Показатели |
|||
σ1² |
σ2² |
σ3² |
σ4² |
|
1 |
180625 |
15409550,25 |
0,00 |
0,00 |
2 |
2028864,00 |
62386450,96 |
2,24 |
0,24 |
3 |
8601361,00 |
15915884,69 |
1,21 |
0,24 |
4 |
9361555,56 |
25853645,14 |
1,33 |
0,22 |
5 |
12086518,75 |
7723996,50 |
0,69 |
0,00 |
6 |
18009950,00 |
2752149,56 |
0,22 |
0,22 |
2. При заданном числе групп (10,5) определяется равное число единиц наблюдения в каждой группе:
S = n/K (4)
Так, при заданном числе групп 10 - S = 30/10 = 3, т. е. в каждую группу войдут по 3 единицы (см. табл. 8).
Таблица 8
Вспомогательная таблица группировки при числе групп 10
№ п/п единиц наблюдения |
Денежные доходы семьи за месяц, руб. Х1 |
Результативные признаки |
||
Расходы на питание семьи за месяц, руб. Х2 |
Размеры семьи, чел. Х3 |
Альтернативный признак Х4 |
||
1 |
2 |
3 |
4 |
5 |
1 |
14400 |
10244 |
3 |
1 |
2 |
15250 |
18095 |
3 |
1 |
3 |
26800 |
25102 |
4 |
0 |
Итого |
56450 |
53441 |
10 |
2 |
4 |
26900 |
5048 |
2 |
0 |
5 |
27640 |
10251 |
2 |
1 |
6 |
29680 |
20055 |
6 |
1 |
Итого |
84220 |
35354 |
10 |
2 |
7 |
30200 |
6255 |
3 |
0 |
8 |
38100 |
10251 |
2 |
1 |
9 |
38250 |
15190 |
3 |
0 |
Итого |
106550 |
31696 |
8 |
1 |
10 |
38900 |
10249 |
4 |
0 |
11 |
39600 |
10360 |
3 |
1 |
12 |
39600 |
12158 |
3 |
0 |
Итого |
118100 |
32767 |
10 |
1 |
13 |
39680 |
15137 |
4 |
1 |
14 |
44400 |
13138 |
5 |
1 |
Окончание таблицы 8
1 |
2 |
3 |
4 |
5 |
15 |
44800 |
10108 |
4 |
1 |
Итого |
128880 |
38383 |
13 |
3 |
16 |
45000 |
23500 |
6 |
0 |
17 |
45400 |
10108 |
3 |
1 |
18 |
46560 |
20138 |
5 |
1 |
Итого |
136960 |
53746 |
14 |
2 |
19 |
47100 |
13575 |
3 |
1 |
20 |
48500 |
23255 |
4 |
0 |
21 |
48500 |
11254 |
3 |
1 |
Итого |
144100 |
48084 |
10 |
2 |
22 |
48700 |
10249 |
6 |
0 |
23 |
55800 |
21100 |
3 |
1 |
24 |
56450 |
7190 |
4 |
0 |
Итого |
160950 |
38539 |
13 |
1 |
25 |
57100 |
11267 |
5 |
0 |
26 |
58900 |
11267 |
3 |
0 |
27 |
65240 |
15048 |
5 |
0 |
Итого |
181240 |
37582 |
13 |
0 |
28 |
67215 |
15137 |
4 |
0 |
29 |
68760 |
11254 |
3 |
0 |
30 |
76890 |
12158 |
4 |
1 |
Итого |
212865 |
38549 |
11 |
1 |
Всего |
1330315 |
408141 |
112 |
15 |
Используя данные вспомогательной таблицы 8, видим нижнюю границу первого интервала 14400, верхнюю 26800 включительно, для второго интервала 29680 включительно и т. д.
Аналогично при числе групп 5, в каждую группу попадет (30/5) 6 единиц наблюдения (см. вспомогательную таблицу 9).
Таблица 9
Вспомогательная таблица группировки при числе групп 5
№ п/п единиц наблюдения |
Денежные доходы семьи за месяц, руб. Х1 |
Результативные признаки |
||
Расходы на питание семьи за месяц, руб. Х2 |
Размеры семьи, чел. Х3 |
Альтернативный признак Х4 |
||
1 |
2 |
3 |
4 |
5 |
1 |
14400 |
10244 |
3 |
1 |
2 |
15250 |
18095 |
3 |
1 |
3 |
26800 |
25102 |
4 |
0 |
4 |
26900 |
5048 |
2 |
0 |
Окончание таблицы 9
1 |
2 |
3 |
4 |
5 |
5 |
27640 |
10251 |
2 |
1 |
6 |
29680 |
20055 |
6 |
1 |
Итого |
140670 |
88795 |
20 |
4 |
7 |
30200 |
6255 |
3 |
0 |
8 |
38100 |
10251 |
2 |
1 |
9 |
38250 |
15190 |
3 |
0 |
10 |
38900 |
10249 |
4 |
0 |
11 |
39600 |
10360 |
3 |
1 |
12 |
39600 |
12158 |
3 |
0 |
Итого |
224650 |
64463 |
18 |
2 |
13 |
39680 |
15137 |
4 |
1 |
14 |
44400 |
13138 |
5 |
1 |
15 |
44800 |
10108 |
4 |
1 |
16 |
45000 |
23500 |
6 |
0 |
17 |
45400 |
10108 |
3 |
1 |
18 |
46560 |
20138 |
5 |
1 |
Итого |
265840 |
92129 |
27 |
5 |
19 |
47100 |
13575 |
3 |
1 |
20 |
48500 |
23255 |
4 |
0 |
21 |
48500 |
11254 |
3 |
1 |
22 |
48700 |
10249 |
6 |
0 |
23 |
55800 |
21100 |
3 |
1 |
24 |
56450 |
7190 |
4 |
0 |
Итого |
305050 |
86623 |
23 |
3 |
25 |
57100 |
11267 |
5 |
0 |
26 |
58900 |
11267 |
3 |
0 |
27 |
65240 |
15048 |
5 |
0 |
28 |
67215 |
15137 |
4 |
0 |
29 |
68760 |
11254 |
3 |
0 |
30 |
76890 |
12158 |
4 |
1 |
Итого |
394105 |
76131 |
24 |
1 |
Всего |
1330315 |
408141 |
112 |
15 |
Групповые итоговые значения названных признаков в абсолютных и относительных величинах (в % к итогу) представлены в таблице 10 и 11.
Относительная величина признака Х1 в первой группе: 56450*100/1330315= 4,24 %; во второй группе 84220*100/1330315= 6,33 % и т. д.
Таблица 10
Групповые обобщающие итоговые показатели признаков Х1,Х2,Х3,Х4 |
||||||
№ п/п |
Нижние и верхние границы интервалов |
Число единиц наблюдения |
Показатели |
|||
х1 |
х2 |
х3 |
х4 |
|||
1 |
14400-26800 |
3 |
56450 |
53441 |
10 |
2 |
2 |
26800-29680 |
3 |
84220 |
35354 |
10 |
2 |
3 |
29680-38250 |
3 |
106550 |
31696 |
8 |
1 |
4 |
38250-39600 |
3 |
118100 |
32767 |
10 |
1 |
5 |
39600-44800 |
3 |
128880 |
38383 |
13 |
3 |
6 |
44800-46560 |
3 |
136960 |
53746 |
14 |
2 |
7 |
46560-48500 |
3 |
144100 |
48084 |
10 |
2 |
8 |
48500-56450 |
3 |
160950 |
38539 |
13 |
1 |
9 |
56450-65240 |
3 |
181240 |
37582 |
13 |
0 |
10 |
65240-76890 |
3 |
212865 |
38549 |
11 |
1 |
ИТОГО |
30 |
1330315 |
408141 |
112 |
15 |
|
20 % наполняемость |
||||||
1 |
10200-38250 |
6 |
140670 |
88795 |
20 |
4 |
2 |
38250-45400 |
6 |
224650 |
64463 |
18 |
2 |
3 |
45400-64500 |
6 |
265840 |
92129 |
27 |
5 |
4 |
64500-76400 |
6 |
305050 |
86623 |
23 |
3 |
5 |
76400-96800 |
6 |
394105 |
76131 |
24 |
1 |
ИТОГО |
30 |
1330315 |
408141 |
112 |
15 |
Таблица 11
Групповые обобщающие итоговые показатели признаков Х1,Х2,Х3,Х4, в относительных величинах, % |
||||||
№ п/п |
Нижние и верхние границы интервалов |
Число единиц наблюдения |
Показатели |
|||
х1 |
х2 |
х3 |
х4 |
|||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
14400-26800 |
10 |
4,24 |
13,09 |
8,93 |
13,33 |
2 |
26800-29680 |
10 |
6,33 |
8,66 |
8,93 |
13,33 |
3 |
29680-38250 |
10 |
8,01 |
7,77 |
7,14 |
6,67 |
4 |
38250-39600 |
10 |
8,88 |
8,03 |
8,93 |
6,67 |
5 |
39600-44800 |
10 |
9,69 |
9,40 |
11,61 |
20,00 |
6 |
44800-46560 |
10 |
10,30 |
13,17 |
12,50 |
13,33 |
7 |
46560-48500 |
10 |
10,83 |
11,78 |
8,93 |
13,33 |
8 |
48500-56450 |
10 |
12,10 |
9,44 |
11,61 |
6,67 |
9 |
56450-65240 |
10 |
13,62 |
9,21 |
11,61 |
0,00 |
10 |
65240-76890 |
10 |
16,00 |
9,45 |
9,82 |
6,67 |
ИТОГО |
100 |
100,00 |
100,00 |
100,00 |
100,00 |
|
20 % наполняемость |
||||||
1 |
14400-29680 |
20 |
10,57 |
21,76 |
17,86 |
26,67 |
2 |
29680-39600 |
20 |
16,89 |
15,79 |
16,07 |
13,33 |
Окончание таблицы 11
1 |
2 |
3 |
4 |
5 |
6 |
7 |
3 |
39600-46560 |
20 |
19,98 |
22,57 |
24,11 |
33,33 |
4 |
46560-56450 |
20 |
22,93 |
21,22 |
20,54 |
20,00 |
5 |
56450-76890 |
20 |
29,62 |
18,65 |
21,43 |
6,67 |
ИТОГО |
100 |
100,00 |
100,00 |
100,00 |
100,00 |
3. Определим величину первого интервала:
i = (Xmax – Xmin)/ΣN (5),
где N – номер интервала -1-ый, 2-ой, 3-ий, 4-ый, 5-ый.
В данной задаче: i1=(76890-14400)/15 = 4166
Определяем величину всех последующих интервалов:
i2= 4166*2 =18566, i3= 4166*3 = 12498, i4= 4166*4 =16664, i5= 4166*5 = 20830.
Произведем подсчет единиц наблюдения по группам и рассчитываем абсолютные и относительные показатели плотности распределения, как отношение частот и частостей к величине соответствующего интервала.
Например, для третьего интервала с величиной 12498 абсолютная величина плотности распределения 7/12498=0,00048, относительная 23,33/12498=0,0016. Выходные данные представлены в таблице 12.
Таблица 12
Число единиц наблюдения по группам с интервалами, изменяющимися по правилу арифметической прогрессии
№ п/п |
Нижние и верхние значения интервалов |
Число единиц наблюдения |
Показатели плотности распределения |
||
абсолютные |
относительные |
абсолютные |
относительные |
||
1 |
14400-18566 |
2 |
6,67 |
0,00048 |
0,00160 |
2 |
18566-26898 |
1 |
3,33 |
0,00012 |
0,00040 |
3 |
26898-39396 |
7 |
23,33 |
0,00056 |
0,00187 |
4 |
39396-56060 |
13 |
43,33 |
0,00078 |
0,00260 |
5 |
56060-76890 |
7 |
23,33 |
0,00034 |
0,00112 |
Итого |
30 |
100,00 |
|
|