Задача 1.4
По данным задачи 1.3 для каждого признака – х1, х2, х3, х4 рассчитать общие средние значения, дисперсии, средние из групповых, как средневзвешенные величины. Вычислить межгрупповые дисперсии. Использовать правило сложения дисперсии, определить общие дисперсии.
В целях выявления тесноты связи между признаком – Х1, принятым за основании группировки и каждым из результативных признаков вычислите коэффициенты детерминации и эмпирические корреляционные отношения. Результаты оформите в статистической таблице, сформулировать необходимые пояснения.
Решение
Рассчитаем общие средние величины признаков х1, х2, х3, х4 из их групповых значений:
Х = sss (1),
где s - средняя величина j признака в s группе,
s - соответствующая частота s группы.
Расчеты средних для всех признаков представлены в таблицах 1 - 4.
Таблица 1 Расчет общей средней величины признака х1 из его средних групповых значений |
|||
Номер группы |
Средняя по группе Xs |
Число наблюдений fs |
Хs*fs |
1 |
14825,00 |
2 |
29650 |
2 |
28244,00 |
5 |
141220 |
3 |
41373,00 |
10 |
413730 |
4 |
49193,33 |
6 |
295160 |
5 |
59422,50 |
4 |
237690 |
6 |
70955,00 |
3 |
212865 |
Итого |
|
30 |
1330315 |
Общая средняя признака х1:
Х1 =1330315/30=44343,8
Таблица 2 Расчет общей средней величины признака х2 из его средних групповых значений |
|||
Номер группы |
Средняя по группе Xs |
Число наблюдений fs |
Хs*fs |
1 |
14169,50 |
2 |
28339 |
2 |
13342,20 |
5 |
66711 |
3 |
13019,90 |
10 |
130199 |
4 |
16595,17 |
6 |
99571 |
5 |
11193,00 |
4 |
44772 |
6 |
12849,67 |
3 |
38549 |
Итого |
|
30 |
408141 |
X2c |
|
|
13604,7 |
Таблица 3 Расчет общей средней величины признака х3 из его средних групповых значений |
|||
Номер группы |
Средняя по группе Xs |
Число наблюдений fs |
Хs*fs |
1 |
3,00 |
2 |
6 |
2 |
3,40 |
5 |
17 |
3 |
3,70 |
10 |
37 |
4 |
4,00 |
6 |
24 |
5 |
4,25 |
4 |
17 |
6 |
3,67 |
3 |
11 |
Итого |
|
30 |
112 |
X3c |
|
|
3,73 |
Таблица 4 Расчет общей средней величины признака х4 из его средних групповых значений |
|||
Номер группы |
Средняя по группе Xs |
Число наблюдений fs |
Хs*fs |
1 |
1,00 |
2 |
2 |
2 |
0,40 |
5 |
2 |
3 |
0,60 |
10 |
6 |
4 |
0,67 |
6 |
4 |
5 |
0,00 |
4 |
0 |
6 |
0,33 |
3 |
1 |
Итого |
|
30 |
15 |
X4c |
|
|
0,5 |
2. Дисперсия средняя из групповых определяется по формуле:
² = σs²*s / s (2),
где σs² - дисперсия j признака в s группе.
Расчет дисперсии средней из групповых по признаку Х1 представлен в таблице 5.
Таблица 5 Расчет дисперсии средней из групповых |
|||
Номер группы |
Дисперсия по группе |
Число наблюдений fs |
σs*fs |
1 |
180625 |
2 |
361250 |
2 |
2028864,00 |
5 |
10144320 |
3 |
8601361,00 |
10 |
86013610 |
4 |
9361555,56 |
6 |
56169333,33 |
5 |
12086518,75 |
4 |
48346075 |
6 |
18009950,00 |
3 |
54029850 |
Итого |
|
30 |
255064438,3 |
сигма средняя |
|
8502147,944 |
1² = 255064438,3/30 = 8502147,944
Расчет межгрупповой дисперсии осуществляется по формуле:
δ² = Σ(Хs – X)*f / Σf (3)
Расчет межгрупповой дисперсии признака х1 представлен в таблице 6 .
Например, средняя по первой группе равна 14825,0, общая средняя 44343,83, тогда
Xs-Х = 14825,00-44343,83=-29518,83;
(Xs-Х)²=(- 29518,83)²=871361521,4;
(Xs-Х)²*fs=871361521,4*2=1742723043
Остальные расчеты произведены аналогично.
Таблица 6 Расчет межгрупповой дисперсии |
|||||
№ группы |
Xs |
fs |
Xs-Х |
(Xs-Х)² |
(Xs-Х)²*fs |
1 |
14825,00 |
2 |
-29518,83 |
871361521,4 |
1742723043 |
2 |
28244,00 |
5 |
-16099,83 |
259204633,4 |
1296023167 |
3 |
41373,00 |
10 |
-2970,83 |
8825850,694 |
88258506,94 |
4 |
49193,33 |
6 |
4849,50 |
23517650,25 |
141105901,5 |
5 |
59422,50 |
4 |
15078,67 |
227366188,4 |
909464753,8 |
6 |
70955,00 |
3 |
26611,17 |
708154191,4 |
2124462574 |
Итого |
|
30 |
|
2098430035 |
6302037946 |
Межгрупповая дисперсия признака х1
δ1² = 6302037946/30 = 210067931,5
Общая дисперсия:
j²=j² + δj² (4)
Общая дисперсия признака х1:
1²= 8502147,9 + 210067931,5 = 218570079,5
Расчет коэффициента детерминации:
η² = δ²/σ² (5)
Для признака х1: η² =210067931,5/218570079,5= 0,961
Эмпирическое корреляционное отношение:
η = √δ²/σ² (6)
Для признака х1: η =√0,961 = 0,980
Полученные значения свидетельствуют о наличии очень сильной статистической связи между изучаемыми признаками. Коэффициент детерминации показывает, что 96,1 % всей вариации обусловлено изучаемым фактором, а именно, денежными доходами семьи в месяц.
Аналогичные расчеты проведены в последующих таблицах для признаков х2, х3, х4.
Таблица 7 Расчет дисперсии средней из групповых для признака х2 |
|||
Номер группы |
Дисперсия по группе |
Число наблюдений fs |
σs*fs |
1 |
15409550,25 |
2 |
30819100,5 |
2 |
62386450,96 |
5 |
311932254,8 |
3 |
15915884,69 |
10 |
159158846,9 |
4 |
25853645,14 |
6 |
155121870,8 |
5 |
7723996,5 |
4 |
30895986 |
6 |
2752149,556 |
3 |
8256448,667 |
Итого |
|
30 |
696184507,7 |
сигма средняя |
|
23206150,26 |
Межгрупповая дисперсия признака х2
δ1² = 83035198,6/30 = 2767839,95
Таблица 8 Расчет межгрупповой дисперсии для признака х2 |
|||||
№ группы |
Xs |
fs |
Xs-Х |
(Xs-Х)² |
(Xs-Х)²*fs |
1 |
14169,50 |
2 |
564,80 |
318999,04 |
637998,08 |
2 |
13342,20 |
5 |
-262,50 |
68906,25 |
344531,25 |
3 |
13019,90 |
10 |
-584,80 |
341991,04 |
3419910,4 |
4 |
16595,17 |
6 |
2990,47 |
8942890,884 |
53657345,31 |
5 |
11193,00 |
4 |
-2411,70 |
5816296,89 |
23265187,56 |
6 |
12849,67 |
3 |
-755,03 |
570075,3344 |
1710226,003 |
Итого |
|
30 |
|
16059159,44 |
83035198,6 |
Общая дисперсия признака х2:
2²= 23206150,26+2767839,95 = 25973990,21
Коэффициент детерминации:
η 2² =2767839,95/25973990,21=0,107
Эмпирическое корреляционное отношение:
η2 =√0,107= 0,326
Полученные значения свидетельствуют о наличии слабой статистической связи между изучаемыми признаками. Коэффициент детерминации показывает, что 10,7 % всей вариации обусловлено изучаемым фактором, а именно, расходами на питание семьи за месяц.
Таблица 9 Расчет дисперсии средней из групповых для признака х3 |
|||
Номер группы |
Дисперсия по группе |
Число наблюдений fs |
σs*fs |
1 |
0,00 |
2 |
0 |
2 |
2,24 |
5 |
11,2 |
3 |
1,21 |
10 |
12,1 |
4 |
1,33 |
6 |
8 |
5 |
0,69 |
4 |
2,75 |
6 |
0,22 |
3 |
0,666667 |
Итого |
|
30 |
34,71667 |
сигма средняя |
|
1,157 |
Таблица 10 Расчет межгрупповой дисперсии для признака х3 |
|||||
№ группы |
Xs |
fs |
Xs-Х |
(Xs-Х)² |
(Xs-Х)²*fs |
1 |
3,00 |
2 |
-0,73 |
0,537778 |
1,075556 |
2 |
3,40 |
5 |
-0,33 |
0,111111 |
0,555556 |
3 |
3,70 |
10 |
-0,03 |
0,001111 |
0,011111 |
4 |
4,00 |
6 |
0,27 |
0,071111 |
0,426667 |
5 |
4,25 |
4 |
0,52 |
0,266944 |
1,067778 |
6 |
3,67 |
3 |
-0,07 |
0,004444 |
0,013333 |
Итого |
|
30 |
|
0,9925 |
3,15 |
средняя |
|
|
|
|
0,105 |
Общая дисперсия признака х3:
3²= 1,157+0,105 = 1,262
Коэффициент детерминации:
η3² =0,105/1,262= 0,083
Эмпирическое корреляционное отношение:
η3 =√0,083 = 0,288
Полученные значения свидетельствуют о наличии слабой статистической связи между изучаемыми признаками. Коэффициент детерминации показывает, что 8,3 % всей вариации обусловлено изучаемым фактором, а именно, размером семьи.
Таблица 11 Расчет дисперсии средней из групповых для альтернативного признака |
|||
Номер группы |
Дисперсия по группе |
Число наблюдений fs |
σs*fs |
1 |
0,00 |
2 |
0 |
2 |
0,24 |
5 |
1,2 |
3 |
0,24 |
10 |
2,4 |
4 |
0,22 |
6 |
1,333333 |
5 |
0,00 |
4 |
0 |
6 |
0,22 |
3 |
0,666667 |
Итого |
|
30 |
5,6 |
сигма средняя |
|
0,186667 |
Таблица 12 Расчет межгрупповой дисперсии для альтернативного признака |
|||||
№ группы |
Xs |
fs |
Xs-Х |
(Xs-Х)² |
(Xs-Х)²*fs |
1 |
1,00 |
2 |
0,50 |
0,25 |
0,5 |
2 |
0,40 |
5 |
-0,10 |
0,01 |
0,05 |
3 |
0,60 |
10 |
0,10 |
0,01 |
0,1 |
4 |
0,67 |
6 |
0,17 |
0,027778 |
0,166667 |
5 |
0,00 |
4 |
-0,50 |
0,25 |
1 |
6 |
0,33 |
3 |
-0,17 |
0,027778 |
0,083333 |
Итого |
|
30 |
|
0,575556 |
1,9 |
Средняя |
|
|
|
|
0,063333 |
Общая дисперсия признака х4:
4²= 0,18667+0,06333 = 0,25
Коэффициент детерминации:
η4² =0,06333/0,25 =0,253
Эмпирическое корреляционное отношение:
η4 =√0,253 = 0,503
Полученные значения свидетельствуют о наличии слабой статистической связи между изучаемыми признаками. Коэффициент детерминации показывает, что 25,3 % всей вариации обусловлено изучаемым фактором, а именно, альтернативным признаком.
Обобщим итоговые показатели в таблице 13.
Таблица 13 Основные статистические характеристики признаков х1,х2,х3,х4 |
|||||
№ п/п |
Статистические характеристики |
Признаки |
|||
х1 |
х2 |
х3 |
х4 |
||
1 |
Общая средняя взвешенная величина |
44343,83 |
13604,70 |
3,73 |
0,50 |
2 |
Дисперсия средняя из групповых |
8502147,94 |
23206150,26 |
1,16 |
0,19 |
3 |
Межгрупповая дисперсия |
210067931,53 |
2767839,95 |
0,11 |
0,06 |
4 |
Общая дисперсия |
218570079,47 |
25973990,21 |
1,26 |
0,25 |
5 |
Коэффициент детерминации |
0,961 |
0,107 |
0,083 |
0,253 |
6 |
Эмпирическое корреляционное отношение |
0,980 |
0,326 |
0,288 |
0,503 |