- •Статистика
- •Введение
- •Информационная таблица (базовый вариант)
- •ТиповЫе заданиЯ и краткие методические указания по их выполнению Задача 1
- •Задача 2
- •Задача 3
- •Число единиц наблюдения по группам (в абсолютных и относительных величинах)
- •Групповые обобщающие итоговые показатели признаков х1, х2, х3 и х4 (в абсолютных и относительных величинах)
- •Групповые средние величины признаков х1, х2, х3 и х4
- •Групповые (частные) дисперсии признаков х1, х2, х3 и х4
- •Групповые обобщающие итоговые показатели признаков х1, х2, х3 и х4, руб.
- •Групповые обобщающие итоговые показатели признаков х1, х2, х3 и х4, %
- •Задача 4
- •Расчет общей средней величины признака х1 из его средних групповых значений
- •Расчет дисперсии средней из групповых
- •Расчет межгрупповой дисперсии
- •Основные статистические характеристики признаков х1, х2, х3 и х4
- •Задача 5
- •Задача 6
- •Сопоставление распределений «p» и «q», %
- •Сопоставление распределений «p» и «q», %
- •Задача 7
- •Распределение единиц наблюдения по группам
- •Задача 8
- •Задача 9
- •Промежуточная таблица
- •Задача 10
- •Последовательность расчета теоретических частот φ
- •Последовательность расчета критериев согласия
- •Информационные таблицы
- •Пример решения задачи 1.2 вexcel
- •Библиографический Список
- •Оглавление
- •Статистика
- •680021, Г. Хабаровск, ул. Серышева, 47.
- •Статистика
Сопоставление распределений «p» и «q», %
Номер группы |
«p» |
«q» |
«Cum p» |
«Cum q» |
1 |
10 |
5,29 |
10 |
5,29 |
2 |
10 |
6,72 |
20 |
12,01 |
3 |
10 |
7,88 |
30 |
19,89 |
4 |
10 |
9,04 |
40 |
28,93 |
5 |
10 |
9,47 |
50 |
38,40 |
6 |
10 |
10,71 |
60 |
49,11 |
7 |
10 |
11,47 |
70 |
60,58 |
8 |
10 |
12,58 |
80 |
72,37 |
9 |
10 |
15,05 |
90 |
84,99 |
10 |
10 |
|
100 |
100 |
Итого |
100 |
100 |
– |
– |
наполняемость групп с неравными интервалами 10 %.
Кривая Лоренца
Коэффициент Джини
G= ((1012,01 + 2019,89 + 3028,93 + 4038,40 + 5049,11 + 6060,58 +
+ 7072,37 + 8084,95 + 90100) – (205,29 + 3012,01 + 4019,89 +
+ 5028,93 + 6038,40 + 7049,11 + 8060,58 + 9072,37 + 10084,95))/
/ 10000 = (29874 – 28304,60)/10000 = 1569,40/10000 = 0,16.
Аналогичная процедура повторяется для распределения «p» и «q2», «p» и «q3» (табл. 19).
Таблица 19
Сопоставление распределений «p» и «q», %
Номер группы |
«p» |
«q1» |
«Cum p» |
«Cum q1» |
I |
20 |
12,78 |
20 |
12,78 |
II |
20 |
16,77 |
40 |
29,55 |
III |
20 |
20,00 |
60 |
49,55 |
IV |
20 |
23,06 |
80 |
72,61 |
V |
20 |
27,38 |
100 |
100 |
Итого |
100 |
100 |
– |
– |
Наполняемость групп с неравными интервалами 20 %.
Кривая Лоренца
Коэффициент Джини
G= ((2029,55 + 4049,55 + 6072,61 + 80100) –
– (4012,78 + 6029,55 + 8049,55 + 10072,61))/10000 =
= (14929,6 – 13509,2)/10000 = 1420,4/10000 = 0,14.
Задача 7
По данным задачи 3, пункт 3 (выходная статистическая табл. 6) проведите вторичную группировку, образовав группы с равными интервалами: 3000–4500; 4500–6000; 6000–7500; 7500–9000; 9000–10500; 10500–12000.
Краткие методические указания к решению задачи 7
Вторичной группировкой в общем случае называются операции по образованию новых групп. Первым наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам, а также когда границы новых и старых интервалов совпадают. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Этот способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые. Как правило, эти два способа применяются одновременно.
Ниже приводится последовательность задачи.
1. Образовать группу с интервалами 3000–4500. В нее следует включить 1 единицу наблюдения 1-й группы, с интервалами 3240–3824 первичной группировки и часть единиц 2-й группы с интервалами 3824–4992. Они должны быть распределены между группами вторичной группировки со значениями интервалов 3000–4500 и 4500–6000.
В учебной литературе в связи с этим излагаются различные способы расчетов. Здесь же мы рассмотрим лишь отдельные из них. Суть их заключается в следующем. Принимается предложение в равномерном распределении единиц наблюдения внутри группы и соответственно определяется их число, которое приходится в среднем на одну единицу интервала группы первичной группировки. В последующем эта оценка интервалов используется для определения числа единиц наблюдения в группе вторичной группировки.
Примечательно к рассматриваемой группировке имеем: величину интервала 4992 – 3824 = 1168; оценку интервала 3 : 1168 = 0,0026.
В новой образуемой группе вторичной группировки, с интервалами 3000–4500 часть интервала 3240–3824 заполнена 1-й единицей наблюдения, а другая его часть 3824–4500 «пуста», или не заполнена единицами наблюдения. Поэтому 4500 – 3824 = 676 0,0026 = 1,76. В новую образуемую группу вторичной группировки следует включить 3 целых единицы наблюдения (1 + 2), а одна целая единица наблюдения перейдет в группу 4500 и выше.
Понятно, что и другие расчетные схемы приводят к аналогичным результатам. Чтобы образовать группу 3000–4500, отнимем 492 единицы интервала от 4992 (4992 – 4500 = 492), определим величину интервала 4992 – 3824 = 1168. Разделим 492 : 1168 = 0,42. Эту часть и следует взять от числа наблюдения данной группы 30,42 = 1,26; 3 – 1,26 = 1,74. В группу следует включить 3 целых единицы наблюдения (1 + 2), а одна целая единица наблюдения перейдет в группу 4500 и выше.
Итак, определено число единиц наблюдения в 1-й группе вторичной группировки – 3 единицы.
2. Образовать группу с интервалами 4500–6000. В группу войдет одна единица наблюдения из предыдущей группы, т. е. интервал 4500–4992 заполнен. Далее, 1) 6744 – 4992 = 1752; 2) 6 : 1752 = 0,0034; 3) 6000 – 4992 = = 1008;4) 10080,0034 = 3,53
Итак, в группу войдет 5 единиц (1 + 4), а 2 целых единицы перейдут в группу 6000 и выше.
Или 1) 6744 – 6000 = 744; 2) 6744 – 4992 = 1752; 3) 744 : 1752 = 0,42; 4) 6 0,42 = 2,42; 5) теперь необходимо из числа единиц наблюдения 3-й группы первичной группировки вычесть число, полученное четвертым действием (6 0,42 = 2,42): 6 – 2,42 = 3,58. В группу войдут 5 целых единиц наблюдения (1 + 4) = 5, а 2 единицы перейдут в группу 6000 и выше. Итак, определено число единиц наблюдения во 2-й группе вторичной группировки – 5 единиц.
3. Образовать группу с интервалами 6000–7500. В группу войдут 2 единицы наблюдения из предыдущей группы, т. е. интервал 6000–6744 заполнен. Далее, 1) 9080 – 6744 = 2336, 2) 15 : 2336 = 0,0064, 3) 7500 – – 6744 = 756, 4) 0,0064 756 = 4,84
В группу войдет 7 целых единиц наблюдения (2 + 5), а 10 единиц перейдет в группу 7500 и выше.
Или 1) 9080 – 7500 = 1580; 2) 9080 – 6744 = 2336; 3) 1580 : 2336 = 0,68;4) 150,68 = 10,2; 5) 15 – 10,2 = 4,8. В группу войдут 7 целых единиц наблюдения (2 + 5), а 10 единиц перейдут в группу 7500 и выше.
Итак, определено число единиц наблюдения в 3-й группе вторичной группировки – 7 единиц.
4. Образовать группу с интервалами 7500–9000. В группу не войдут все 10 единиц наблюдения, так как они принадлежат интервалу 7500–9080, а нам нужно получить число единиц наблюдения, которые входят в группу с интервалом 7500–9000. Для этого необходимо произвести следующие расчеты: 1) 9080 – 7500 = 1580, 2) 10 : 1580 = 0,0063, 3) 9000 – 7500 = 1500, 4) 15000,0063 = 9,55.
Итак, после расчетов выяснилось, что в группу войдут все 10 целых единиц наблюдения, а 0 единиц перейдут в группу 9000 и выше.
Следовательно, определено число единиц в 4-й группе вторичной группировки – 10 единиц.
Образовать группу с интервалами 9000–10500. В группу не войдет ни одной единицы из предыдущей группы. Далее, 1) 12000 – 9080 = 2920, 2) 5 : 2920 = 0,0017, 3) 10500 – 9080 = 1420, 4) 14200,0017 = 2,514. В группуследует включить 3 целые единицы.
Или 1) 12000 – 10500 = 1500, 2) 12000 – 9080= 2920, 3) 1500 : 2920 = 0,5,4) 50,5 = 2,5; 5) 5 – 2,5 = 2,5. В группу следует включить 3 единицы.
Итак, определено число единиц в 5-й группе вторичной группировки – 3 единицы.
6. Образовать группу с интервалами 10500–12000. Число единиц в этой группе уже известно: 30 – (3 + 5 + 7 + 10 + 3) = 2. Если же исходить из рассматриваемой схемы, то получим: 1) 12000 – 9080 = 2920, 2) 5 : 2920 = = 0,0017, 3) 12000 – 10500 = 1500, 4) 1500 0,0017 = 2,55.
Итак, определено число единиц в 6-й группе вторичной группировки – 2 единицы, а 0,5 накопленных ошибок следует отбросить.
Полученные результаты представим в выходной статистической табл. 20.
Таблица 20