Задача 1.10
Проанализировать результаты решения задач 1.8 и 1.9. Принять гипотезу о нормальном распределении частот рассматриваемого вариационного ряда. Произвести его математическое выравнивание с помощью кривой нормального распределения.
Рассчитать критерии согласия Пирсона, Романовского и Колмагорова. Сопоставить полученные результаты с их табличными значениями. Сформулировать выводы. Изобразить на графике (совместно) эмпирические и теоретические ряды распределения.
Решение
Порядок расчета теоретических частот кривой нормального распределения:
используем среднюю арифметическую ряда x= 44343,83 и среднее квадратическое отклонение = 14614,17, рассчитанные по сгруппированным эмпирическим данным;
найдем нормированное отклонение t для верхней и нижней границы интервалов от средней арифметической:
x´ - x
t = ---------- (1)
Например, для 1 группы
t1н = (10000-44343,73)/14614,17 = -2,3500 – для нижней границы первого интервала;
t1в = (21150-44343,73)/14614,17 = -1,5871 – для верхней границы первого интервала и т. д. см. табл. 1, гр. 6-7.
по таблице распределения функции φ(t) определим ее значения и занесем в таблицу 1, гр. 8-9 (см. 6, стр. 288, табл. приложения 2);
вычислим вероятность попадания единицы наблюдения в данный интервал при выполнении гипотезы о нормальном законе:
Pj = (F(tj) - F(tj+1))/2 (2),
где │tj│>│tj+1│.
Например для первой группы P1 =(0,9812-0,8882)/2 = 0,0465;
для второй группы P2 =(0,8882-0,5878)/2 = 0,1502 и т. д. см. табл. 1, гр. 10.
Определяем теоретическую частоту в данной группе, равную произведению объема совокупности на вероятность попадания в данный интервал:
ft = Pj * Ni (3)
где N – объем совокупности (30).
Например, ft1=0,0465*30 ≈ 1 и т. д. (см. табл. 1, гр. 11).
Промежуточные расчеты представлены в таблице 1.
Сумма теоретических частот нормального распределения оказалась меньше суммы эмпирических частот, так как нормальный закон не ограничен рамками фактических минимума и максимума.
Построим и сравним графики эмпирические и теоретических частот (кривых распределения) (см. рис. 1).
Таблица 1
Последовательность расчета теоретических частот
№ |
Нижние и верхние границы интерва лов |
Эмпирические частоты f |
Нижние |
Верх ние |
tj |
tj+1 |
F(tj) |
F(tj+1) |
Pj |
ft |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
1 |
10000-21150 |
2 |
10000 |
21150 |
-2,3500 |
-1,5871 |
0,9812 |
0,8882 |
0,0465 |
1 |
2 |
21150-32300 |
5 |
21150 |
32300 |
-1,5871 |
-0,8241 |
0,8882 |
0,5878 |
0,1502 |
5 |
3 |
32300-43450 |
6 |
32300 |
43450 |
-0,8241 |
-0,0612 |
0,5878 |
0,0478 |
0,27 |
8 |
4 |
43450-54600 |
9 |
43450 |
54600 |
-0,0612 |
0,7018 |
0,0478 |
0,5161 |
0,2819 |
8 |
5 |
54600-65750 |
5 |
54600 |
65750 |
0,7018 |
1,4648 |
0,5161 |
0,8584 |
0,1712 |
5 |
6 |
65750-76900 |
3 |
65750 |
76900 |
1,4648 |
2,2277 |
0,8584 |
0,9736 |
0,0576 |
2 |
Ито го |
|
30 |
|
|
|
|
|
|
|
29 |
Рис. 1. Эмпирическое и теретическое распределение
После выравнивания ряда проверим «случайность» или «не случайность» расхождения между эмпирическими и теоретическими частотами, рассчитав критерии согласия.
а) Рассчитаем критерий согласия Пирсона, как сумму отношений квадратов расхождений между f и ft к теоретическим частотам, по формуле:
Σ(f – ft)²
² = ------------- (4)
ft
Промежуточные расчеты представлены в таблице 2.
Таблица 2
Вспомогательная таблица для расчета критерия согласия Пирсона
№ |
Эмпирические частоты f |
Теоретические ft |
f-ft |
(f-ft)² |
(f-ft)²/ft |
1 |
2 |
1 |
-1 |
0,37 |
0,26 |
2 |
5 |
5 |
0 |
0,24 |
0,05 |
3 |
6 |
8 |
2 |
4,41 |
0,54 |
4 |
9 |
8 |
-1 |
0,29 |
0,03 |
5 |
5 |
5 |
0 |
0,02 |
0,00 |
6 |
3 |
2 |
-1 |
1,62 |
0,94 |
Сумма |
30 |
29 |
|
|
1,84 |
² = 1,84
Вычисленное значение критерия² необходимо сравнить с табличным (критическим) значением ²кр. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения).
При числе степеней свободы k=3 и при уровне значимости р=0,05 табличное значение критерия Пирсона 7,82 [9, с. 339]
Так как ² = 1,84< ²кр=7,82, то расхождения между эмпирическими и теоретическими частотами распределения признаются случайными и предположение о близости эмпирического распределения к нормальному не отвергается.
При уровне значимости р=0,01 критерий Пирсона 11,34: и в этом случае предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
б) Рассчитаем критерий согласия В.И. Романовского КРом, который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения
² - k
Кром = ---------- (4)
√2 k
где m - число групп; k = (m - 3) - число степеней свободы при исчислении частот нормального распределения.
Кром = (1,84 – 3)/2,4495 = -0,474
Так как Кром < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение –соответствующим нормальному.
в) Критерий согласия А.Н. Колмогорова λ используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле:
D
λ = ---------- (5)
√Σf
где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; Σf - сумма эмпирических частот.
По данным таблицы 3, D=1,10 получаем: λ =1,1/5,477 = 0,2008
По таблицам значений вероятностей -критерия можно найти величину , соответствующую вероятности Р [9, с. 339]. Критическое значение критерия Колмагорова при разных уровнях значимости колеблется от 0,19 до 0,29 при 30 единицах наблюдения. Так как рассчитанное значение в этом диапазоне, то можно предположить, что расхождения между теоретическим и эмпирическим распределениями носят случайный характер.
Таблица 3
Расчет критериев согласия
№ |
Эмпирические частоты f |
Теоретические ft |
Накопленные частоты |
||
Cum f |
Cum Ψ |
Cum f-Cum Ψ |
|||
1 |
2 |
1 |
2 |
1,40 |
-0,61 |
2 |
5 |
5 |
7 |
5,90 |
-1,10 |
3 |
6 |
8 |
13 |
14,00 |
1,00 |
4 |
9 |
8 |
22 |
22,46 |
0,46 |
5 |
5 |
5 |
27 |
27,59 |
0,59 |
6 |
3 |
2 |
30 |
29 |
|
Итого |
30 |
29 |
|
|
|
Таким образом, по всем трем критериям вполне можно полагать, что расхождения между теоретическими и эмпирическими частотами носят случайный характер, и гипотеза о близости эмпирического распределения к нормальному не отвергается.
На рис. 1 наглядно видно, что теоретические значения немного отличаются от эмпирических.