- •Построение теоретического закона распределения по опытным данным
- •Исходные данные
- •Исходные данные
- •Расчет выборочных характеристик
- •1. Дискретные случайные величины
- •Расчет теоретических частот
- •2. Непрерывные случайные величины
- •Расчет теоретических частот
- •Расчет χ2-критерия Пирсона
- •Расчет χ2-критерия Пирсона
- •Расчет величины d
- •Моменты распределения. Асимметрия и эксцесс
- •Приложение
Расчет теоретических частот
k |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
P500(k) |
0,368 |
0,368 |
0,184 |
0,061 |
0,015 |
0,003 |
0,001 |
0,000 |
|
183,94 |
183,94 |
91,97 |
30,66 |
7,66 |
1,53 |
0,26 |
0,04 |
ni |
199 |
169 |
87 |
31 |
9 |
3 |
1 |
1 |
Сравнительно небольшое расхождение эмпирических и теоретических частот (рис. 2) подтверждает предположение о том, что рассматриваемое распределение подчинено закону Пуассона.
Рисунок 1. Полигон теоретических и эмпирических частот
2. Непрерывные случайные величины
В случае непрерывного распределения, вероятности отдельных возможных значений равны нулю. Поэтому весь интервал возможных значений делят на k непересекающихся интервалов и вычисляют вероятности Pi попадания случайной величины X в i-ый частичный интервал, а затем, как и для дискретного распределения, умножают число испытаний на эти вероятности, т.е.
,
где n – объем выборки;
Pi – вероятность попадания случайной величины Х в i-ый частичный интервал, вычисленная при допущении, что Х имеет предполагаемое распределение.
К примеру, если имеются основания предположить, что случайная величина Х (генеральная совокупность) подчинена нормальному закону распределения, то вероятность попадания случайной величины Х в i-ый частичный интервал Pi вычисляются по следующей формуле:
,
где xi, xi+1 – границы i-го частичного интервала;
; - нормированные величины;
a, σ – соответственно математическое ожидание и стандартное отклонение случайной величины X;
- функция Лапласа (табличная величина, приложение или =НОРМРАСП(X;a;σ;1)-0,5), причем - нечетная функция.
Пример 4. По данным примера 2 определить теоретические частоты в предположении, что случайная величина Х (генеральная совокупность) распределена по нормальному закону. Построить полигон эмпирических и теоретических частот.
Решение
Для расчета теоретических частот вычислим нормированные величины ui; ui+1:
1 интервал: -∞; ;
2 интервал: -1,80; ;
3 интервал: -0,91; ;
4 интервал: -0,03; ;
5 интервал: 0,86; ;
6 интервал: 1,74; ∞.
Таблица 5
Расчет теоретических частот
№ |
Границы интервалов хi; хi+1 |
Границы интервалов ui; ui+1 |
||||
1 |
-∞; 500 |
-∞; -1,80 |
0 |
0,0360 |
0,0360 |
28,18 |
2 |
500; 1000 |
-1,80; -0,91 |
0,0360 |
0,1814 |
0,1454 |
113,85 |
3 |
1000; 1500 |
-0,91; -0,03 |
0,1814 |
0,4881 |
0,3067 |
240,15 |
4 |
1500; 2000 |
-0,03; 0,86 |
0,4881 |
0,8051 |
0,3170 |
248,21 |
5 |
2000; 2500 |
0,86; 1,74 |
0,8051 |
0,9591 |
0,1540 |
120,58 |
6 |
2500; ∞ |
1,74; ∞ |
0,9591 |
1 |
0,0409 |
32,02 |
|
Итого |
- |
- |
- |
1 |
783 |
Наглядно расхождение эмпирических и теоретических частот можно показать с помощью полигона (рис. 2).
Рисунок 2. Полигон теоретических и эмпирических частот
3 этап: проверка гипотезы о законе распределения.
Как бы хорошо ни был подобран теоретический закон распределения, между эмпирическим и теоретическим распределениями неизбежны расхождения. Закономерно возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, теоретический закон распределения подобран неудачно. Для ответа на данный вопрос служат критерии согласия.
Пусть необходимо проверить нулевую гипотезу H0 о том, что исследуемая случайная величина X подчиняется определенному закону распределения. Для проверки гипотезы H0 выбирают некоторую случайную величину U, характеризующую степень расхождения теоретического и эмпирического распределений, закон распределения которой при достаточно больших n известен и практически не зависит от закона распределения случайной величины X.
Зная закон распределения U, можно найти вероятность того, что U приняла значение не меньше, чем фактически наблюдаемое в опыте u, т.е. . Если мала, то это означает в соответствии с принципом практической уверенности, что такие как в опыте, и бóльшие отклонения практически невозможны. В этом случае гипотезу H0 отвергают. Если же вероятность не мала, расхождение между эмпирическим и теоретическим распределениями несущественно и гипотезу H0 можно считать не противоречащей опытным данным.
Наиболее часто в практике статистических исследований используются критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, А.Н. Колмогорова, Б.С. Ястремского.
В χ2-критерий Пирсона в качестве меры расхождения U берется величина χ2, равная:
,
которая имеет χ2-распределение с степенями свободы, где m – число интервалов эмпирического распределения (вариационного ряда); r – число параметров теоретического распределения.
Схема применения χ2-критерия для проверки гипотезы H0 сводится к следующему:
1) определяется мера расхождения эмпирических и теоретических часто χ2;
2) для заданного уровня значимости α (как правило, принимается на уровне 0,05 или 0,01) по справочной таблице χ2-распределения находят критическое значение при числе степеней свободы ;
3) если расчетное значение χ2 больше критического , т.е. , то гипотеза H0 отвергается, если , то гипотеза H0 не противоречит опытным данным.
Примечание: статистика χ2 имеет χ2-распределение лишь при , поэтому необходимо, чтобы в каждом интервале было достаточное количество наблюдений, по крайней мере, не меньше 5. Если какой-либо интервал не удовлетворяет данному требованию, то имеет смысл объединить его с соседним таким образом, чтобы в объединенных интервалах . В данном случае параметр m при расчете числа степеней свободы уменьшается на число таких объединенных интервалов.
На практике кроме критерия χ2 часто используют критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривают максимальное значение абсолютной величины разности между эмпирической и теоретической функциями распределения:
,
называемое статистикой критерия Колмогорова.
Схема применения критерия Колмогорова:
1) строятся эмпирическая функция распределения и предполагаемая теоретическая;
2) определяется мера расхождения между теоретическим и эмпирическим распределением D и вычисляется величина:
;
3) если вычисленное значение λ окажется не больше критического λα, определенного на уровне значимости α (λ0,05=1,36; λ0,01=1,63), то нулевая гипотеза H0 не противоречит опытным данным.
Примечание: применение критерия Колмогорова в принципе возможно лишь тогда, когда теоретическая функция распределения задана полностью. Однако такие случаи в практике встречаются редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным. При применении критерия χ2 это обстоятельство учитывается соответствующим уменьшением числа степеней свободы. Такого рода поправок в критерии Колмогорова не предусмотрено. Поэтому, если при неизвестных значениях параметров применить критерий Колмогорова, взяв за значения параметров их оценки, вычисленные по выборке, то получим завышенное значение вероятности , и, следовательно, бóльшее критическое значение λα. В результате есть риск в ряде случаев принять нулевую гипотезу H0 о законе распределения случайной величины как правдоподобную, в то время как на самом деле она противоречит опытным данным.
Пример 5. По данным примеров 1 и 3 на уровне значимости α=0,05 проверить гипотезу H0 о том, что случайная величина Х – число поврежденных изделий, распределена по закону Пуассона.
Для определения статистики χ2 составим таблицу:
Таблица 6