- •1. Основные понятия из теории вероятностей и математической статистики
- •2. Эмпирическая функция распределения. Гистограмма
- •3. Точечные оценки для моментов
- •4. Доверительные интервалы для моментов. Доверительная вероятность
- •5. Оценивание параметров. Метод моментов
- •6. Критерии согласия
- •7. Задания практических работ
- •Приложение 1 Нормальное распределение
- •Приложение 2 Критические точки распределения χ2-квадрат
- •П риложение 3 Распределение Стьюдента
- •П риложение 4 Распределение χ2-квадрат
- •Литература
- •Коллектив авторов основы математической статистики Учебно-методическое пособие
- •6 30092, Г. Новосибирск, пр. К. Маркса, 20
6. Критерии согласия
Пусть дана выборка из генеральной совокупности, закон распределения которой неизвестен, и пусть найдены точечные оценки для математического ожидания и дисперсии. Относительно вида теоретического распределения исследователем выдвигаются различные гипотезы. Согласованность наблюдений с гипотезой можно проверять сравнением графиков эмпирической и теоретической функций распределения или гистограммы с графиком плотности вероятности. Ввиду случайности выборки эмпирическая функция распределения может существенно отличаться от теоретической, даже если гипотеза верна. Перед исследователем стоит задача определить, какие отличия не противоречат гипотезе, а какие являются значимыми и гипотезу от-вергают.
С помощью критериев согласия оценивают, насколько полученные наблюдения согласуются с гипотезой распределения.
Критерий согласия χ2
Критерий Пирсона (читается «хи-квадрат») наиболее часто используется среди критериев согласия. Меру расхождения эмпирического и теоретического законов распределения этот критерий представляет в виде величины .
Здесь n есть объем выборки; l – число интервалов, на которые разбивается вся область значений случайной величины; – эмпирические частоты, а – теоретические вероятности попадания в i-й интервал с границами , которые находятся по формуле
, i = 1, 2, …, l , где F(x) есть теоретическая функция распределения.
Для нормального теоретического закона
где – функция Лапласа.
Если проверяемая гипотеза верна, то значение является приближенно реализацией случайной величины, имеющей распределение с k = l – m – 1 степенями свободы, где m – число параметров теоретического распределения. Для нормального и равномерного распределений m = 2, поскольку параметрами нормального распределения являются математическое ожидание и квадратическое отклонение, а для равномерного – концы отрезка, где задана плотность.
Очевидно, что чем меньше отличаются теоретические вероятности от соответствующих эмпирических частот, тем меньше величина . Слишком большая мера расхождения означает, что гипотеза о распределении неверна. Какой должна быть величина , зависит от задаваемого уровня значимости α.
Критические значения , зависящие от α и k , находятся из условия и затабулированы. Иными словами, уровень значимости α есть вероятность того, что случайная величина попадает в критическую область [ ∞). Величина β = 1 − α есть вероятность попадания случайной величины в область допустимых значений (0, ).
Схема применения критерия согласия Пирсона
Вычисляется наблюдаемое значение величины по приведенной выше формуле; находится по таблице критических точек распределения при заданном уровне значимости α.
Если , т.е. попало в область допустимых значений, то оснований отвергнуть гипотезу нет. Отклонения эмпирических частот от теоретических вероятностей носят случайный характер, являются незначимыми.
Если , то гипотезу о теоретическом распределении следует отвергнуть. Расхождения частот и вероятностей являются значимыми при данном уровне значимости α.
Критерий согласия Пирсона, как и все критерии согласия, позволяет отвергнуть неподходящие гипотезы, но доказательством справедливости гипотезы не служит. Гипотеза принимается не как истинная, а как согласующаяся с результатами наблюдений.
Существует также несколько иная схема применения критерия , состоящая в следующем. По найденному и числу k находится вероятность p того, что случайная величина, распределенная по закону , будет больше . Используется любая таблица распределения с подходящими входами. Если найденная вероятность меньше уровня значимости, то результат опыта считается противоречащим выбранному теоретическому закону. Если она сравнительно велика (больше уровня значимости), то расхождение теоретического и эмпирического распределения считается незначимым. Такая схема дает оценку вероятности полученного уклонения, что позволяет численно выразить меру соответствия выборки гипотезе.
Использование критерия Пирсона
В задании 4 практической работы 2 по критерию нужно проверить гипотезы о согласии выборки с нормальным и равномерным распределениями. Параметры обоих законов распределения оценены методом моментов в предыдущем разделе.
Используем готовое интервальное задание выборки из табл. 5 (вариант 0). Предварительно восьмой, девятый и десятый интервалы объединяются в один (под восьмым номером), поскольку практически требуется, чтобы в интервал попало не менее пяти выборочных точек. Тогда новое число точек в разряде будет . При достаточном числе выборочных точек в интервалах изменений не требуется. Помимо этого крайние интервалы необходимо продлить соответственно до –∞ и до +∞, в соответствии с требованиями критерия.
Для нормального закона теоретические вероятности попадания в i-й интервал вычислены по приведенной выше формуле, с использованием затабулированных значений функции Лапласа. Далее указаны величины , а также значения отдельно для каждого интервала.
Сумма величин по столбцу дает искомое значение критерия .
Для равномерного закона распределения теоретические вероятности попадания в каждый из 10 интервалов одинаковы и равны 1/10. Но поскольку последние три интервала объединялись в один, для восьмого интервала . Значение критерия также получено суммированием по столбцу. Все вычисления представлены в табл. 3.
Проверим сначала гипотезу о согласии выборки с нормальным законом распределения.
По таблице критических точек распределения (приложение 2) находим значение = 9,24, соответствующее уровню значимости (критической вероятности) α = 0,1 и числу степеней свободы k = 8–2–−1=5. Так как < 9,24= , то попадает в область допустимых значений. Поэтому нет оснований отвергнуть гипотезу. Расхождение между эмпирическим и теоретическим распределениями незначимо и носит случайный характер.
Таблица 3
i |
Интервал |
ni |
Нормальный закон |
Равномерный закон |
||||
pi |
npi |
|
pi |
npi |
|
|||
1 |
(–∞,14) |
6 |
0.045 |
4.509 |
0.493 |
0.1 |
10 |
1.6 |
2 |
[14,18) |
7 |
0.070 |
7.017 |
0.000 |
0.1 |
10 |
0.9 |
3 |
[18,22) |
11 |
0.126 |
12.559 |
0.194 |
0.1 |
10 |
0.1 |
4 |
[22,26) |
17 |
0.177 |
17.672 |
0.026 |
0.1 |
10 |
4.9 |
5 |
[26,30) |
19 |
0.196 |
19.551 |
0.016 |
0.1 |
10 |
8.1 |
6 |
[30,34) |
18 |
0.170 |
17.005 |
0.058 |
0.1 |
10 |
6.4 |
7 |
[34,38) |
13 |
0.116 |
11.629 |
0.162 |
0.1 |
10 |
0.9 |
8 |
[38,+∞) |
9 |
0.101 |
10.059 |
0.111 |
0.3 |
30 |
14.7 |
Сумма |
|
100 |
1 |
100 |
1.059 |
1 |
100 |
37.6 |
Для проверки гипотезы о согласии выборки с равномерным законом распределения рассуждаем следующим образом.
Значение критерия > 9,24= , поэтому попадает в критическую область. На основании этого гипотезу о равномерном законе распределения отвергаем, как не согласующуюся с результатами наблюдений. Расхождение между эмпирическим и теоретическим законами распределения значимо при данном уровне значимости 0.1.
Рассмотрим также другую схему применения критерия.
В таблице вероятностей для распределения (приложение 4) по аргументу 1,059 и числу степеней свободы k = 8 − 2 − 1 = 5 находим (ближайшее табличное значение 0,9626 для аргумента 1). Поскольку 0.958 > 0,1 = α (уровня значимости), принимаем гипотезу о том, что выборка из нормального распределения. Аналогично для равномерного закона находим вероятность < α (уже для аргумента 30 вероятность меньше , поэтому в таблице стоит нулевое значение). Поскольку найденная вероятность меньше уровня значимости, гипотезу о равномерном законе распределения отвергаем при данном уровне значимости.