Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы мат.статистики.doc
Скачиваний:
15
Добавлен:
16.09.2019
Размер:
1.01 Mб
Скачать

6. Критерии согласия

Пусть дана выборка из генеральной совокупности, закон распределения которой неизвестен, и пусть найдены точечные оценки для математического ожидания и дисперсии. Относительно вида теоретического распределения исследователем выдвигаются различные гипотезы. Согласованность наблюдений с гипотезой можно проверять сравнением графиков эмпирической и теоретической функций распределения или гистограммы с графиком плотности вероятности. Ввиду случайности выборки эмпирическая функция распределения может существенно отличаться от теоретической, даже если гипотеза верна. Перед исследователем стоит задача определить, какие отличия не противоречат гипотезе, а какие являются значимыми и гипотезу от-вергают.

С помощью критериев согласия оценивают, насколько полученные наблюдения согласуются с гипотезой распределения.

Критерий согласия χ2

Критерий Пирсона (читается «хи-квадрат») наиболее часто используется среди критериев согласия. Меру расхождения эмпирического и теоретического законов распределения этот критерий представляет в виде величины .

Здесь n есть объем выборки; l – число интервалов, на которые разбивается вся область значений случайной величины; – эмпирические частоты, а – теоретические вероятности попадания в i-й интервал с границами , которые находятся по формуле

, = 1, 2, …, l , где F(x) есть теоретическая функция распределения.

Для нормального теоретического закона

где – функция Лапласа.

Если проверяемая гипотеза верна, то значение является приближенно реализацией случайной величины, имеющей распределение с = l  m  1 степенями свободы, где m – число параметров теоретического распределения. Для нормального и равномерного распределений = 2, поскольку параметрами нормального распределения являются математическое ожидание и квадратическое отклонение, а для равномерного – концы отрезка, где задана плотность.

Очевидно, что чем меньше отличаются теоретические вероятности от соответствующих эмпирических частот, тем меньше величина . Слишком большая мера расхождения означает, что гипотеза о распределении неверна. Какой должна быть величина , зависит от задаваемого уровня значимости α.

Критические значения , зависящие от α и k , находятся из условия и затабулированы. Иными словами, уровень значимости α есть вероятность того, что случайная величина попадает в критическую область [ ∞). Величина β = 1 − α есть вероятность попадания случайной величины в область допустимых значений (0,  ).

Схема применения критерия согласия Пирсона

  1. Вычисляется наблюдаемое значение величины по приведенной выше формуле; находится по таблице критических точек распределения при заданном уровне значимости α.

  2. Если , т.е. попало в область допустимых значений, то оснований отвергнуть гипотезу нет. Отклонения эмпирических частот от теоретических вероятностей носят случайный характер, являются незначимыми.

  3. Если , то гипотезу о теоретическом распределении следует отвергнуть. Расхождения частот и вероятностей являются значимыми при данном уровне значимости α.

Критерий согласия Пирсона, как и все критерии согласия, позволяет отвергнуть неподходящие гипотезы, но доказательством справедливости гипотезы не служит. Гипотеза принимается не как истинная, а как согласующаяся с результатами наблюдений.

Существует также несколько иная схема применения критерия , состоящая в следующем. По найденному и числу k находится вероятность p того, что случайная величина, распределенная по закону , будет больше . Используется любая таблица распределения с подходящими входами. Если найденная вероятность меньше уровня значимости, то результат опыта считается противоречащим выбранному теоретическому закону. Если она сравнительно велика (больше уровня значимости), то расхождение теоретического и эмпирического распределения считается незначимым. Такая схема дает оценку вероятности полученного уклонения, что позволяет численно выразить меру соответствия выборки гипотезе.

Использование критерия Пирсона

В задании 4 практической работы 2 по критерию нужно проверить гипотезы о согласии выборки с нормальным и равномерным распределениями. Параметры обоих законов распределения оценены методом моментов в предыдущем разделе.

Используем готовое интервальное задание выборки из табл. 5 (вариант 0). Предварительно восьмой, девятый и десятый интервалы объединяются в один (под восьмым номером), поскольку практически требуется, чтобы в интервал попало не менее пяти выборочных точек. Тогда новое число точек в разряде будет . При достаточном числе выборочных точек в интервалах изменений не требуется. Помимо этого крайние интервалы необходимо продлить соответственно до –∞ и до +∞, в соответствии с требованиями критерия.

Для нормального закона теоретические вероятности попадания в i-й интервал вычислены по приведенной выше формуле, с использованием затабулированных значений функции Лапласа. Далее указаны величины , а также значения отдельно для каждого интервала.

Сумма величин по столбцу дает искомое значение критерия .

Для равномерного закона распределения теоретические вероятности попадания в каждый из 10 интервалов одинаковы и равны 1/10. Но поскольку последние три интервала объединялись в один, для восьмого интервала . Значение критерия также получено суммированием по столбцу. Все вычисления представлены в табл. 3.

Проверим сначала гипотезу о согласии выборки с нормальным законом распределения.

По таблице критических точек распределения (приложение 2) находим значение = 9,24, соответствующее уровню значимости (критической вероятности) α = 0,1 и числу степеней свободы k = 8–2–−1=5. Так как  < 9,24= , то попадает в область допустимых значений. Поэтому нет оснований отвергнуть гипотезу. Расхождение между эмпирическим и теоретическим распределениями незначимо и носит случайный характер.

Таблица 3

i

Интервал

ni

Нормальный закон

Равномерный закон

pi

npi

pi

npi

1

(–∞,14)

6

0.045

4.509

0.493

0.1

10

1.6

2

[14,18)

7

0.070

7.017

0.000

0.1

10

0.9

3

[18,22)

11

0.126

12.559

0.194

0.1

10

0.1

4

[22,26)

17

0.177

17.672

0.026

0.1

10

4.9

5

[26,30)

19

0.196

19.551

0.016

0.1

10

8.1

6

[30,34)

18

0.170

17.005

0.058

0.1

10

6.4

7

[34,38)

13

0.116

11.629

0.162

0.1

10

0.9

8

[38,+∞)

9

0.101

10.059

0.111

0.3

30

14.7

Сумма

100

1

100

1.059

1

100

37.6

Для проверки гипотезы о согласии выборки с равномерным законом распределения рассуждаем следующим образом.

Значение критерия  > 9,24= , поэтому попадает в критическую область. На основании этого гипотезу о равномерном законе распределения отвергаем, как не согласующуюся с результатами наблюдений. Расхождение между эмпирическим и теоретическим законами распределения значимо при данном уровне значимости 0.1.

Рассмотрим также другую схему применения критерия.

В таблице вероятностей для распределения (приложение  4) по аргументу 1,059 и числу степеней свободы k = 8 − 2 − 1 = 5 находим (ближайшее табличное значение 0,9626 для аргумента 1). Поскольку 0.958 > 0,1 = α (уровня значимости), принимаем гипотезу о том, что выборка из нормального распределения. Аналогично для равномерного закона находим вероятность < α (уже для аргумента 30 вероятность меньше , поэтому в таблице стоит нулевое значение). Поскольку найденная вероятность меньше уровня значимости, гипотезу о равномерном законе распределения отвергаем при данном уровне значимости.