- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
3.5. Критерий согласия Пирсона
Одна из возможных реализаций критерия согласия для проверки гипотезы о законе распределения случайной величины была предложена Пирсоном. Применение критерия Пирсона возможно, если выборка представлена в виде сгруппированного вариационного ряда (см. таблицу 1.2.3).
Рассмотрим сначала случай, когда проверяется гипотеза о нормальном распределении генеральной совокупности с параметрами и . Для нормального закона распределения (см. параграф 2.3), можно найти предполагаемые вероятности попадания случайной величины в любой промежуток :
.
Отметим, что для промежутков ; ; , вероятность не изменится [3]. Чтобы выполнялось равенство , крайние промежутки и делают полубесконечными: и . В каждом интервале эмпирические частоты не должны существенно отличаться от теоретических вероятностей , вычисленных в предположении о нормальном распределении генеральной совокупности. Следовательно, если верна нулевая гипотеза, то сумма величин nj/n – pj не должна быть слишком большой. Пирсон предложил для проверки нулевой гипотезы использовать случайную величину
,
где r – количество интервалов сгруппированного вариационного ряда.
Значение U зависит от общей степени расхождения эмпирических частот и теоретических вероятностей во всех интервалах. Возведение в квадрат исключает возможность взаимного погашения отрицательных и положительных разностей. Поправочный коэффициент меняет вес слагаемых в зависимости от вероятности попадания Х в данный интервал. В интервалах с большей вероятностью , и, следовательно, с увеличенными значениями , допускаются большие отклонения эмпирической частоты от теоретической вероятности. Для выборок большего объема n разности должны быть меньше, чтобы критерий Пирсона принял то же самое значение. Следует отметить, что величина U для конкретной выборки зависит не только от значений вариант, но она изменится при другом выборе границ промежутков .
Пирсон доказал, что в случае справедливости основной гипотезы , случайная величина U при большом объеме выборки имеет распределение, близкое к распределению χ2 с k = r – 3 степенями свободы [3]. Поэтому критерий Пирсона часто называют критерием «хи-квадрат». Числом степеней свободы в данном случае называется разность между числом столбцов r в таблице 1.2.3 (т.е. количеством интервалов, на которые разбит весь диапазон изменения вариант) и количеством формул, связывающих между собой значения вариант. Элементы выборки использовались при вычислении точечных оценок и s, а, кроме того, . Критические значения сведены в таблицу (см. приложение 3). Если в конкретной выборке и при этом , то гипотеза о нормальном распределении генеральной совокупности отвергается.
Критерий Пирсона для нормального распределения можно применять, когда количество результатов наблюдений больше 50. При этом рекомендуется в каждом интервале иметь не менее пяти наблюдений. Если частоты отдельных интервалов малы, то следует объединять соседние интервалы. Существуют методы [5] проверки нормальности распределения при числе наблюдений от 16 до 50, а при меньшем количестве наблюдений принадлежность их к нормальному распределению не проверяется.
Отметим, что критерий Пирсона можно применять для функций распределения отличных от нормального закона. В этом случае выводы справедливы, если значения достаточно велики, что возможно при выборках большого объема .