- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
3.6. Критерий согласия Колмогорова
При любом критерии согласия сравниваются две функции распределения: эмпирическая и предполагаемая теоретическая . Если расхождения между ними велики, то гипотеза о том, что функция распределения генеральной совокупности имеет вид , отвергается. В критерии Колмогорова степень расхождения оценивается максимальной (при всех возможных значениях х) величиной разности опытной и теоретической функций. Рассмотрим случайную величина , где . При справедливости гипотезы и больших объемах выборки n случайная величина Т имеет функцию распределения близкую к , некоторые значения которой приведены в приложении 5. Задав уровень значимости , можно по таблице найти значение при котором . Если в конкретной выборке Т примет значение и при этом , то гипотеза о том, что функция распределения генеральной совокупности равна , отвергается. Если , то статистические данные не противоречат гипотезе .
3.7. Примеры проверки гипотез
I. Пусть по двум независимым выборкам (объемом и соответственно), полученным из нормальных генеральных совокупностей, вычислены исправленные выборочные дисперсии и . Чтобы убедится в том, что различие между и несущественно (незначимо), проверим нулевую гипотезу о равенстве генеральных дисперсий. Согласно критерию Фишера, прежде всего, надо вычислить отношение большей дисперсии к меньшей:
.
При конкурирующей гипотезе критическая область является односторонней. При уровне значимости и степенях свободы и в таблице приложения 4 находим . Так как , то нет оснований отвергать гипотезу о равенстве генеральных дисперсий и различие между и незначимо.
II. Пусть имеются две независимые выборки из генеральных совокупностей X и Y объемом и соответственно. Для них вычислены выборочные средние ; и исправленные выборочные дисперсии ; . Проверим нулевую гипотезу о равенстве генеральных средних, чтобы убедиться в том, что различие между величинами и можно считать незначимым.
Значение t, удовлетворяющее уравнению , находим по таблице приложения 1. При уровне значимости величина является приближенным решением этого уравнения, так как . При найденном значении t вычисляем
;
.
Так как 0 попадает в интервал (–0,15; 0,39) то гипотеза принимается.
III. Результаты 200 измерений некоторой физической величины представлены в таблице 3.7.1 сгруппированным вариационным рядом.
Таблица 3.7.1
Интервал |
[3; 4] |
(4; 5] |
(5; 6] |
(6; 7] |
(7; 8] |
(8; 9] |
(9; 10] |
(10; 11] |
|
3 |
7 |
26 |
56 |
64 |
30 |
12 |
2 |
Требуется с помощью критерия Пирсона проверить гипотезу о том, что генеральная совокупность распределена по нормальному закону.
Проверка нулевой гипотезы по критерию Пирсона состоит из нескольких этапов.
По выборке вычисляются точечные оценки математического ожидания и среднеквадратического отклонения .
В каждом промежутке определяются эмпирические частоты и теоретические вероятности.
Для данной выборки вычисляется наблюдаемое значение критерия Пирсона.
Задается уровень значимости и подсчитывается количество степеней свободы.
По таблице приложения 3 определяется значение .
Если , то гипотеза отвергается как маловероятная.
1) Определив объем выборки , вычисляем выборочное среднее и несмещенную оценку среднеквадратического отклонения :
;
;
;
;
;
.
Таблица 3.7.2
Интервал |
|
(– ; 5] |
|
(5; 6] |
|
(6; 7] |
|
(7; 8] |
|
(8; 9] |
|
(9; ) |
|
Граница |
|
|
5 |
|
6 |
|
7 |
|
8 |
|
9 |
|
|
|
|
10 |
|
26 |
|
56 |
|
64 |
|
30 |
|
14 |
|
|
|
|
– 1,66 |
|
– 0,87 |
|
– 0,075 |
|
0,72 |
|
1,51 |
|
|
|
– 0,5 |
|
– 0,45 |
|
– 0,31 |
|
– 0,03 |
|
0,26 |
|
0,43 |
|
0,5 |
|
|
0,05 |
|
0,14 |
|
0,28 |
|
0,29 |
|
0,17 |
|
0,07 |
|
|
|
10 |
|
28 |
|
56 |
|
58 |
|
34 |
|
14 |
|
|
|
0 |
|
2 |
|
0 |
|
6 |
|
4 |
|
0 |
|
|
|
0 |
|
0,14 |
|
0 |
|
0,62 |
|
0,47 |
|
0 |
|
2) Теперь, используя таблицу приложения 1, надо найти теоретические вероятности попадания варианты в каждый промежуток
,
и определить
Вычисления удобно проводить в таблице 3.7.2. Предварительно следует изменить таблицу 3.7.1, объединив первый столбец со вторым и седьмой столбец с восьмым, так как в крайних столбцах количество вариант меньше пяти.
Сначала в граничных точках вычисляем аргументы функции Лапласа. Например, для промежутка (7; 8] имеем
,
.
По таблице приложения 1 вычисляем теоретическую вероятность попадания варианты в промежуток (7; 8]
.
Функции является нечетной, следовательно,
.
В последней строке таблицы 3.7.2 помещены значения . Для промежутка [7; 8) эта величина принимает значение .
3) Суммируя все числа последней строки, получаем . Полученное число необходимо сравнить с величиной .
4) Выбираем уровень значимости . Количество интервалов вариационного ряда, приведенного в таблице 3.7.2, равно шести, следовательно, число степеней свободы .
5) В таблице приложения 3 параметрам и соответствует значение .
6) при выбранной надежности 0,95, следовательно, отвергать гипотезу оснований нет. Предположение о том, что исследуемая физическая величина распределена по нормальному закону с параметрами , , не противоречит результатам измерений.
Следовательно, можно считать, что функция плотности вероятности изучаемой физической величины имеет вид (см. параграф 2.3)
.
Значения функции приведены в таблице приложения 1, а график изображен на рисунке 3.7.1 сплошной линией. Отдельные точки на том же рисунке соответствуют относительной частоте выборки . Очевидно, что теоретическое распределение вполне согласуется с результатами выборки.
Рис. 3.7.1
IV. Проверить гипотезу , выдвинутую в предыдущей задаче, с помощью критерия Колмогорова.
Проверка нулевой гипотезы по критерию Колмогорова также состоит из нескольких этапов.
Вычисляются значения эмпирической и теоретической функций распределения.
Определяется наибольшее расхождение между этими функциями, т.е.
Вычисляется .
Задается уровень значимости .
По таблице приложения 5 выбирается , при котором .
Если , то гипотеза отвергается как маловероятная.
1) Во всех точках (см. таблицу 1.3.2) найдем разность двух функций распределения: эмпирической и предполагаемой теоретической при и . Результаты вычислений представим в виде таблицы 3.5.3.
Таблица 3.7.3
Интервал |
[3; 4] |
(4; 5] |
(5; 6] |
(6; 7] |
(7; 8] |
(8; 9] |
(9; 10] |
(10; 11] |
|
3 |
7 |
26 |
56 |
64 |
30 |
12 |
2 |
|
3 |
10 |
36 |
92 |
156 |
186 |
198 |
200 |
|
0,015 |
0,05 |
0,18 |
0,46 |
0,78 |
0,93 |
0,99 |
1 |
|
–2,46 |
–1,66 |
– 0,87 |
– 0,075 |
0,72 |
1,51 |
2,31 |
3,01 |
|
– 0,493 |
– 0,45 |
– 0,31 |
– 0,03 |
0,26 |
0,43 |
0,4896 |
0,499 |
|
0,007 |
0,05 |
0,19 |
0,47 |
0,76 |
0,93 |
0,99 |
1 |
|
0,008 |
0 |
0,01 |
0,01 |
0,02 |
0 |
0 |
0 |
Например, для первого интервала, в котором ,
.
По таблице приложения 1 вычисляем значения теоретической функции распределения в граничных точках
.
Например, для первого интервала,
.
Модуль разности значений двух вычисленных функций записываем в последнюю строку таблицы.
2) Наибольшее число последней строки расположено в пятом столбце, поэтому принимаем .
3) С учетом объема выборки находим значение, которое приняла случайная величина Т для данной выборки:
.
4) При уровне значимости значение функции распределения Колмогорова должно равняться 0,95.
5) В таблице значений (см. приложение 5) в одиннадцатой строке и шестом столбце расположено число 0,9505, следовательно, .
6) При нет оснований отвергать гипотезу .
Можно считать, что функция распределения генеральной совокупности имеет вид
.
График этой функции изображен на рисунке 3.7.2 сплошной линией. Отдельные точки на том же рисунке соответствуют значениям эмпирической функции распределения . Очевидно, что теоретическое распределение вполне согласуется с результатами выборки.
Рис. 3.7.2
В заключение приведем критические значения и распределения Колмогорова для других уровней значимости ( и соответственно).