Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_MS.doc
Скачиваний:
197
Добавлен:
01.06.2015
Размер:
3.47 Mб
Скачать

Тема 13. Задачи проверки статистических гипотез

Важной задачей математической статистики является задача проверки статистических гипотез.

Статистической гипотезой называется любое утверждение о виде или свойствах функции распределения случайной величины, наблюдаемой в эксперименте.

Сформулированную гипотезу называютосновной, совокупность всех распределений, которые не вошли в основную гипотезу, но возможны в рассматриваемой задаче, называют альтернативой и обозначают .

Задача проверки статистических гипотез заключается в построении правила, позволяющего по конкретному значению выборки принять или отвергнуть основную гипотезу.

Если в результате проверки гипотезы было принято решение о справедливости альтернативной гипотезы в случае, когда верна основная гипотеза, то говорят, что совершена ошибка первого рода. Вероятность этой ошибки называется уровнем значимости

,

где - основная гипотеза,- решение о справедливости альтернативы.

Обычно уровень значимости полагают равным 0,1; 0,05; 0,01.

Вероятность принять основную гипотезу при справедливости альтернативы называетсяошибкой второго рода.

Критерием называют случайную величину , которая служит для проверки нулевой гипотезы. Множество всех возможных значений критерия разбивают на два непересекающихся подмножества: значения критерия, при которых основная гипотеза отвергается, и значения критерия, при которых нулевая гипотеза принимается.

Критической областью называют совокупность значений критерия, при которых гипотезу отвергают.

Допустимой областью называют совокупность значений критерия, при которых гипотеза принимается.

Для того, чтобы определить критическую область, определяют критические точки из условия

(или , или).

Для вычисления значений критерия используются специальные таблицы.

Правила проверки гипотез

Можно проверять гипотезу на основе любой статистики, имеющей любое вероятностное распределение. Можно указать основные случаи: выборочная статистика подчиняются либо нормальному распределению, либо распределению Стьюдента, либо F-распределению, либо2-распределению.

Проверка на основе нормального распределения используется для проверки среднего значения выборки как оценки генеральной средней. Критерий применяется при любом размере выборочной совокупности, когда дисперсия генеральной совокупности известна.

Распределение Стьюдента (t-критерий) используется для проверки гипотезы о среднем значении при любом объеме выборки при неизвестной генеральной дисперсии. При больших выборках это распределение приближается к нормальному распределению.

F-критерий используется для сравнения генеральных дисперсий. Размер выборки может быть любым при условии, что выборка взята из генеральной совокупности.

Критерий 2 – непараметрический, т.е. значения выборочной статистики не требуются. Этот критерий основан на частоте появления значений случайных переменных. Используется для проверки гипотезы связи между переменными или о согласии наблюдаемого распределения с некоторым стандартным распределением.

1. Сравнение двух средних генеральных совокупностей, дисперсии которых известны.

Рассмотрим достаточно большие независимые выборки. Пусть и– объемы больших () независимых выборок, по которым найдены выборочные средние,Генеральные дисперсии,известны.

Гипотеза :

Гипотеза :

Вычислим наблюдаемое значение критерия

.

По таблице (см. Приложение 1), зная значение функции Лапласа , найдем критическую точку.

Если - нет оснований отвергать гипотезу, в противном случае – нулевую гипотезу отвергаем.

Другой вариант формулировки гипотез:

Гипотеза :

Гипотеза :

Критическую точку находим, зная значение функции Лапласа.

Если – нет оснований отвергать, если неравенство другого знака, тоотвергаем.

Гипотеза :

Гипотеза :

Находим значение так же, как в предыдущем пункте.

Если – нет оснований отвергать, если неравенство другого знака –отвергаем.

Сравнение средних двух совокупностей имеет важное практическое значение. На практике часто встречаются случаи, когда средний результат одной серии экспериментов отличается от среднего результата другой серии. При этом возникает вопрос, можно ли объяснить обнаруженное расхождение средних неизбежными случайными ошибками эксперимента или оно вызвано некоторыми закономерностями. В промышленности задача сравнения средних часто возникает при выборочном контроле качества изделий, изготовленных на разных установках.

Пример 1. По двум независимым выборкам, объемы которых и, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние:и. Генеральные дисперсии известны:,. Требуется при уровне значимости 0,01 проверить нулевую гипотезу:при конкурирующей гипотезе:.

Решение. Найдем наблюдаемое значение критерия:

.

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область – двусторонняя.

Найдем правую критическую точку из равенства

По таблице функции Лапласа (см. Приложение 1) находим .

Т.к. , то в соответствии с теорией нулевую гипотезу отвергаем. Другими словами, выборочные средние различаются значимо.

2. Сравнение двух средних нормальных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).

Пусть иобъемы малых независимых выборок (), по которым найдены,и исправленные выборочные дисперсии,. Генеральные дисперсии хоть и неизвестны, но предполагаются одинаковыми. Уровень значимости задан.

Гипотеза :

Гипотеза:

Для проверки нулевой гипотезы в этом случае можно использовать критерий Стьюдента сравнения средних. Величину критерия находим по формуле:

.

Доказано, что величина при справедливости нулевой гипотезы имеет-распределение Стьюдента сстепенями свободы (см. Приложение 3).

По таблице находим .

Сравниваем и. Если , то принимаем. Если, то гипотезаотвергается и принимаетсяи различие достоверно.

Другой вариант формулировки гипотез:

Гипотеза :

Гипотеза :

По таблице по уровню , понаходим. Если , то нет оснований отвергать. В противном случае –отвергаем.

Гипотеза :

Гипотеза :

По таблице находим . Если– нет оснований отвергнуть, в противном случае –отвергаем.

  1. Проверка гипотез для дисперсий.

Пусть генеральные совокупности ираспределены нормально. По независимым выборкам объемови, извлеченным из этих совокупностей, найдены исправленные выборочные дисперсии,. Требуется сравнить эти дисперсии. При заданном уровне значимостинадо проверить нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей.

Гипотеза :

Гипотеза :

В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий используем случайную величину , равную отношению большей исправленной выборочной дисперсии к меньшей.

Величина , при условии справедливости нулевой гипотезы, имеет распределение Фишера - Снедекора со степенями свободыи, где- объем выборки, по которой вычислена большая выборочная дисперсия.

Из таблиц (см. Приложение 4) находим . Сравниваеми. Если, то принимаем нулевую гипотезу, генеральные дисперсии различаются незначимо.

Пример 2. По двум независимым малым выборкам, объемы которых и, извлеченным из нормальных генеральных совокупностейи, найдены выборочные средние:,и исправленные дисперсии,. Требуется при уровне значимости 0,05 проверить нулевую гипотезу:при конкурирующей гипотезе:.

Решение. Исправленные дисперсии различны, поэтому проверим предварительно гипотезу о равенстве генеральных дисперсий, используя критерий Фишера - Снедекора.

Найдем отношение большей дисперсии к меньшей: . Дисперсиязначительно больше дисперсии, поэтому в качестве конкурирующей гипотезы примем гипотезу:. В этом случае критическая область – правосторонняя. По таблице приложений по уровню значимостии числам степеней свободыинаходим критическую точку.

Т.к. – нет оснований отвергнуть нулевую гипотезу о равенстве двух генеральных дисперсий.

Предположение о равенстве генеральных дисперсий выполняется, поэтому сравним средние.

Вычислим наблюдаемое значение критерия Стьюдента .

По условию, конкурирующая гипотеза имеет вид , поэтому критическая область – двусторонняя. По уровню значимости 0,05 и числу степеней свободынаходим по таблице Приложения 3 критическую точку.

Т.к. – нулевую гипотезу о равенстве средних отвергаем. Другими словами, выборочные средние различаются значимо.

  1. Проверка гипотез о законах распределения.

Во многих практических задачах закон распределения случайных величин заранее неизвестен, и надо выбрать модель, согласующуюся с результатами наблюдений.

Выдвигают нулевую гипотезу : неизвестная функция распределенияесть функция распределения некоторого теоретического закона, например, нормального, или экспоненциального, или биномиального. Это определяется сущностью изучаемого явления, а также результатами предварительной обработки наблюдений: формой графика распределения, соотношениями между выборочными данными.

Выдвигается альтернативная гипотеза, что данная генеральная совокупность не распределена по закону .

Задается уровень значимости, например .

Если хотим проверить, согласуются ли эмпирические данные с нашим гипотетическим предположением относительно теоретической функции распределения или нет, то используем критерий согласия.

Критерии согласия строятся на основе выбора некоторой статистики, характеризующей отклонение эмпирических данных от данных, соответствующих гипотезе . Одним из наиболее известных таких критериев является критерий - Пирсона.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]