- •Элементы
- •5.1. Проверка гипотез о параметрах распределений.
- •5.1.1. Проверка значения математического ожидания нормального распределения.
- •5.1.2. Проверка значения дисперсии нормального распределения.
- •5.1.3. Проверка значения доли (параметра биноминального распределения).
- •5.2. Сравнение выборок
- •5.2.1. Сравнение дисперсий
- •5.2.2. Сравнение средних двух независимых выборок
- •5.2.3. Сравнение средних парных выборок.
- •5.2.4. Сравнение долей (параметра биноминального распределения)
- •5.3. Проверка однородности выборок.
- •5.4. Дисперсионный анализ (anova)
- •5.4.1. Однофакторный дисперсионный анализ.
- •5.4.2. Многофакторный дисперсионный анализ.
Элементы
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Часть 2.
Статистические гипотезы.
Сравнение выборок.
5.Статистические гипотезы и их проверка.
Статистическими гипотезами называются различные предположения, справедливость которых можно доказать или опровергнуть путём обработки выборочных статистических данных. Рассмотренная в предыдущем параграфе процедура проверки адекватности функции распределения является примером проверки одной из статистических гипотез - гипотезы о виде функции распределения. Ясно, что поскольку мы имеем дело со случайными величинами, то и выводы относительно справедливости той или иной гипотезы будут неоднозначными. Предположим, что некоторая гипотеза верна, а мы на основании выборочных данных её отвергли. При этом мы совершили ошибку, которую принято называтьошибкой первого рода. Вероятность такой ошибки называют уровнем значимости . С другой стороны, мы можем ошибочно принять гипотезу, в то время, как на самом деле верна другая гипотеза, которую называютальтернативной. В этом случае мы совершим ошибку второго рода, вероятность которой .
Конечно, желательно вероятности обеих этих ошибок свести к минимуму. К сожалению, это невозможно, поскольку с уменьшением вероятности ошибки первого рода при фиксированном объёме выборки увеличивается ошибка второго рода. Поэтому на практике ограничиваются только заданием допустимой вероятности ошибки первого рода на уровне 0,05 или 0,01, а анализ вероятности ошибки второго рода производят по мере необходимости в ответственных случаях.
Процедуру проверки гипотезы начинают с расчёта значения некоторой функции выборки, которую называюткритерием. Множество значений этой функции разбивают на два подмножества -область принятия решения и -критическое множество таким образом, чтобы вероятность , а. Если вычисленное значениепопадает в, то гипотезапринимается на уровне значимости(снадёжностью ) если в- то отвергается. В зависимости от характера альтернативной гипотезы критическое множествовыбирают либо односторонним (или), либо двусторонним (и,).
5.1. Проверка гипотез о параметрах распределений.
5.1.1. Проверка значения математического ожидания нормального распределения.
Если известно, что варианты выборки распределены по нормальному закону , стандарт которой неизвестен, то для проверки гипотезыв качестве критерия можно использовать статистику
Эта статистика имеет распределение Стьюдента с числом степеней свободы . Поэтому при альтернативной гипотезегипотезуможно отвергнуть, если(двусторонняя критическая область). Если альтернативная гипотеза, то нулевая гипотеза принимается при условии, а при- при условии. Здесь под символомпонимаются квантили распределения Стьюдента уровня, т.е. числа, удовлетворяющие условию. Однако в ряде таблиц этого распределения под символомпонимаются значения, соответствующие вероятности. При использовании этих таблиц значениепри альтернативной гипотезесоответствует значению, при,, а при,, где- уровень значимости.
В Excel критические значения можно получить функциейСТЬЮДРАСПОБР в меню Статистические. При этом под словом «вероятность» в диалоговом окне понимается значение уровня значимости.
В качестве примера вернёмся к рассмотрению ста результатов измерения концентрации студентами. Для измерений им был дан раствор с концентрацией 309,5 мг/л, а среднее по всем измерениям оказалось равным 310, 185 с выборочным стандартом 3,96….. Встаёт вопрос, можно ли считать это различие случайным, или студенты вносят систематическую ошибку. Другими словами, можно ли считать, что выборка принадлежит генеральной совокупности с параметром =309,5, или. Сравнивая вычисленное значение с найденным функциейСТЬЮДРАСПОБР(0,05;99) , приходим к выводу, что нет оснований утверждать о наличии систематической ошибки в измерениях студентов.
310,185 | |
309,5 | |
3,964269074 | |
1,727935181 | |
tкр. =0,05 |
1,9842169 |
При известном стандарте вместо статистики следует использовать статистику
,
распределённую по нормальному закону . Критические значенияпри уровне значимостидля двусторонней критической области, если использовать таблицы функции, и- при применении таблиц.
В Excel критические значения находятся функциейНОРМСТОБР, в меню Статистические. При этом в диалоговое окно значение вероятности надо устанавливать равным для двусторонней критической области,- для правой односторонней, и- для левой односторонней критической области.
…..Для проверки гипотезы можно также воспользоваться функциейZТЕСТ в меню «Статистические».
При использовании этой функции не надо отдельно вычислять выборочные средние, выборочный стандарт, и критические значения: вводятся непосредственно координаты массива, заданное значение(в окошко «х»), и, если стандарт распределения известен, - его значение в окно «Сигма». Если это окно оставить пустым, то вместо значения стандарта принимается значение выборочного среднеквадратичного отклонения.
Результатом выполнения этой функции является значение вероятности