Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ст. и пл.doc
Скачиваний:
31
Добавлен:
11.11.2019
Размер:
4.35 Mб
Скачать

§ 3. Проверка статистических гипотез

1. Статистические гипотезы. Статистической гипотезой называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Пример. Имеется большая партия деталей с некоторого завода. Каждая деталь является либо годной, либо дефектной. Вся партия деталей считается пригодной к сдаче, если отношение k/n числа дефектных деталей к числу всех деталей невелико, например, не больше некоторого p, где 0 < p < 1. Отношение k/n оценивается путем исследования небольшой выборочной совокупности деталей. Рассмотрим случайную величину , которая равна 0, если взятая наудачу деталь окажется пригодной, и равна 1, если взятая наудачу деталь окажется дефектной. Функция распределения этой случайной величины

Точное значение параметра k/n, от которого зависит распределение, неизвестно, однако для нас важно, выполняется ли условие k/n < p. Это неравенство и является в данном случае статистической гипотезой, которая подлежит проверке.

Гипотезу H0, которую хотят проверить, называют основной или нулевой гипотезой. Всякую гипотезу HА, противоречащую основной, называют альтернативной или конкурирующей гипотезой.

Если, например, основная гипотеза имеет вид ab, то в качестве альтернативной гипотезы может быть выбрано какое-либо из соотношений a < b, a > b, ab.

При проверке гипотезы могут быть допущены ошибки двух родов. Ошибка 1-го рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки 1-го рода называют уровнем значимости и обозначают через . Ошибка 2-го рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки 2-го рода обозначают через .

Если уровень значимости  задавать слишком малым, то увеличивается вероятность  и наоборот.

Для проверки гипотезы рассматривают случайную величину K, которая выражается через эмпирические характеристики тех случайных величин, о которых говорится в гипотезе. Случайную величину K называют статистическим критерием (или просто критерием) для данной гипотезы.

Если в результате наблюдений получены выборки значений случайных величин, относительно которых сделана гипотеза, то эмпирические характеристики принимают определенное значение, а значит, и критерий K также принимает определенное значение. Это значение будем называть наблюдаемым и обозначать Kнабл.

Критической областью называют совокупность значений критерия, при которых основную гипотезу отвергают. Областью принятия гипотезы называют совокупность значений критерия, при которых основную гипотезу принимают.

Точки, отделяющие критическую область от области принятия гипотезы, называют критическими.

Критическую область вида (Kкр, ) называют правосторонней. Она имеет единственную критическую точку Kкр, определяемую равенством P(K > Kкр)  .

Критическую область вида (–, Kкр) называют левосторонней. Она имеет единственную критическую точку Kкр, определяемую равенством P(K < Kкр)  .

Односторонние критические области возникают, например, когда основная гипотеза имеет вид ab, а в качестве альтернативной выбрано одно из неравенств a < b, a > b. Если же альтернативная гипотеза имеет вид ab, то критическая область состоит из двух частей, соответствующих неравенствам a < b и a > b.

Критическую область, являющуюся объединением интервалов (–, )  ( ), где  <  называют двусторонней, она имеет две критические точки: левую и правую которые при заданном уровне значимости  должны удовлетворять условию P(K < ) + + P(K > )  . Обычно критические точки находят из уравнений P(K < )  P(K > )   / 2. Это особенно удобно, если плотность вероятностей f случайной величины K является четной функцией. В этом случае, поскольку P(K < –a)  P(K > a), получаем  – так что достаточно разыскать решение только одного уравнения P(K > )   / 2.