Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие по мат_инф.doc
Скачиваний:
167
Добавлен:
17.03.2016
Размер:
1.91 Mб
Скачать

Глава 7. Проверка статистических гипотез

7.1. Понятие и классификация статистических гипотез

Статистической гипотезой называется предположение относительно вида неизвестного распределения или параметров известных распределений наблюдаемой случайной величины.

Ранее в 5.2 рассматривались примеры 1, 2, где вычислялись выборочные характеристики, были построены полигон или гистограмма. Можно предположить, что данная случайная величина распределена по одному из известных законов. Следующий этап: нужно проверить, что экспериментальные данные соответствуют высказанной гипотезе и принять её. Этот этап называется проверкой статистической гипотезы. Алгоритм проверки гипотезы называется решающим правилом. Так как гипотеза выдвигалась на основе выборочных данных, то гипотеза будет носить вероятностный характер.

К основным задачам математической статистики относятся:

  1. Статистическая проверка гипотез о параметрах распределения. В этом случае предполагается, что закон распределения случайной величины установлен. Пусть совокупность распределена по нормальному закону. Выдвигается гипотеза о математическом ожидании в предполагаемом диапазоне.

  2. Статистическая проверка гипотез о законе распределения случайной величины. Гипотезы о виде распределения выдвигаются в условиях недостаточной информации о выборке.

Практически экспериментальные данные при большой выборке приближаются к нормальному закону. Выдвинув такую гипотезу, далее следует найти доверительные интервалы для параметров этого распределения. Проверяемая гипотеза называется нулевой (основной), наиболее правдоподобной по каким-то соображениям, и обозначают её H0. Наряду с основной гипотезой рассматривают альтернативную (конкурирующую) гипотезуH1, противоречащую основной. Выдвинутая нулевая гипотеза нуждается в дальнейшей проверке.

При этом могут быть допущены ошибки двух типов:

  1. Ошибка первого рода – отвергнута правильная гипотеза;

  2. Ошибка второго рода – принята неправильная гипотеза.

7.2. Общая схема проверки гипотез

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближённое распределение которой известно, обозначают её через Z, если она распределена нормально, T – по закону Стьюдента, 2 – по закону «хи–квадрат». Данная специально подобранная случайная величина называется статистическим критерием или критерием значимости, который в дальнейшем будет обозначаться через Z. Статистический критерий служит для проверки нулевой гипотезы.

Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия принимают отношение исправленных выборочных дисперсий. Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и получают наблюдаемое значение критерия. Наблюдаемым значением критерия Zнаблназывают значение критерия, вычисленное по выборкам. Например, если по двум выборкам найдены выборочные дисперсии d1=27; d2=9, то наблюдаемое значение критерия равно отношению большей исправленной дисперсии к меньшей:Задачу проверки гипотез можно сформулировать следующим образом.

1. Требуется найти случайную величину Z, которую ещё называют статистикой критерия, удовлетворяющую двум основным требованиям:

а) Значение критерия можно посчитать только на основании выборки.

б) Распределение критерия известно в предположении, что нулевая гипотеза верна.

2. После поиска или выбора статистики находится критическая область. На числовой оси выделяется область, попадание в которую для случайной величины маловероятно. Малая вероятность задаётся, как и в доверительных интервалах, малым числом – , которое называют уровнем значимости. Вероятность совершить ошибку первого рода (вероятность отвергнуть правильную гипотезу) равна– уровню значимости.

Критическойобластьюназывают совокупность значений критерия Z, при которых нулевую гипотезу отвергают. Областью принятия гипотез называют совокупность значений критерия Z, при которых нулевую гипотезу принимают.

Критическимиточками(границами) – zkpназывают точки, отделяющие критическую область от области принятия гипотезы.

Различают три вида критической области:

  • правосторонняя, определяемая неравенством Z > zkp> 0;

  • левосторонняя, определяемая неравенством Z < zkp< 0;

  • двусторонняя, определяемая неравенством Z< -zкр ; Z>zкр.

В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенством Z> zkp> 0. При отыскании критической области задаются достаточно малой вероятностью – уровнем значимостии ищут критические точки, исходя из требования, чтобы вероятность того, что критерий Z примет значения, лежащие в критической области, была равна принятому уровню значимости. В результате получают:

  • для правосторонней критической области:

    P (Z > zkp) =;

    (7.1)

  • для левосторонней критической области P (Z < zkp) =;

  • для двусторонней симметричной области P (Z > zkp) =/2 .

Основной принцип статистической проверки гипотез заключается в следующем:

  • Если наблюдаемое значение критерия Zнабл, вычисленное по данным выборки, принадлежит критической области, то гипотезу отвергают.

  • Если наблюдаемое значение не принадлежит критической области, то нет оснований отвергать гипотезу.

Для каждого критерия имеются соответствующие таблицы, позволяющие по найти критические точки zkp, удовлетворяющие требованию (7.1).