Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат_статистика.doc
Скачиваний:
22
Добавлен:
22.09.2019
Размер:
370.18 Кб
Скачать

Статистические оценки статистических гипотез

Обычно в практических задачах не встречаются случайные величины, распределения которых точно соответствовали бы теоретическим распределениям. Последние являются математическими моделями реальных распределений. Подбор таких моделей и анализ их адекватности моделируемым случайным величинам, что является одной из основных задач математической статистики, которая, в свою очередь, сводится к проверке предположений (гипотез) о виде модели распределения и о его параметрах.

Определение 3. Статистической называется гипотеза о виде неизвестного распределения, о параметрах известных распределении, об отношениях между случайными величинами и т.д.

Виды статистических гипотез

Определение 4. Нулевой (основной) гипотезой называется выдвинутая гипотеза Н0.

Определение 5. Конкурирующей (альтернативной) гипотезой называется гипотеза Н1, которая противоречит нулевой гипотезе Н0.

Например, если нулевая гипотеза состоит в предположении о том, что математическое ожидание нормального распределения а = 5, то конкурирующая гипотеза может состоять в предположении, что а ≠ 5. В краткой записи:

Н0: а = 5 Н1: а ≠ 5.

Гипотезы различают на простые, (содержащие только одно предположение) и сложные (состоящие из конечного или бесконечного числа простых гипотез). Наиболее распространенными являются два типа гипотез:

  1. Параметрические гипотезы: при известном виде распределения предположения о неизвестных характеристиках этого распределения.

  2. Для известной случайной величины (выборки) предположения о виде ее распределения.

12.3.2.Общая схема проверки статистических гипотез

Определение 6. Статистическим критерием (или просто критерием) называют случайную величину Т, которая служит для проверки статистических гипотез.

Укажем основные моменты проверки статистических гипотез.

  1. Для основной гипотезы Н0 формулируется альтернативная гипотеза Н1.

  2. Выбирается малое положительное число α – уровень значимости проверки. Обычно α колеблется и пределах от 0,01 до 0,05.

  3. Рассматриваются теоретические выборки значений случайных величин, о которых сформулирована гипотеза Н0, и выбирается (формируемся) случайная величина Т. Значения и распределение Т полностью определяются по выборкам при предположении о верности гипотезы Н0. Величина Т называется статистикой или тестом критерия.

  4. На числовой оси задают интервал D такой, что вероятность попадания текста Т в этот интервал равна р = 1 – α:

P (T D) = 1 – α. (12.16)

Интервал D называется областью принятия гипотезы Н0, а оставшаяся область числовой оси — критической областью. В ряде случаев за область D принимают один из интервалов: (- ∞, tкр], [- tкр, tкр], [tкр, ∞), где число tкркритическое значение теста проверки. Соответственно этим промежуткам критерий проверки называется правосторонним, двусторонним пли левосторонним. Соответствующие области отклонения гипотезы Н0: (tкр, ∞). (-∞, - tкр) (tкр, ∞) и (-∞, tкр).

  1. По реализациям анализируемых теоретических выборок вычисляется конкретное (наблюдаемое) значение теста Т (обозначим его tк) и проверяется выполнение условия (12.16): если оно выполняется, то гипотеза Н0 принимается в том смысле, что она не противоречит опытным данным; если же условие (12.16) не выполняется, то полагается, что гипотеза Н0 неверна и вероятность этою события определена неверно.

Из представленной ранее схемы следует, что при проверке гипотезы Н0 возможны следующие ошибки:

  • ошибка первого рода — отвергнуть гипотезу Н0 при ее правильности, вероятность этой ошибки равна α;

  • ошибка второго рода — принятие гипотезы Н0 при правильности альтернативной гипотезы Н1.

Пусть вероятность ошибки второго рода равна β, тогда число 1 – β называют мощностью критерия. Чем больше мощность критерия, тем меньше вероятность ошибки второго рода. При выбранном уровне значимости критическую область следует строить так, чтобы мощность критерия была максимальной.

Можно показать, что в случае ограниченного интервала области принятия гипотезы Н0 (двусторонней критической области) существует связь интервала D, определяемого по (12.15), с доверительным интервалом, определяемым по формуле (12.14).

12.3.3. Типы статистических критериев проверки гипотез

Любой критерии не доказывает справедливость проверяемой гипотезы Н0, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдении. Укажем здесь наиболее употребительные критерии проверки статистических гипотез:

  1. Критерий χ2, или критерий Пирсона.

  2. Критерий Стьюдента.

  3. Критерий Фишера.

  4. Критерий Колмогорова.

Обычно один из указанных критериев и употребляют при составлении теста критерия проверки (см. п. 4 схемы проверки в предыдущем разделе). Основой для составления соответствующих формул критериев Пирсона, Стьюдента и Фишера являются соответствующие соотношения (11.49), (11.51) и (11.53).

Рассмотрим примеры проверки статистических гипотез с использованием критериев χ2 и Стьюдента.

Пример 8. Заданы эмпирические и теоретические частоты ( и ) при числе групп выборки s = 8:

6

13

38

74

106

85

30

14

3

14

42

82

99

76

37

13

При уровне значимости 0,05 проверить гипотезу Н0 о нормальном распределении генеральной совокупности.

Решение. Наблюдаемое значение критерия вычисляется по формуле

(12.17)

или, что то же самое, но упрощенной формуле

(12.18)

где — объем выборки. В нашем случае n = 366. Используя данные исходной таблицы, получаем:

= 36/3+ 169/14 + 1444/42 + 5476/82 +11236/99+ 7225/76 +

+ 900/37 + 196/13 – 366 = 373,19 – 366 = 7,19.

Далее находим число степеней свободы k = s – 3 = 8 – 3 = 5 (число групп выборки минус один — это число степенен свободы распределения Пирсона — и минус еще два, так как нормальное распределение характеризуется двумя параметрами — математическим ожиданием и дисперсией). По таблице критических точек распределения χ2 (приложение 3) по уровню значимости α = 0,05 и числу степеней свободы 5 находим критическое значение теста = 11,1. Так как < , то основании отвергать нулевую гипотезу Н0 нет, т.е. расхождение эмпирических и теоретических частот незначимое. Иными словами, гипотеза о нормальном распределении генеральной совокупности не противоречит данным наблюдений.

Пример 9. Для независимых наблюдений x1, х2, ..., хn проверим гипотезу Н0: математическое ожидание т = т0 при двусторонней альтернативной гипотезе Н1: т ≠ т0. Уровень значимости α задан.

Решение. В качестве критерия проверки нулевой гипотезы примем случайную величину

Т = . (12.19)

где s — опенка среднего квадратического отклонения. Величина Т имеет распределение Стьюдента с п – 1 степенями свободы. По таблице распределения Стьюдента при заданном п находим критическую точку , определяющую доверительный интервал

Р (|Т (п – 1| < ) = р = 1 – α.

Тогда критическая область определяется неравенством |Т (п – 1)| > . Гипотеза Н0 не отклоняется на уровне значимости α, если

| < tp или ). (12.20)

В противном случае, если гипотетическое значение не покрывается доверительным интервалом (12.20) с заданной надежностью р, то гипотеза Н0 отклоняется.