Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8028

.pdf
Скачиваний:
0
Добавлен:
23.11.2023
Размер:
1.33 Mб
Скачать

МИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования

«Нижегородский государственный архитектурно-строительный университет»

Филатов Л.В.

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Учебно-методическое пособие

по подготовке к лекциям и практическим занятиям

для обучающихся по дисциплине «Математика» по направлению подготовки 08.03.01 Строительство

направленность (профиль) Автомобильные дороги, Производство и применение строительных материалов, изделий и конструкций, Водоснабжение и водоотведение, Теплогазоснабжение и вентиляция, Гидротехническое, геотехническое и энергетическое строительство, Организация инве- стиционно-строительной деятельности, Промышленное и гражданское строительство.

Нижний Новгород

2022

МИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования

«Нижегородский государственный архитектурно-строительный университет»

Филатов Л.В.

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Учебно-методическое пособие

по подготовке к лекциям и практическим занятиям

для обучающихся по дисциплине «Математика» по направлению подготовки 08.03.01 Строительство

направленность (профиль) Автомобильные дороги, Производство и применение строительных материалов, изделий и конструкций, Водоснабжение и водоотведение, Теплогазоснабжение и вентиляция, Гидротехническое, геотехническое и энергетическое строительство, Организация инве- стиционно-строительной деятельности, Промышленное и гражданское строительство.

Нижний Новгород ННГАСУ

2022

1

ББК: 22.172+22.172 УДК: 519.2 (076.5)

Филатов Л.В. Проверка статистических гипотез : учеб.- метод. пос. / Л.В. Филатов; Нижегородский государственный архитектурно - строительный университет. – Нижний Новгород: ННГАСУ, 2022. – 40 с. ил.– Текст: электронный

Рассматривается основные положения теории проверки статистических гипотез. Описываются алгоритмы построения критериев проверки гипотез о виде распределения случайных величин, о значении неизвестных параметров распределения, о значимости свойств выборочных совокупностей. Даются основные понятия и формулы, примеры решения задач, набор расчетных заданий и контрольных вопросов для самопроверки материала.

Пособие предназначено обучающимся в ННГАСУ для подготовки к лекционным и практи-

ческим занятиям по дисциплине «Математика» по направлению подготовки 08.03.01 Стро-

ительство направленность (профиль) Автомобильные дороги, Производство и применение строительных материалов, изделий и конструкций, Водоснабжение и водоотведение, Теплогазоснабжение и вентиляция, Гидротехническое, геотехническое и энергетическое строительство, Организация инвестиционно-строительной деятельности, Промышленное и гражданское строительство.

© Л.В. Филатов, 2022 © ННГАСУ, 2022.

2

1. Введение

Имея дело со случайными величинами в различных областях человеческой деятельности, часто приходится высказывать предположения о виде распределения случайной величины или о значениях ее параметров. Эти предположения,

называемые статистическими гипотезами, строятся с целью прогнозирования поведения случайной величины и принятия решений в условиях неопределенности.

Высказанная статистическая гипотеза должна быть проверена по результатам наблюдений (измерений) случайной величины, в результате чего гипотеза принима-

ется или отвергается с определенной степенью риска совершить ошибку.

Задачи проверки статистических гипотез, связанные с формулировкой и ана-

лизом критериев такой проверки, составляют предмет обширного раздела совре-

менной математической статистики и рассматриваются в настоящем методическом пособии.

2. Простые и сложные статистические гипотезы.

Статистическая гипотеза Н называется простой, если она однозначно опреде-

ляет закон распределения случайной величины Х, например, для непрерывных ве-

личин в виде функции распределения Fх(x, )

 

или функции плотности распределе-

ния вероятности fх(x, ) c определенными значениями параметров .

При этом, ве-

роятность попадания значений одномерной

случайной

величины

Х в интервал

12] может быть вычислена по формулам:

 

 

 

 

 

 

 

x2

 

 

 

d

 

Р(х1<X< х2) = Fх(x2, ) - Fх(x1, ) =

 

f x (x, )dx ;

fх(x, ) =

 

Fх(x, )

 

 

 

 

 

dx

 

x1

 

 

 

 

 

 

 

 

Гипотеза является сложной, если в ней неизвестный закон распределения

предполагается принадлежащим к некоторому допустимому множеству распределе-

ний.

3

Пример простой статистической гипотезы Н1:

Длина ж/б перекрытия распределена по нормальному закону N(a, ) cо следу-

ющими параметрами: математическое ожидание а=600см, среднеквадратическое отклонение =0,75см.

Пример сложной статистической гипотезы Н2:

Толщина ж/б перекрытия распределена по нормальному закону N(a, ) cо сле-

дующими параметрами: математическое ожидание а=20см, среднеквадратическое отклонение <0,75см.

Ясно, что сложная гипотеза состоит из множества простых гипотез. Это мно-

жество (конечное или бесконечное) может быть описано изменением некоторого параметра h в определенных пределах. Так, в приведенном примере Н2={

Н1=20, h); 0<h<0,75}.

Статистическими гипотезами являются так же и некоторые макро утвержде-

ния, вытекающие из предположения о виде закона распределения случайной вели-

чины и имеющие определенное практическое значение. Так, например, утверждение

Н3 о том, что поступившая на предприятие большая партия продукции содержит недопустимый процент брака, основано на предполагаемом законе распределения количества брака в данной партии.

3. Проверка статистических гипотез.

Выдвинутая статистическая гипотеза Н должна быть проверена. Как и в лю-

бой другой науке, критерием ее проверки является опыт, т.е. наблюдение (измере-

ние) случайной величины. В математической статистике эти наблюдения представ-

ляются выборкой ХВ={xi, n} ={x1, x2, …… xn} объема n. Критерий проверки должен отвергать или принимать гипотезу по результатам наблюдения. В силу случайной природы наблюдаемых в выборке значений xi, в результате применения критерия возможны следующие четыре случайные события, их вероятности и совершаемые

при этом ошибки:

4

 

Таблица 1

 

 

 

 

 

 

 

 

Наличие

Результат проверки гипотезы

Вероятность

 

 

 

 

 

ошибки

 

 

 

 

Гипотеза Н отвергается, когда она верна

 

 

ошибка I-рода

 

 

 

 

Гипотеза Н принимается, когда она верна

 

 

нет ошибки

 

 

 

 

Гипотеза Н принимается, когда она не верна

 

 

ошибка II-

 

 

 

рода

 

 

 

 

Гипотеза Н отвергается, когда она не верна

 

 

нет ошибки

 

 

 

 

Из таблицы видно, что с вероятностью при проверке может быть совершена ошибка I-рода, когда отвергается верная гипотеза и с вероятностью ошибка II-

рода, когда принимается не верная гипотеза. Поэтому первым требованием к крите-

рию проверки является минимизация вероятности ошибок, однако здесь нужно от-

метить два существенных момента:

Во-первых, ошибки I и II рода могут иметь различную значимость с точки зрения их последствий. Так, например, для гипотезы Н ={Партия ж/б перекрытий аварийно опасна и не должна поставляться на стройки} ошибка I.рода приводит к поставке на стройку аварийно опасных изделий, что может повлечь человеческие жертвы. Ошибка же II рода здесь приводит к забраковыванию безопасной партии изделий, что влечет к экономическим потерям завода ЖБК. Ясно, что значимость ошибки I рода в приведенном примере выше, чем ошибки II рода, т.к. человеческие жертвы не сравнимы с любыми потерями и не допустимы. Принято считать, что ошибки I рода более значимы чем ошибки II рода, если это не так, то проверяемую гипотезу необходимо переформулировать соответствующим образом (например,

перейти к противоположной гипотезе).

Во-вторых, ошибки I и II рода находятся в некотором противоречии друг с другом, поскольку, если при построении критерия уменьшать вероятность одной из

5

них, то вероятность другой будет возрастать. Так, например, при использовании гипотетического критерия, отвергающего любую гипотезу, ошибки II рода совер-

шаться не будут ( =0, “ложь не пройдет”), но при этом всегда будем совершать ошибку I рода ( ” истина не установиться“).

Учитывая сказанное, при построении критерия проверки статистической ги-

потезы необходимо, сначала задаться допустимым уровнем риска совершить ошиб-

ку I рода, как наиболее значимую, а затем минимизировать ошибки II рода.

4. Построение критерия проверки гипотезы.

Пусть необходимо проверить простую гипотезу H0={X fх(x, )}, состоящую в предположении о виде функции плотности распределения случайной величины Х с

вполне определенными параметрами . Построим критерий, однозначно принима-

ющий или отвергающий проверяемую гипотезу по полученной в наблюдении за случайной величиной Х выборке ХВ={x1, x2, x3, …… xn} объема n. Помимо основной гипотезы H0 (“нулевой”) рассмотрим еще одну или несколько альтернативных гипо-

тез H1,H2,H3, …,Hm каждая из которых противоречит основной.

Критерий проверки гипотезы состоит из двух составляющих:

Во-первых в качестве критерия принимается некоторая случайная величина К,

с известными распределениями при условии справедливости основной и альтерна-

тивных гипотез fK(k Hj) j=0,1, ..m и значения которой можно вычислить по наблюдаемой выборке ХВ, т.е. kнабл= хi .

Во-вторых, строится решающее правило для критерия проверки, согласно ко-

торого гипотеза будет приниматься или отвергаться. Для этого, назовем критиче-

ской областью критерия те значения величины К, при которых гипотеза отвергает-

ся. Критическую область будем обозначать Ккр. Тогда решающее правило критерия проверки будет следующим:

kнабл

Ккр

H0 отвергается (по наблюдаемой выборке),

kнабл

Ккр

H0 принимается (нет оснований отвергать гипотезу)

6

Точки значения критерия К, где критическая область критерия проверки Ккр отделя-

ется от области принятия гипотезы Кпр, называются критическими точками крите-

рия kкр. Как построить критическую область критерия, или что равносильно, как найти критические точки критерия? Ниже рассмотрим ответ на этот вопрос.

Зададимся вероятностью ошибки I рода, как наиболее значимой. Исключить такую ошибку при проверке гипотезы невозможно ( ), но в вероятностных зада-

чах это не является трагедией. На практике обычно эту вероятность задают достаточно малой величиной 0,005 и называют уровнем значимости кри-

терия. Если из условия

Р( k Ккр ) =

fK( k H0 ) dx =

Kкр

 

можно определить критические точки kкр однозначно, то задача построения крити-

ческой области критерия решена. В противном случае, когда еще остается свобода выбора критических точек, рассмотрим влияние альтернативных гипотез. Посколь-

ку величина

fK( k Hj ) dx = 1 - j, j=1,..m

Kкр

есть вероятность правильного отбрасывания H0 при условии справедливости Hj, то ее называют мощностью критерия по отношению к альтернативной гипотезе Hj. По-

этому, при заданном уровне значимости , критическую область критерия нужно строить так, чтобы мощность критерия была максимальной, а именно:

(1 - j ) max , для наиболее мощного критерия (НМК) относительно гипо-

тезы Hj , максимизация проводится по параметрам сложной гипотезы Hj.

min (1 - j ) max, для равномерно наиболее мощного критерия (РНМК), в

случае наличия нескольких сложных гипотез.

Величина j есть вероятность принять неверную гипотезу H0 при условии справедливости альтернативной гипотезы Hj. На рисунке 1 приведена графическая интерпретация алгоритма построения критической области одномерного критерия.

7

Видим, что структура критической области зависит от наличия альтернативных ги-

потез и их расположения относительно основной гипотезы.

Рис. 1. Двухсторонняя критическая область критерия Ккр={ k>k2, k<k1} при наличии двух альтернативных гипотез Н1, Н2.

5. Примеры построения критериев проверки гипотез о значении параметров распределения нормальной случайной величины.

По данным выборки ХВ={хi, n} могут быть получены выборочное среднее Хср

и выборочный стандарт S:

 

1

n

 

1

n

Хср=

 

x j ,

S =

 

( X ср x j )2 .

n

 

 

j 1

 

n 1 j 1

Эти величины являются случайными и по ним могут быть построены оценки мате-

матического ожидания а=М[X] и дисперсии D[X] наблюдаемой в выборке слу-

чайной величины Х. Так, точечные оценки:

а* ср; ( S2

8

являются несмещенными, состоятельными оценками характеристик наблюдаемой величины [1], однако об их точности и эффективности можно говорить лишь, ис-

следовав вероятностные свойства этих оценок.

Ясно, что точность оценки возрастает с увеличением объема выборки, но большие выборки часто неприемлемы на практике. Поэтому построение эффективных оце-

нок, обладающих требуемой точностью на малых выборках, является важнейшей задачей математической статистики.

Для проведения анализа вероятностных свойств оценок необходимо знать за-

кон распределения наблюдаемой величины Х, который в приложениях обычно не-

известен точно, но может быть предположен в виде гипотезы.

Пусть случайная величина Х распределена нормально по закону N(а, ) с не-

известными параметрами а,

и наблюдается в выборке XB={xi, n} объема n. Нор-

мальный закон распределения N(а, ) задается

следующей функцией плотности

распределения вероятности:

 

 

 

 

 

 

 

fX(x)=

 

1

 

exp(

(х а)2

) ;

M[Х]=а, D[Х]= .

 

 

 

 

 

 

 

 

2

 

 

2 2

 

Ниже проверим ряд простых статистических гипотез об истинных значениях параметров нормальной случайной величины Х.

5.1. Проверим гипотезу о том, что истинная (гипотетическая) дисперсия слу-

чайной величины равна Проверяемая гипотеза Н0={ = }. В качестве критерия возьмем одномерную случайную величину К, имеющую распределение «хи-

квадрат» с n-1 степенями свободы:

К=(n-1) S2/ ,

fK( k H0 ) = 2(k,n-1), M[K]=(n-1), D[K]= 2(n-1).

Задаваясь уровнем значимости для проверяемой гипотезы Н0 будем строить критическую область Ккр в зависимости от вида единственной конкурирующей

(альтернативной) гипотезы H1 в следующих случаях:

Случай А: Н1={ > }. В этом случае при справедливости конкурирующей гипотезы ожидаем сдвиг наиболее вероятных значений критерия К в большую сто-

рону, поэтому критическая область критерия будет правосторонней.

9

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]