Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

8504

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
1.67 Mб
Скачать

= { = ( , ); = ̄; = }.

Выдвинутая статистическая гипотеза должна быть проверена. Как и в любой другой науке, критерием её проверки является опыт, т.е. наблюдение (измерение) случайной величины. Алгоритм критерия проверки должен отвергать или принимать гипотезу по результатам наблюдения.

При этом могут быть совершены ошибки двух родов:

,

1. Отвергнута верная гипотеза с вероятностью

α

 

 

2. Принята не верная гипотеза с вероятностью β .

Исключить эти ошибки полностью невозможно («не ошибается тот, кто ничего не делает»), так как они антагонистичны друг к другу. Действи-

тельно, взяв алгоритм «Верю всему» ошибка 1-го рода не совершится

α=0

 

, но ошибка 2-го рода совершается всегда

=1

. Взяв же другой крайний

 

алгоритм «Ни чему не верю» ошибка 1-го рода всегда совершится

α=1

, но

 

ошибка 2-го рода не совершается

=0

. Кузьма Прутков в одном из своих

 

афоризмов говорил: «Что хуже поверить и ошибиться или не поверить и прогадать? ». Истина видимо где-то по середине, учтем и другое свойство ошибок, состоящее в том, что ошибка 1-го рода более значима по своим последствиям. Действительно, пусть выдвинута гипотеза

H={В партии продукции недопустимо высок брак}

Ошибка 1-рода приведет к выпуску партии на рынок, что ведет к авариям, отравлениям и прочим угрозам человеческим жизням. Ошибка 2- рода ведут к переработке продукции, что влечет лишь экономические потери производителя.

3.3.1. Построение алгоритма критерия

Учитывая сказанное, при построении критерия проверки статистической гипотезы необходимо сначала задаться допустимым уровнем риска = 0,1;0, 05;... на совершение ошибки 1 рода, как наиболее значимой, а затем минимизировать ошибки 2 рода.

Пусть необходимо проверить гипотезу Н0 = { ↔ ( , )}, помимо основной гипотезы Н0 («нулевой») рассмотрим ещё одну или несколько альтернативных гипотез 1, 2, 3, … каждая из которых противоречит основной. Построим критерий, однозначно принимающий или

81

отвергающий проверяемую гипотезу по полученной в наблюдении за случайной величиной Х выборке хВ = {1, 2, . . . } объёма . Критерий проверки гипотезы состоит из двух составляющих:

Во-первых, в качестве критерия принимается некоторая случайная величина с известным распределением при условии справедливости основной ( /0) и хотя бы частично известным для альтернативных гипотез ( / ) , = 1, … , . Кроме того, значения критерия должны быть вычисляемы по наблюдаемой выборке хВ, т.е. = ( ).

Во-вторых, строится Алгоритм (решающее правило) для критерия проверки, согласно которому гипотеза будет приниматься или отвергаться. Для этого, назовем критической областью критерия те значения величины , при которых гипотеза отвергается. Критическую область будем обозначать К . Тогда решающее правило критерия проверки будет следующим:

 

 

 

отвергается (по наблюдаемой выборке),

 

 

0

 

 

К 0 принимается (нет оснований отвергать гипотезу).

Точки значения критерия

Ê ,

где критическая область критерия про-

 

 

 

 

 

верки К отделяется от области принятия гипотезы, называются критическими точками критерия . Как построить критическую область критерия?

Принцип максимального правдоподобия утверждает, что наблюдаемые события имеют большую вероятность и наоборот, маловероятные события ненаблюдаемые. Согласно этому принципу, наблюдаемое значение критерия должно иметь в рамках проверяемой гипотезы большую вероятность. В противном случае, если вероятность наблюдаемой величины мала, проверяемую гипотезу нужно отвергать в пользу иных альтернативных гипотез.

Зададимся вероятностью ошибки 1-го рода, как наиболее значимой. Исключить такую ошибку при проверке гипотезы невозможно ( ≠ 0), на практике обычно эту вероятность задают достаточно малой величиной = 0,05; = 0,025; = 0,005 и называют уровнем значимости гипотезы.

Если из условия

( ) = ∫

 

( / ) =

 

 

0

 

 

 

82

можно определить критические точки однозначно, то задача построения критической области критерия решена. В противном случае, когда ещё остаётся свобода выбора критических точек, рассмотрим влияние альтернативных гипотез. Поскольку величина - есть вероятность принять неверную гипотезу 0 при условии справедливости альтернативной гипотезы , то

∫ ( / ) = 1 −

есть вероятность правильного отбрасывания 0 при условии справедливости и её называют мощностью критерия по отношению к альтернативной гипотезе . Поэтому при заданном уровне значимости , критическую область критерия нужно строить так, чтобы мощность критерия была максимальной (1 − ) по отношению ко всем альтернативным гипотезам.

Таким образом, критическими точками критерия являются квантили его распределения, определенные согласно уровню значимости проверяемой гипотезы.

Рис. 3.1. Двухсторонняя критическая область критерия К = { > 2, < 1} при наличии двух альтернативных гипотез 1, Н2

На рис. 3.1 приведена графическая интерпретация алгоритма построения критической области одномерного критерия. Видим, что структура критической области зависит от наличия альтернативных гипотез и их «расположения» относительно основной.

Рассмотрим примеры.

Критерий Смирнова-Граббса. Рассмотрим проблему отсева грубых ошибок при измерении нормальной случайной величины. Пусть мы

83

имеем нормальную выборку наблюдений

x

B

i

объёмом n, а проверя-

 

 

={x ; n}

 

емой гипотезой является гипотеза о не грубой ошибке при измерении

элемента õj этой выборки. Тогда H0 ={X = N(m,σ), xj xB}, H1 = H0

. Крите-

рием для проверки гипотезы является величина Стьюдента

 

 

x

j

x

K =

 

B

 

 

S

 

 

 

=

t

n

 

.

Вычисляя значение

k

nab и критическую точку при заданном уровне зна-

чимости

α

проверяемой гипотезы

k

kr

= t

obr

(α, n)

можно судить о грубости

 

 

 

 

 

 

 

данного измерения. Обычно на грубость измерения проверяются крайние точки наблюдений (максимальная и минимальная). Проверим на грубость измеренную максимальную температуру в рассмотренной выше выборке майских температурных измерений.

x

j

 

= 30, xB

=14.87, S

= 7.89,α

=

0.1

,

knabl

= 30 14.87 =1.918 , 7.89

k

kr

=1.697

 

 

Видим, что при значимости проверяемой гипотезы в 10% критерий от-

клоняет её в пользу гипотезы

H

1

о грубости этого измерения. Таким об-

 

 

 

разом, это измерение грубое и его лучше убрать из выборки. Вывод критерия зависит от точности измерения и значимости гипотезы, то есть риска ошибиться при отклонении верной гипотезы. Так, если уровень

значимости гипотезы повысить до 5%, то

k

kr

= 2.042

, то измерение уже не

 

 

 

является грубым.

Критерий Стьюдента о значимости измеренной величины. В стати-

стическом анализе очень часто используются критерии о значимости оценок различных величин, построенных по выборке. Проверяемой гипотезой является гипотеза о том, что истинная теоретическая величина u равна нулю H0 ={u = 0} , а в наблюдениях ее выборочный аналог uB отличен от нуля. Действительно ли наблюдаемое значение не нулевое (значимое), или это произошло случайно на рассматриваемой выборке? Для ответа на этот вопрос в дальнейшем мы будем использовать критерий Стьюдента рис. 3.2 :

84

Рис. 3.2. Критерий Стьюдента проверки значимости величины

Здесь uB , Su

статистическая оценка и её несмещённая ошибка,

r

количе-

ство степеней свободы выборки, потерянных при построении оценки. Для удобства часто вводится понятие жесткости критерия

( ) = .

Значимость проверяемой оценки имеет место быть при жёсткости > 1, когда проверяемая гипотеза о нулевом значении теоретической величины отвергается.

Например, в качестве проверяемой величины можно взять откло-

нение выборочной оценки от генеральной = − ̄. Проверяемая ги-

потеза и критерий

 

 

 

̄

 

 

| |

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= { = 0},

 

= ,

=

 

 

=

.

0

 

1

 

0

 

/√ − 1

−1

 

 

 

 

 

 

 

 

 

Понятно, что область принятия этой гипотеза со значимостью α совпадает с доверительным интервалом для оценки мат. ожидания при надежности = 1 − .

3.3.2. Критерий согласия Пирсона

Критериями согласия называются критерии проверки статистических гипотез о виде распределения случайной величины. Проверяемая гипотеза имеет вид:

0 = { ~ Х( , 1, 2, . . . ),

где 1, 2, . . . - принятые в гипотезе параметры распределения. Пирсон предложил и обосновал следующий критерий проверки гипотезы 0 по

85

отношению к единственной альтернативной противоположной гипотезе

̄

 

 

 

 

 

1 = 0.

= { , = 1, } = {

,

, . . . } по-

Пусть по полученной выборке х

В

 

̅̅̅̅̅

1

2

 

 

строена гистограмма наблюдаемых частот

= { , ; = 1, } . По-

 

 

 

 

 

 

строим, так же теоретические частоты для интервалов при усло-

вии справедливости проверяемой гипотезы 0. Теоретические частоты

вычисляются через вероятность нахождения случайной величины в

 

 

 

 

 

 

 

 

 

 

 

 

 

интервале

= ( ,

) по формуле:

 

 

 

 

 

 

 

 

 

 

+1

 

 

 

 

 

 

 

 

 

Т

 

 

 

 

+1

 

 

 

 

 

 

Р = (

 

) − ( ) = ∫

( ,

) ≈ (

,

),

 

 

 

 

 

 

+1

 

Х

 

+0.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где ( ) - функция распределения для случайной величины , – шаг интервалов гистограммы, +0.5 = 0,5( + +1) центры интервалов ги-

стограммы. Таким образом, получим теоретические частоты ≈ .

 

 

 

 

 

 

Показано, что величина:

 

 

 

 

( − )2

 

 

 

 

 

= 2

,

 

 

 

 

 

 

− −1

 

 

=1

 

 

 

 

 

 

 

 

при достаточно большом объеме выборки имеет «хи-квадрат» распределение с − − 1 степенями свободы и может быть использована в качестве критерия для проверки гипотезы 0. Задаваясь уровнем значимостиможем однозначно определить правостороннюю критическую область критерия из уравнения

(2 > 2 ) = .

Его решение представляет собой правостороннюю квантиль «хи-квад-

рат» распределения 2 = 2 ( , − − 1) .

Рис. 3.3. Критическая область критерия Пирсона.

86

 

 

 

 

 

 

 

 

 

 

 

Определив, таким образом, критическую точку

2

kr , сравним ее с наблю-

 

 

 

 

 

 

 

 

 

 

даемым значением

 

2

получим правило проверки гипотезы:

 

nab

 

если

 

2

 

 

2

 

 

-

 

nab

 

 

 

kr , то гипотеза принимается

(отклонения теоретических и наблюдаемых частот незначительны),

 

если же

 

2

 

 

2

 

-

 

 

nab

 

 

kr , то гипотезу необходимо отвергнуть

(отклонения частот значительны).

Числовой пример: Проверим гипотезу о нормальном распределении полуденных температур месяца мая для выборки, приведенной в лекции

1, при уровне значимости гипотезы

= 0,05

. Вычислив выборочные ха-

 

рактеристики

х

В

=14,6

и

S = 7,5

, примем их за оценки параметров нор-

 

 

 

 

 

 

мального распределения. Таким образам проверяемая гипотеза такова:

 

 

= { = ( , ); = х̄; = }.

 

 

 

0

 

 

 

 

 

 

 

 

В

 

 

 

Учитывая, что для нормальной случайной величины Х функция

распределения имеет вид ( ) =

1

+

(

), где (x)

- функция Лапласа,

 

 

 

 

 

 

2

 

 

 

 

 

 

 

то для теоретических частот получим формулу:

 

 

 

 

 

 

 

− ̄

 

− ̄

 

 

 

 

= [ (

+1

 

) − (

 

 

 

)] ≈

 

( 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+2 ,

где

+1

 

 

 

 

– соответственно левая и правая границы каждого из интер-

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

валов разбиения данных в гистограмме. Все результаты приведем в таблице и на рис.3.4.

h j

n

j

 

nТj

2 nab

0-5

5-10

10-15

15-20

20-25

25-30

3

6

8

7

3

4

2,31

5,26

7,79

7,53

4,74

1,95

0,205

0,105

0.006

0,037

0,639

2,171

 

 

 

 

 

 

31

29,6

3,162

87

Рис. 3.4. Гистограмма наблюдаемых частот и кривая теоретических частот.

По заданному уровню значимости проверяемой гипотезы 0 определим критическую точку распределения «хи-квадрат» как правосторон-

нюю квантиль 2

= 2

(0,05; 6 − 2 − 1) = 7,8.

 

 

 

 

 

 

 

Поскольку 2

= 3,162 < 2

= 7,8 , то

гипотеза принимается

 

 

 

 

 

0

(нет оснований ее отвергнуть), т.к. отклонения частот незначительны.

3.3.3. Критерий однородности выборок

Часто приходится сравнивать две или несколько нормальных выборок на их идентичность (наблюдаемость в них одой и той же нормальной величины). Пусть имеются две выборки наблюдений за случайными величинами

X

1

 

=

N (m

,

)

1

1

 

,

X 2 = N (m2 , 2 )

это выборки объемов

n

, n

2

1

 

соответственно

xB1

={x

,

11

 

x

,...x

}

12

1n

 

 

1

 

,

xB2

={x

,

21

 

x

,...x

}

22

2n

 

 

2

 

. Для них вычислим средние

̄, ̄ и несмещенные дисперсии 2

, 2

. Для идентификации наблюдае-

1

2

1

2

 

мых выборок проверим две гипотезы о равенстве параметров наблюдаемых случайных величин.

А). 0 = { 12 = 22} гипотеза о равенстве дисперсий. Воспользуемся критерием

( 2, 2)

1 2

= ( 12, 22) = 1−1, 2−1

имеющим - распределение Фишера. Вычисляем ≥ 1 и критическое значение как правостороннюю квантиль распределения по

88

заданному уровню значимости . При соотношении ≥ гипотеза отвергается иначе принимается.

Рис.3.5 Односторонний критерий Фишера.

В). После проверки равенства дисперсий можно проверить гипотезу

о равенстве математических ожиданий (генеральных средних)

 

= { ̄ =

 

 

 

 

 

 

 

 

 

 

0

1

̄}. Воспользуемся критерием Стьюдента:

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

| ̄− ̄|

 

2

( − 1) + 2

( − 1) 1

 

 

1

 

=

1 2

=

где 2 =

1

1

2

2

(

 

+

 

 

).

 

 

 

 

 

 

 

 

 

 

1+ 2−2

12

 

1 + 2

− 2

 

1

 

2

 

12

 

 

 

 

Проверяем критерии Стьюдента обычным образом в соответствии с заданным уровнем значимости гипотезы .

После проверки обоих критерий на равенство генеральных, можем говорить о том, что наблюдаемые выборки идентичны, т.е. наблюдаемые нормальные величины совпадают.

Пример. Рассматривая температуры мая, разобьем наблюдения первой половины месяца и второй на две выборки и сравним их на однородность.

89

3

8

 

 

Х1

Х2

 

0

12

 

 

 

 

 

1

8

 

n=

16

15

 

0

12

 

ср=

11.25

18.8

 

7

14

 

Sкв=

63.66667

49.31429

 

8

16

 

 

 

 

 

 

 

 

 

 

12

19

 

 

 

 

 

14

23

 

Алфа=

0.05

 

Н0

16

19

 

 

 

 

 

19

23

 

Fнабл=S2max/S2min=

1.291039

S1=S2

 

 

 

 

 

 

Принима-

19

19

 

Fкрит=

 

2.463004

ется

27

25

 

 

 

 

 

16

27

 

tнабл=

-2.78891

 

m1=m2

19

27

 

tкрит=

2.045231

 

Отвергается

12

30

 

S12

2.707148

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из расчетов видно, что дисперсии в начале и в конце мая можно отождествить, а вот средние температуры значимо отличаются по уровню значимости = 0.5. В итого вывод таков нельзя наблюдать только первую или только вторую половину мая. Этот вывод может быть другим если бы мы рассмотрели Толька четные и только нечетные дни мая.

3.3.4. Критерий однофакторного дисперсионного анализа

Часто на измерения влияют факторы условий измерения, например точность прибора, погодные условия, опытность измерителя и пр. Эти факторы могут внести систематическую ошибку в измерения. Желательно определить влияние факторов и их значимость на измерения.

Рассмотрим измерения, полученные при различных уровнях (значения)

фактора. = 0 + + , здесь 0- истинное значение, - влияние j- уровня фактора на измерения, - ошибки измерений. В дисперсион-

ном факторном анализе для определения влияния фактора используются дисперсии приведенных величин. В силу независимости этих величин= 0 + + . На основе полученных измерений вычислим все оценки для дисперсий

Уровни рассматриваемого фактора а.

90

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]