10852
.pdfУчитывая сказанное, при построении критерия проверки статистической гипотезы необходимо сначала задаться допустимым уровнем риска на совершение ошибки I рода, как наиболее значимой, а затем минимизировать ошибки II рода.
3. Построение критерия проверки гипотезы
Пусть необходимо проверить простую гипотезу Н0 = {X ↔ f X (x, θ)} , состоящую в предположении о виде функции плотности распределения случайной величины Х с вполне определенными параметрами q . Построим критерий, однозначно принимающий или отвергающий проверяемую гипотезу по
полученной в |
наблюдении за случайной величиной |
Х выборке |
хВ = {x1 , x2 ,...xn } |
объема n. Помимо основной гипотезы Н0 |
(“ нулевой”) рас- |
смотрим еще одну или несколько альтернативных гипотез |
Н1 , H 2 , H 3 ,..., H m |
каждая из которых противоречит основной. Альтернативные гипотезы необходимы при построении критерия проверки основной гипотезы для ее сравнения с имеющимися альтернативами (все познается в сравнении с чем-то).
Критерий проверки гипотезы состоит из двух составляющих:
Во-первых, в качестве критерия принимается некоторая случайная величина К , с известным распределением при условии справедливости основной
f K (k / H 0 ) |
и хотя |
бы частично |
известным для |
альтернативных гипотез |
f K (k / H j ) |
j=1, ..m. |
Кроме того значения критерия |
должны быть вычисляемы |
|
по наблюдаемой выборке хВ , т.е. |
knab = k (xi ) . |
|
Во-вторых, строится решающее правило для критерия проверки, согласно которому гипотеза будет приниматься или отвергаться. Для этого, назовем
критической областью критерия |
те значения величины К , при которых гипо- |
|||
теза отвергается. Критическую |
область будем обозначать Кkr . Тогда решаю- |
|||
щее правило критерия проверки будет следующим: |
||||
knab Кkr |
Н0 |
отвергается |
(по наблюдаемой выборке), |
|
knab Кkr |
Н0 |
принимается |
(нет оснований отвергать гипотезу). |
Точки значения критерия К , где критическая область критерия проверки Кkr отделяется от области принятия гипотезы, называются критическими точками критерия kkr . Как построить критическую область критерия или, что равно-
сильно, как найти критические точки критерия? Ниже рассмотрим ответ на этот вопрос.
Зададимся вероятностью α ошибки I-го рода, как наиболее значимой. Исключить такую ошибку при проверке гипотезы невозможно ( a ¹ 0 ), но в вероятностных задачах это не является трагедией. На практике обычно эту ве-
80
роятность задают достаточно малой величиной α = 0,05 ; α = 0,025 ; α = 0,005 и называют уровнем значимости критерия.
Если из условия
P(k K kr ) = ∫ f K (k / H 0 )dx = α
Kkr
можно определить критические точки kkr однозначно, то задача построения
критической области критерия решена. В противном случае, когда еще остается свобода выбора критических точек, рассмотрим влияние альтернативных гипотез. Поскольку величина:
∫ f K(k / H j )dx = 1 − β j есть вероятность правильного отбрасывания H 0 при
Kkr
условии справедливости H j , то ее называют мощностью критерия по отноше-
нию к альтернативной гипотезе H j . Поэтому при заданном уровне значимости
α , критическую область критерия нужно строить так, чтобы мощность критерия была максимальной, а именно:
(1− β j ) max , для наиболее мощного критерия (НМК) относительно гипотезы H j , максимизация проводится по параметрам сложной гипотезы;
min (1− β j ) max , для равномерно наиболее мощного критерия (РНМК), в случае наличия нескольких сложных гипотез.
Величина β j - есть вероятность принять неверную гипотезу H 0 при условии справедливости альтернативной гипотезы H j .
Рис. 13.1. Двухсторонняя критическая область критерия
Кkr = {k > k2 , k < k1} при наличии двух альтернативных гипотез H1 , Н2 . 81
На рис. 13.1 приведена графическая интерпретация алгоритма построения критической области одномерного критерия. Видим, что структура критической области, зависит от наличия альтернативных гипотез и их “ расположения” относительно основной.
Лекция № 14
Примеры построения критериев проверки гипотез
1. Проверка гипотез о значении параметров распределения
Пусть случайная величина |
|
Х распределена нормально по закону |
N (a, σ) |
|||||||||||||||||||
с |
неизвестными |
|
|
параметрами |
a, σ и |
наблюдается в |
выборке |
|||||||||||||||
хВ = {xi , n} = {x1 , x2 ,...xn } |
|
объема |
n. Нормальный закон распределения |
|||||||||||||||||||
N (a, σ) задается |
следующей функцией плотности распределения вероятно- |
|||||||||||||||||||||
сти: |
f X (x, a, σ) = |
|
1 |
|
|
exp(− |
(х − а)2 |
) , |
M [ X ] = a , |
D[ X ] = σ2 . |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
σ |
|
2π |
|
|
|
|
|
2σ2 |
|
|
|
|
|
|||
|
По данным выборки могут быть получены выборочное среднее |
|
В и вы- |
|||||||||||||||||||
|
х |
|||||||||||||||||||||
борочный стандарт S : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
1 |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
1 |
|
n |
|
|
|
|
|
|||||
|
|
|
В = |
∑ x j , |
|
|
S = |
|
∑( X ср − x j )2 . |
|
|
|
||||||||||
|
х |
|
|
|
|
|
||||||||||||||||
|
|
n |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
j=1 |
|
|
|
|
|
|
n − 1 j =1 |
|
|
|
|
|
Эти величины являются случайными и по ним могут быть построены оценки математического ожидания а = М[x] и дисперсии σ = D[x] наблюдаемой в выборке случайной величины Х.
Ниже проверим ряд простых статистических гипотез об истинных значениях параметров нормальной случайной величины Х .
1.1. H 0 = {a = a0 } . Проверим сначала гипотезу о равенстве значения истинного (гипотетического) математического ожидания а некоторой величине a0 . Основная гипотеза тем самым будет следующей H 0 = {a = a0 } . В
качестве критерия K возьмем случайную величину имеющую, при справедливости основной гипотезы, распределение Стьюдента с n-1 степенями свободы:
K = xB − a0 = tn−1 S / n
Задаваясь уровнем значимости α для проверяемой гипотезы H 0 , будем строить критическую область K kr в зависимости от вида единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях:
82
Случай А: H1 = {a > a0 } . В этом случае, при справедливости конкури-
рующей гипотезы ожидаем сдвиг вероятных значений критерия K в большую сторону (рис.14.1), поэтому критическая область критерия будет правосторон-
ней K kr = {k > kkr }. Критическая точка kkr |
однозначно определяется из усло- |
вия равенства вероятности ошибки I-рода |
заданному уровню значимости |
P(k > kkr ) = a . Решение этого уравнения |
kkr = tkr (a; n -1) представляет со- |
бой правостороннюю квантиль распределения случайной величины Стьюдента и приводится таблицей в приложении 3.
Рис. 14.1 Критические области гипотезы H 0 = {a = a0 } .
Случай Б: H1 = {a < a0 }. В этом случае, критическая область критерия будет левосторонней K kr = {k < kkr } , а значения критерия отрицательными (рис.14.1). Критическая точка kkr определяется из уравнения P(k < kkr ) = a ,
решение которого, в силу симметрии распределения Стьюдента, |
будет следу- |
|||||
ющим kkr = -tkr (a; n -1) . |
|
|
|
|
||
|
Случай В: H1 = {a ¹ a0 } . В этом случае критическая область критерия |
|||||
будет двухсторонней |
K kr |
= {k < kkr1 ; k > kkr 2 } . Однако, |
здесь критические |
|||
точки |
kkr1 , kkr 2 |
не |
определяются |
однозначно |
из |
уравнения |
P(k < kkr1 ) + P(k > kkr 2 ) = a . Доказано [9], что при условии P(k < kkr1 ) = a / 2 и P(k > kkr 2 ) = a / 2 мощность критерия (1 - b) по отношению к конкурирую-
83
щей гипотезе Н1 будет максимальной. Тогда из этих уравнений критические точки находятся однозначно и представляют собой двухстороннюю квантиль распределения случайной величины Стьюдента:
kkr1 = −tkr (α / 2; n −1) , kkr 2 = tkr (α / 2; n −1) .
Рассмотрим числовой пример: Пусть по выборке объема n=16 получена оценка математического ожидания наблюдаемой нормальной случайной вели-
чины хВ = 10,2 и оценка среднеквадратического отклонения S = 6,5 . Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинное математиче-
ское ожидание наблюдаемой величины равна 15 т.е. |
H 0 |
= {a =15}. Зада- |
||||||||
димся уровнем значимости гипотезы |
|
α = 0,05 и альтернативной гипотезой |
||||||||
H1 |
= {a ¹ 15}. |
|
Наблюдаемое |
в |
выборке |
значение |
критерия |
|||
knab |
( |
) |
× 4 / 6,5 = -2,954 . |
Критическая область |
K |
kr |
двухсторонняя, а |
|||
= 10,2 - 15 |
|
|
критические точки будут:
kkr1 = −tkr (0,025;15) = −2,13 ; kkr 2 = +tkr (0,025;15) = +2,13 .
Видим, что knab принадлежит критической области и значит, гипотеза отвер-
гается, т.е. отличие наблюдаемого значения математического ожидания от гипотетического значительны.
1.2. H 0 = {σ2 = σ02 } Проверим теперь гипотезу о том, что истинная (гипотетическая) дисперсия случайной величины равна s02 . Проверяемая гипотеза H0 = {σ2 = σ02} В качестве критерия возьмем одномерную случайную величину K , имеющую распределение «хи-квадрат» с n-1 степенями свободы:
K = |
|
S 2 |
(n − 1) = χ n2−1 . |
|
σ 2 |
||
|
0 |
|
|
Здесь S 2 |
оценка s02 , полученная по выборке хВ = {xi , i =1, n}. |
Задаваясь уровнем значимости α для проверяемой гипотезы H 0 , будем стро-
ить критическую область K kr в зависимости от вида единственной конкурирующей (альтернативной) гипотезы H1 в следующих случаях (рис.14.2):
Случай А: H1 = {σ2 > σ02 } . В этом случае, при справедливости конкури-
рующей гипотезы ожидаем сдвиг наиболее вероятных значений критерия K в большую сторону, поэтому критическая область будет правосторонней.
84
Рис. 14.2 Критические области гипотезы H 0 = {σ2 = σ02 }.
Критическая точка kkr здесь однозначно определяется согласно общему под-
ходу к построению критических областей критерия из условия равенства вероятности ошибки I-рода заданному уровню значимости α :
P(k > kkr ) = |
∞ |
α . |
∫ χ2 (k; n − 1)dk = |
||
|
kkr |
|
Решение этого уравнения |
kkr = χkr2 (α; n −1) находятся однозначно, и |
представляет собой правостороннюю квантиль «хи-квадрат» распределения случайной величины и приводится в приложении 4.
Случай Б: H1 = {σ2 < σ02 } . В этом случае критическая область критерия
будет левосторонней, а критическая точка однозначно определяется из уравнения :
kkr |
|
P(k < kkr ) = ∫ χ2 (k; n − 1)dk = |
α |
0 |
|
Левосторонняя критическая точка может быть легко выражена через |
|
функцию для правосторонней |
критической точки. Действительно, т.к. |
P(k < k kr ) + P(k > k kr ) = 1 , то P(k > kkr ) = 1 − α и тогда решение для левосторонней точки будет следующим kkr = χ2kr (1 − α; n −1) .
85
|
Случай В: |
H1 = {s2 ¹ s02}. |
В этом случае, объединяющем два предыду- |
|||
щих |
случая, |
критическая |
область критерия |
будет |
двухсторонней |
|
Kkr |
= {k < kkr1; k > kkr 2} . Однако, |
здесь критические точки kkr1 , |
kkr 2 не опре- |
|||
деляется однозначно из уравнения |
|
|
|
|||
|
|
|
kkr 2 |
|
|
|
|
P(k < kkr1 ) + P(k > kkr 2 ) = 1 − ∫ χ 2 (k, n − 1)dk = α . |
|
|
|
||
|
|
|
kkr 1 |
|
|
|
Доказано [9], что при условиях |
P(k < kkr1 ) = α / 2, |
P(k > kkr 2 ) = α / 2 |
мощ- |
|||
ность критерия |
(1 − β) по отношению к конкурирующей гипотезе H 1 |
будет |
максимальной, тогда из этих двух условий критические точки находятся однозначно:
kkr1 = χ2kr (1 − α / 2; n −1) ; kkr 2 = χ2kr (α / 2; n −1) .
Рассмотрим числовой пример: Пусть по выборке объема n=15 получена оценка дисперсии наблюдаемой нормальной случайной величины S 2 = 40,25 или оценка среднеквадратического отклоненияS = 6,5 . Поскольку, каждая оценка есть величина случайная (получена по конкретной случайной выборке), то проверим гипотезу о том, что истинная дисперсия наблюдаемой величины
равна 36, т.е. |
H 0 = {σ2 = 36} . Зададимся уровнем значимости гипотезы |
H0 |
||
α = 0,05 и альтернативной гипотезой H1 = {s2 |
¹ 36} . |
|
||
Наблюдаемое значение критерия |
knab |
= (15 −1)40,25 / 36 = 15,653 . Крити- |
||
ческая область |
K kr = {k < k1kr ; k > k 2 kr } |
двухсторонняя, а критические точки |
||
будут: |
|
|
|
|
kkr1 = χkr2 (1 − 0,025;14) = 5,63; kkr 2 = χkr2 (0,025;14) = 26,1. |
|
|||
Видим, что knab |
= 15,653 не принадлежит критической области и значит, |
ги- |
потеза принимается, т.е. отличия наблюдаемого значения дисперсии от гипотетического незначительны. Если бы, такая оценка дисперсии была получена по выборке меньшего объема n=7, то
kkr1 = χ2kr (1 − 0,025;6) = 14,4; kkr 2 = χ2kr (0,025;6) = 1,24.
тогда наблюдаемое значение критерия knab = 15,653 попадает в критическую область и тогда проверяемая гипотеза отвергается.
Отметим, что при проверке гипотез H 0 = {a = хВ } и H 0 = {s2 = S 2 } при уровне значимости α будут построены двухсторонние критические области такими, что область принятия гипотез Kkr совпадет с доверительными интервалами, построенными с надежностью γ = 1 − α .
86
2. Критерий согласия Пирсона
Критериями согласия называются критерии проверки статистических гипотез о виде распределения случайной величины. Проверяемая гипотеза имеет вид:
H0 = {X ~ f Х (x, θ1, θ2 ,...θr ) ,
где θ1 , θ2 ,...θr - принятые в гипотезе параметры распределения. Пирсон предложил и обосновал следующий критерий проверки гипотезы H 0 по отношению к единственной альтернативной противоположной гипотезе
H1 = |
|
|
|
0 . |
|
|
|
|
|
|
|
|
|
|
H |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
Пусть по полученной выборке |
хВ = {xi , i = 1, n} = {x1 , x2 ,...xn } |
постро- |
||||||||
ена гистограмма наблюдаемых |
частот H Xn = {hj , n j ; j = 1, m}. Построим, |
|||||||||||||
так же теоретические частоты nTj |
для интервалов h j при условии справед- |
|||||||||||||
ливости проверяемой гипотезы |
H 0 . Теоретические частоты вычисляются |
|||||||||||||
через вероятность Pj |
нахождения случайной величины X в интервале |
|||||||||||||
hj = (x j , x j +1 ) |
по формуле: |
|
|
|
|
|
||||||||
|
Т |
|
|
|
|
|
|
x j +1 |
|
|
|
|
|
|
|
n j |
|
» Рj = F (x j +1 ) - F (x j ) = ∫ f Х (x, qs )dx » hf (x j +0.5 , qs ) , |
|
|
|||||||||
|
n |
|
|
|
||||||||||
|
|
|
|
|
|
|
x j |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где F (x j ) |
- функция распределения для случайной величины X , |
h – |
шаг |
|||||||||||
интервалов гистограммы, x j +0.5 = 0,5×(x j + x j +1 ) |
центры интервалов h j |
ги- |
||||||||||||
стограммы. |
Таким |
образом, |
получим |
теоретические |
частоты |
|||||||||
nTj |
» n × Pj . |
Показано [9], что величина : |
|
|
|
|||||||||
|
m |
(n j − nTj |
) 2 |
|
|
|
|
|
|
|
|
|||
∑ |
|
|
|
|
|
= χm2 −r −1 , |
|
|
|
|
|
|
||
|
|
T |
|
|
|
|
|
|
|
|
||||
|
j =1 |
|
|
n j |
|
|
|
|
|
|
|
|
|
при достаточно большом объеме выборки имеет «хи-квадрат» распределение с m − r −1 степенями свободы и может быть использована в качестве критерия для проверки гипотезы H 0 . Задаваясь уровнем значимости α
можем однозначно определить правостороннюю критическую область критерия из уравнения
P(χ2 > χ2kr ) = α
Его решение представляет собой правостороннюю квантиль «хи-квадрат» распределения χ2kr = χ2kr (α, m − r − 1) и приведено в приложении 4.
87
Рис. 14.3. Критическая область критерия Пирсона.
Определив, таким образом, критическую точку χ2kr , сравним ее с наблюдаемым значением χ2nab получим правило проверки гипотезы:
- если χ2nab < χ2kr , то гипотеза принимается
(отклонения теоретических и наблюдаемых частот незначительны),
- если же χ2nab > χ2kr , то гипотезу необходимо отвергнуть (отклонения частот значительны).
Числовой пример: Проверим гипотезу о нормальном распределении полуденных температур месяца мая для выборки, приведенной в лекции
10, при уровне значимости гипотезы α = 0,05 . Вычислив выборочные ха-
рактеристики хВ = 14,6 и S = 7,5 , примем их за оценки параметров нормального распределения. Таким образам проверяемая гипотеза такова:
H0 = {X = N (a, σ); а = хВ ; σ = S}.
Учитывая, что для нормальной случайной величины Х функция
распределения имеет вид F (x) = |
1 |
+ Ф( |
х − а |
) , где Ф(x) |
- функция Лапласа |
|
|
||||
2 |
|
σ |
|
(приложение 2), то для теоретических частот получим формулу:
|
x |
|
|
- |
|
|
|
x |
|
- |
|
|
|
||
|
j +1 |
x |
B |
j |
x |
B |
|||||||||
Т |
|
|
|
|
|
|
|
|
|
|
|||||
n j |
|
|
|
|
|
|
|
|
|
|
|
||||
» n ×[Ф |
|
S |
|
|
- Ф |
|
S |
|
] , |
||||||
|
|
|
|
|
|
|
|
|
|||||||
где |
x j , x j +1 |
– |
соответственно левая и правая границы каждого из интер- |
валов h j разбиения данных в гистограмме. Все результаты приведем в таблице 8 и на рис.14.4.
Таблица 8.
88
h j |
0-5 |
5-10 |
10-15 |
15-20 |
20-25 |
25-30 |
∑ |
n j |
3 |
6 |
8 |
7 |
3 |
4 |
31 |
|
|
|
|
|
|
|
|
nТj |
2,31 |
5,26 |
7,79 |
7,53 |
4,74 |
1,95 |
29,6 |
|
|
|
|
|
|
|
|
χnab2 |
0,205 |
0,105 |
0.006 |
0,037 |
0,639 |
2,171 |
3,162 |
|
|
|
|
|
|
|
|
Рис.
14.4. Гистограмма наблюдаемых частот и кривая теоретических частот.
По заданному уровню значимости проверяемой гипотезы H 0 определим критическую точку распределения «хи-квадрат» используя приложе-
ние 4. Получим, |
что |
χkr2 = χkr2 (0,05;6 − 2 −1) = 7,8 . |
Поскольку |
χnab2 |
= 3,162 < χkr2 = 7,8 , то гипотеза H 0 принимается (нет |
оснований ее отвергнуть), т.к. отклонения частот незначительны.
Примеры заданий для проверки различных статистических гипотез для самостоятельной работы студентов приводятся в [12].
89