Лекция № 5
.pdfВ случае очень больших отличий распределений признака от нормального вида следует применять непараметрические критерии, которые в этой ситуации оказываются часто более мощными. В ситуациях, когда варьирующие признаки выражается не числами, а условными знаками,
применение непараметрических критериев оказывается единственно возможным.
Параметрические критерии
Из параметрических критериев в биометрии применяют t-критерий Стьюдента и F-критерий Фишера. Первый используют для сравнительной оценки средних величин, второй - для оценки дисперсий.
t-критерий Стьюдента
Использование формулы Гаусса-Лапласа для сравнительной оценки средних величин затруднено тем, что в качестве аргументов в эту формулу входят генеральные параметры и (которые, как правило, остаются неизвестными), тогда как при обработке и сравнении выборочных групп приходится пользоваться не генеральными, а выборочными характеристиками x и sx2. Учитывая это обстоятельство, английский математик В. Госсет (печатавшийся под псевдонимом Стьюдент), в 1908 г.
нашел закон распределения величины |
t |
x |
|
|
, в которой генеральный |
|
|
|
|
||||
n |
||||||
|
|
|
параметр заменен на его выборочную характеристику sх, т. е. нашел закон распределения значений:
t x |
|
s / n . |
(53) |
Оказалось, что отношение разности между выборочной и генеральной средними к ошибке выборочной средней непрерывно распределяется согласно следующей формуле:
|
t |
2 |
|
n 1 |
|
|
|
f (t) C( |
|
|
|
|
для t |
|
|
|
) 2 |
|
(54), |
||||
|
|
||||||
|
n 1 |
|
|
где С - константа, зависящая только от числа степеней свободы k=n-1.
Открытый Стьюдентом и теоретически обоснованный Р. Фишером
закон t-распределения служит основой так называемой теории малой выборки, которая характеризует распределение выборочных средних в нормально распределяющейся совокупности в зависимости от объема выборки. t-распределение зависит только от числа степеней свободы k=п-1,
причем с увеличением объема выборки п t-распределение быстро приближается к нормальному с параметрами =0 и =1 и уже при n 30 не отличается от него.
t-распределение симметрично и отражает специфику распределения средней арифметической в случае малой выборки в зависимости от ее объема
(п). Для выборок, объем которых превышает 30 единиц, величина t-
распределяется нормально и не зависит от числа наблюдений. Если же п<30,
характер t-распределения находится в зависимости от числа наблюдений п.
Для практического использования t-распределения составлена специальная таблица, в которой содержатся критические точки (tst) для разных уровней значимости а и чисел степеней свободы k.
Оценка разности средних. Сравнивая друг с другом две независимые выборки, взятые из нормально распределяющихся совокупностей с параметрами 1 и 2, можно предположить, что 1 - 2 = D, а дисперсия этой разности 2D. Значения генеральных параметров неизвестны, однако несложно найти величины выборочных средних и разность между ними
(x1 x2 ) d . Нулевая гипотеза сводится к предположению, что 1= 2.
Критерием для проверки Н0-гипотезы служит отношение
t |
(x1 x2 ) ( 1 2 ) |
|
(55), |
|
sx1 x2 |
||||
|
|
|||
где t - переменная величина, следующая t-распределению Стьюдента с |
||||
числом степеней свободы k=(п1-1)+(п2-1)=п1+п2–2, а sx1 x2 |
- ошибка |
|||
указанной разности, обозначаемая в дальнейшем символом sd. |
|
Так как, согласно Н0-гипотезе, 1 - 2 = 0, то t-критерий выражается в виде отношения разности выборочных средних к своей ошибке, т. е.
t |
x1 x2 |
|
d |
|
sd |
(56). |
|||
|
|
sd |
H0-гипотезу отвергают, если фактически установленная величина t-
критерия (обозначаемая символом tф) превзойдет или окажется равной критическому (стандартному) значению tst этой величины для принятого уровня значимости и числа степеней свободы k=n1+n2 - 2, т. е. при условии tф tst.
Ошибку разности средних sd. определяют по следующим формулам:
а) для равночисленных выборок, т. е. при п1=п2:
|
|
|
|
|
|
|
(x x )2 |
|
(x x )2 |
(x x )2 |
(x x )2 |
|
s s2 |
|
s2 |
|
|
||||||||
x |
x |
i 1 |
|
i 2 |
|
i 1 |
i 2 |
|||||
d |
|
|
|
n(n 1) |
|
n(n 1) |
|
n(n 1) |
||||
|
|
1 |
|
|
2 |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
б) для неравночисленных выборок, т. е. при п1 п2:
s |
|
(n 1)s2 |
(n 1)s2 |
2 |
|
|
n n |
|
|
(x x )2 |
(x x )2 |
|
|
n n |
||||||||
1 |
1 |
2 |
( |
1 2 |
) |
|
i 1 |
i 2 |
( |
1 |
2 |
|
) |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
d |
|
|
n |
|
|
|
|
n1n2 |
|
|
|
n1 n2 2 |
|
|
|
n1n2 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
В этой формуле вместо |
( |
n1 n2 |
) |
можно использовать ( |
|
1 |
|
1 |
) . |
|||||||||||||
n1n2 |
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n1 |
n2 |
(57);
(58)
Неопровержение Hо-гипотезы нельзя рассматривать как доказательство равенства между неизвестными параметрами совокупностей, из которых извлечены сравниваемые выборки. В таких случаях вопрос о преимуществе одной статистической совокупности перед другой остается открытым. Ведь не исключено, что при повторных испытаниях Hо-гипотеза может оказаться несостоятельной. Более того, и в тех случаях, когда Hо-гипотеза опровергается, не следует спешить с окончательным выводом.
Следует заметить, что вышеизложенное применение t-критерия предполагает, что дисперсии сравниваемых групп одинаковы: 21= 22. Если это не так, то величину критерия находят по формуле:
t |
|
|
|
x1 x2 |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
||
|
|
/ n s |
|
|
|
|||
s2 |
2 |
/ n |
||||||
|
|
|||||||
1 |
1 |
2 |
2 |
а число степеней свободы — по следующим формулам:
|
при n1=n2 |
k n 1 |
|
|
|
2n 2 |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
||||||||
|
s2 |
/ s2 |
s2 |
/ s2 |
|
|
|
||||||||||
|
|
|
|
|
|
|
1 |
|
2 |
2 |
1 |
|
|
|
|
||
|
2 |
2 |
2 |
|
2 |
|
|
2 |
|
2 |
/ n2 ) |
2 |
|
|
|||
при n1 n2 |
k |
s1 |
|
s2 |
|
/ |
(s1 / n1 ) |
|
|
(s2 |
|
|
2 |
||||
|
|
n1 1 |
|
|
n2 1 |
|
|||||||||||
|
n1 |
|
n2 |
|
|
|
|
|
|
|
(59),
(60),
(61).
Правильное применение t-критерия предполагает нормальное распределение совокупностей, из которых извлечены сравниваемые выборки,
и равенство генеральных дисперсий. Если эти условия не выполняются, то t-
критерий применять не следует. В таких случаях более эффективными будут непараметрические критерии.
Оценка средней разности между выборками с попарно связанными
вариантами. Сравниваемые выборки нередко представляют собой ряды попарно связанных вариант, т. е. являются зависимыми выборками. В таких случаях оценкой разности между генеральными средствами 1- 2 =D будет
средняя разность, определяемая из суммы разностей между попарно связанными вариантами сравниваемых групп, т. е.
d di n
Оценкой генеральной дисперсии 2 разности средних 1- 2
выборочная дисперсия:
s2 (di d )2 n 1
В формулах (63) и (64) n - число парных наблюдений;
величина d идентична разности средних, т. е.
d di (x1 x2 ) n
(62)
=D будет
(63). di=xi – yi;
(64)
Ошибку средней разности d , обозначаемую символом sd, определяют по формулам:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
( di )2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
(di d ) |
2 |
|
|
|
|
di |
|
|
|
||||||||||
sd |
|
|
n |
(65) |
||||||||||||||||
n(n 1) |
|
|
|
|
|
n(n |
1) |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
d 2 |
|
|
|
|
|
|
|||||
|
|
|
1 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
d 2 |
|
|
||||||||||||
или sd |
|
|
|
|
|
|
|
i |
|
(66). |
||||||||||
n 1 |
n |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Если члены генеральной совокупности распределяются нормально, то и разности между ними будут распределяться нормально и случайная величина t=( d -D)/ sd будет иметь распределение Стьюдента с k=п—1 степенями свободы. H0-гипотеза сводится к предположению, что 1 - 2 = D =0. Отсюда t-критерий выразится в виде отношения средней разности к своей ошибке, т.
е.
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
t |
d |
/ s |
|
|
|
(67). |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
d |
|
||||
|
|
|
Если tф tst |
для принятого уровня значимости и числа степеней |
||||||||
свободы k=п—1, то нулевая гипотеза должна быть отвергнута. |
|
|||||||||||
|
|
|
Оценку средней разности можно произвести по доверительному |
|||||||||
|
|
|
|
|
||||||||
интервалу, |
построенному на основании полученной разности d |
и ее ошибки |
||||||||||
s |
|
|
. Если |
нижняя |
граница доверительного интервала |
окажется с |
||||||
d |
||||||||||||
|
|
|
|
|
|
|
|
|
|
положительным знаком, это будет свидетельствовать о достоверности разницы. Если же нижняя граница доверительного интервала будет с отрицательным знаком, это будет служить указанием на случайный характер наблюдаемой средней разности.
F-критерий Фишера
Для проверки H0-гипотезы о равенстве генеральных дисперсий
( 21= 22) нормально распределяющихся генеральных совокупностей t-
критерий оказывается недостаточно точным, особенно при оценке разности дисперсий малочисленных выборок. В поисках лучшего критерия Р. Фишер
нашел, что вместо выборочной разности s1–s2 удобнее использовать разность между натуральными логарифмами этих величин, т. е. lns1 - lns2, где s1 s2.
Эта разность, обозначенная Фишером буквой z, распределяется нормально при наличии как больших, так и средних по объему статистических совокупностей.
При определении величины z можно вместо натуральных использовать десятичные логарифмы, так как z=2,3026 (lgs1 - lgs2) или z=2,3026 lg(s1/ s2), а
также z=1,1513 lg(s21/s22), где s21 s22. Д. Снедекор предложил вместо логарифма отношений использовать отношения выборочных дисперсий,
обозначив этот показатель в честь Фишера буквой F, т. е. |
|
F= s21/s22 |
(68) |
при s21 s22.
Так как принято брать отношение большей дисперсии к меньшей, то критерий F>1. Если s21=s22, то F=1. Чем значительнее неравенство между выборочными дисперсиями, тем больше будет и величина F, и, наоборот, чем меньше окажется разница между дисперсиями, тем меньше будет величина
F.
Рис. 36. График плотности вероятности F-распределения для типичных значений степени свободы k1 и k2 и критические границы F1 и F2 (по Н. В.
Смирнову и Дунину-Барковскому, 1965).
Величина F имеет непрерывную функцию распределения и зависит только от чисел степеней свободы k1=п1—1 и k2=n2—1. F полностью
определяется выборочными дисперсиями и не зависит от генеральных параметров, так как предполагают, что сравниваемые выборки,
характеризуемые дисперсиями s21 и s22, взяты из генеральных совокупностей с 21= 22 или из одной и той же генеральной совокупности. Функция распределения возможных значений величины F при небольшом п имеет форму асимметричной кривой, которая по мере увеличения числа испытаний
(п ) приближается к кривой нормального распределения (рис. 36).
Функция F-распределения табулирована для 5 %-го (Р=0,05) и 1 %-го
(Р=0,01) уровней значимости и чисел степеней свободы k1 для большей дисперсии и k2 для меньшей. Если сравниваемые выборки извлечены из одной и той же генеральной совокупности или из разных совокупностей с дисперсиями 21= 22, равными друг другу, то величина F-критерия не превысит критические точки (Fst). Если же выборки взяты из разных совокупностей с их параметрами 21 и 22, не равными друг другу, то Fф Fst
и нулевая гипотеза должна быть отвергнута.
Непараметрические критерии
Правильное применение параметрических критериев для проверки статистических гипотез основано на предположении о нормальном распределении совокупностей, из которых взяты сравниваемые выборки.
Однако это не всегда имеет место, так как не все биологические признаки распределяются нормально. Немаловажным является и то обстоятельство,
что исследователю приходится иметь дело не только с количественными, но и с качественными признаками, многие из которых выражаются порядковыми номерами, индексами и другими условными знаками. В таких случаях необходимо использовать непараметрические критерии.
Для сравнения двух независимых выборок можно рекомендовать W-
критерий Уилкоксона (в качестве нулевой принимается гипотеза о совпадении средних (медианных) значений двух выборок). Более строгие критерии Вальда-Вольфовица и Ван дер Вардена проверяют гипотезы о
совпадении распределений значений в двух выборках. Однако доказано, что критерий Вальда-Вольфовица обладает сравнительно малой чувствительностью.
Ниже рассмотрены некоторые непараметрические критерии,
применяемые для проверки нулевой гипотезы при сравнении как независимых, так и зависимых выборочных групп.
X-критерий Ван-дер-Вардена
Этот критерий относится к группе ранговых критериев, его применяют для проверки нулевой гипотезы при сравнении друг с другом независимых выборок. Техника расчетов X-критерия сводится к следующему.
1.Сравниваемые выборки ранжируют в один общий ряд по возрастающим значениям признака.
2.Затем каждому члену ряда присваивают порядковый номер,
отмечающий его место в общем ранжированном строю.
3. Далее по порядковым номерам одной из выборок, обычно меньшей по объему, находят отношение
R/(N+1) |
(69), |
где N+1=n1+n2+1, т. е. сумма всех членов сравниваемых групп,
увеличенная на единицу, R—порядковый номер членов ряда, их «ранг».
4.С помощью специальной таблицы находят значения функции[R/(N+1)] для каждого значения R/(N+1).
5.Суммируя результаты (обязательно с учетом знаков!), получают величину Хф= [R/(N+1)], которую сравнивают с критической точкой этого критерия Хst для принятого уровня значимости и общего числа членов сравниваемых выборок, т. е, N=n1+n2.
6.Нулевая гипотеза сводится к предположению, что сравниваемые выборки извлечены из генеральных совокупностей с одинаковыми функциями распределения. Если окажется, что Хф>Хst, нулевая гипотеза должна быть отвергнута на принятом уровне значимости.
Критерий знаков z
Втех случаях, когда результаты наблюдений выражаются не числами,
азнаками плюс (+) и минус (-), различия между попарно связанными членами сравниваемых выборок оценивают с помощью критерия знаков z.
Конструкция этого критерия базируется на весьма простых соображениях:
если попарно сравниваемые значения двух зависимых выборок существенно не отличаются друг от друга, то число плюсовых и минусовых разностей окажется совершенно одинаковым; если же заметно преобладают плюсы или минусы, это будет указывать на положительное или отрицательное действие изучаемого фактора на результативный признак. Большее число однозначных разностей служит в качестве фактически найденной величины z-критерия знаков. При этом нулевые разности, т. е. случаи, не давшие ни положительного, ни отрицательного результата, обозначаемые цифрой 0, в
расчет не принимают и число парных наблюдений соответственно уменьшается.
Как и всякий другой выборочный показатель, z-критерий знаков является величиной случайной; он служит для проверки H0-гипотезы, т. е.
предположения о том, что совокупность или совокупности, из которых взяты сравниваемые выборки, имеют одну и ту же или одинаковые функции распределения. H0-гипотеза отвергается, если zф>zst для принятого уровня значимости и числа парных наблюдений п, взятых без нулевых разностей.