Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АОЭД(лекции).doc
Скачиваний:
24
Добавлен:
13.09.2019
Размер:
1.37 Mб
Скачать

7.2Параметрические и непараметрические методы и критерии

В области биометрии широкое применение получила «нулевая гипотеза». Сущность ее – предположение о том, что разница между генеральными параметрами сравниваемых групп равна нулю, различие между выборочными характеристиками носит не систематический, а случайный характер. Если одна выборка извлечена из нормальной распределительной совокупности с параметрами μх и σх , а другая из совокупности с параметрами μу и σу, то нулевая гипотеза исходит из того, что μху, σху, или μху=0 и σху=0.

Противоположной нулевой гипотезе является альтернативная гипотеза, которая исходит из того, что μх-μу≠0 и σх-σу≠0.

Для проверки принятой гипотезы и достоверной оценки генеральных параметров по выборочным данным используют величины, функции распределения которых известны. Эти величины называют критериями достоверности.

Функции распределения указанных величин табулированы, т.е. сведены в специальную таблицу, где содержатся значения функций для разных чисел степеней свободы k, объема выборки n и уровней значимости α.

Уровень значимости, или вероятность ошибки, допускаемой при оценке принятой гипотезы может различаться. Обычно при проверке статистических гипотез принимают три уровня значимости: 5%, т.е. вероятность ошибочной оценки p=0.05, 1% - p=0.01 и 0.1% - p=0.001.

В биологических исследованиях считают достаточным 5% уровень значимости, при этом нулевую гипотезу не отвергают, если в результате исследований окажется, что вероятность ошибочной оценки превышает пять процентов, т.е. p>0.05. Если же p<0.05, то принятую гипотезу следует отвергнуть на принятом уровне значимости α. Ошибка при этом возможна лишь в пяти процентах случаев.

Трем вышеупомянутым уровням значимости отвечают (при нормальности распределения используемого критерия) нормированное отклонение t и пороги доверительной вероятности Р

α, %

t

Р=1- α

5

1,96

0.95

1

2,58

0,99

0.1

3,29

0,999

В области биометрии применяют два вида статистических критериев

  • параметрические, построенные на основе параметров данной совокупности (среднее арифметическое, дисперсионное)

  • непараметрические, - функции, зависящие непосредственно от вариант данной совокупности с их частотами.

Первые служат для проверки рабочих гипотез о параметрах совокупности, распределенных по нормальному закону.

Вторые – для проверки рабочих гипотез независимо от формы распределения совокупностей, из которых взяты сравниваемые выборки.

Из параметрических в биометрии обычно применяют t-критерий Стьюдента и F-критерий Фишера.

t используют для сравнительной оценки средних величин, F – для оценки дисперсий.

7.3Параметрические критерии

t-критерий Стьюдента. Английский математик Госсет (Стьюдент) в 1908 году нашел закон распределения величины, в которой генеральный параметр σ заменен на его выборочную характеристику Sх..

отношение разности между выборочной и генеральной средними к ошибке выборочной средней, непрерывно распределяется согласно следующей формуле:

где С – константа, зависящая от числа степеней свободы k=n-1.

Открытый Стьюдентом и теоретически обоснованный Фишером закон t-распределения служит основой теории малой выборки.

t-распределение зависит только от числа степеней свободы k=n-1 , причем с возрастанием n t-распределение быстро приближается к нормальному с параметрами μ=0 и σ=1 и уже при n≥30 не отличается от него.

Более наглядное представление о характере t-распределения дает следующий рисунок.

к ривая t-распределения 1 при n=3 на фоне нормальной кривой 2.

t-распределение симметрично и отражает специфику распределения среднего арифметического в случае малой выборки и в зависимости от ее объема n. Для выборок, объем которых превышает 30 единиц t-распределение распределяется по нормальному закону и не зависит от числа наблюдений. Если объем меньше 30, то характер t-критерия зависит от n.

F-критерий Фишера. Для проверки нулевой гипотезы о равенстве генеральных дисперсий (σ1222) нормально распределяющихся генеральных совокупностей t-критерий оказывается недостаточно точным, особенно при оценке разности дисперсий малочисленных выборок. Вместо выборочной разности S1-S2 удобней использовать разность между ln этих величин, т.е.

z=ln(s1)–ln(s2) , где S1>S2

эта разность обозначается z и распределяется нормально при наличии как больших, так и средних статистических совокупностей.

Снедекор предложил вместо логарифма отношений (разности) использовать отношение выборочных дисперсий Sx и обозначать этот показатель F.

при

т.к. принято брать отношение большей дисперсии к меньшей, то F-критерий больше единицы ( ).

Чем значительнее неравенство между выборочными дисперсиями, тем больше будет и величина F-критерия и наоборот.

Величина F имеет непрерывный функцию распределения и зависит от чисел степеней свободы:

Величина F полностью определяется выборочными дисперсиями и не зависит от генеральных параметров. Функция F-распределения табулирована для 5%-го и 1%-го уровня значимости и чисел степеней свободы k1 для большей дисперсии и k2 – для меньшей.

Если сравниваемые выборки извлечены из одной и той же генеральной совокупности или из разных совокупностей с равными дисперсиями ( ), то величина F-критерия не превышает критической точки (Fst). Для k1и k2 на принятом уровне значимости α эти величины будут отражать следующее:

если выборки взяты из разных генеральных совокупностей и , то и нулевая гипотеза отвергается.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]