Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Описательная статистика. Основные понятия биоме...doc
Скачиваний:
18
Добавлен:
12.09.2019
Размер:
659.46 Кб
Скачать

Статистика выводов

Существует несколько способов создания статистических выводов. Первый - построение доверительных интервалов.

И нтервальные оценки По известным выборочным характеристикам можно построить интервал, в котором с той или иной вероятностью, называемой доверительной, находится генеральный параметр. В качестве доверительных используют вероятности Р1 = 0,95; Р2 = 0,99; Р3 = 0,999. Выбор того или иного порога доверительной вероятности осуществляется исходя из практических соображений той ответственности, с какой делаются выводы о генеральных параметрах. С доверительной вероятностью тесно связан уровень значимости , под которым понимают разность = 1 – Р. Если известны генеральные параметры и нормального распределения, можно сказать, что около 95 % значений вариационного ряда попадают в интервал 2 стандартных отклонений от среднего. Этот интервал называется доверительным. Для уменьшения доверительного интервала необходимо увеличить размер выборки. Если генеральные параметры неизвестны, для построения доверительного интервала используют t-статистику и коэффициент Стьюдента. В этом случае генеральная средняя с выбранной вероятностью находится в интервале

t S + t S или = ± t S

Величины и S определяют по выборке, t (коэффициент Стьюдента) зависит обычно от одного из трех значений доверительной вероятности 0,95; 0,99; 0,999, принимая величины 1,96; 2,58; 3,29 или, в случае малой выборки, до n = 30 находится по таблицам.

Доверительный интервал для генеральной дис­персии нормально распределяющейся генеральной совокупности можно представить в виде Рн2 ≤ Рв и его строят с применением 2 (хи-квадрат)-критерия Пирсона. Критические (процентные) точки для этого критерия приведены в специальных таблицах. Они рассчитаны для разных уровней значимости и соответствующих порогов доверительной вероятности Р. При использовании критерия 2 для построения доверитель­ного интервала применяют двусторонний уровень значимости, т. е. = 2,5% (для Рн.) и для Рв = 100 — 2,5 = 97,5%. Границы 95%-ного доверительного интервала определяют по формулам:

Рн = Рв =

где Sx2 – выборочная дисперсия, n – объем выборки. Границы доверительного интервала для стандартного отклонения: Рн(СКО) = √ Рн ; Рв(СКО) = √ Рв.

Критерии достоверности оценок. Статистические гипотезы, их проверка

Второй способ создания статистических выводов – это проверка гипотез, основанная на теории изучаемого явления. Сначала формулируется гипотеза, затем собираются данные и выполняется проверка, включающая 4 основных элемента:

1. Формулировка нулевой гипотезы, чаще всего общепринятой 0); 2. Формулировка альтернативной гипотезы а); 3. Вычисление статистики теста; 4. Определение области непринятия гипотезы. Верхняя и нижняя границы области принятия гипотезы называются критическими значениями.

В области биометрии широкое применение получила так называемая нулевая гипотеза (Н0). Сущность ее сводится к предположению, что разница между генеральными параметра­ми сравниваемых групп равна нулю, а различия, наблюдае­мые между выборочными характеристиками, носят не систе­матический, а исключительно случайный характер. Так, если одна выборка извлечена из нормально распределяющейся сово­купности с параметрами х и х а другая — из совокупности с параметрами у и у, то нулевая гипотеза исходит из того, что х =у, и х =у, т. е. х - у = 0 и х - у =0 (отсюда и на­звание гипотезы — нулевая).

Противоположная нулевой — альтернативная гипотезаа) — исходит из предположения, что х - у ≠ 0 и х - у ≠ 0.

Для проверки принятой гипотезы используют критерии достоверно­сти, которые позволяют в каждом конкретном случае выявить, удовле­творяют ли выборочные показатели принятой гипотезе. Функции распределения этих критериев сведены в специальные таблицы, где содержатся значения функ­ции для разных чисел степеней свободы k или объема выборки n и уровней значимости .

Обычно при проверке статистических гипотез принимают три уровни значимости: 5%-ный (вероятность ошибочной оценки Р=0,05), 1%-ный (Р=0,01) и 0,1%-ный (Р=0,001). В биологических исследованиях часто считают достаточным 5%-ный уровень значимости. При этом нулевую гипотезу не отвергают, если в результате исследования окажется, что вероятность ошибочно­сти оценки относительно правильности принятой гипотезы пре­вышает 5%, т. е. Р>0,05. Если же Р < 0,05, то принятую гипо­тезу следует отвергнуть на взятом уровне (). Ошибка при этом возможна не более чем в 5% случаев, т. е, она маловероятна.

В биометрии применяют два вида статистических критериев: параметрические и непараметрические. Параметрические строятся на основании параметров данной совокупности (например, , sx2) и представля­ют функции этих параметров. Непараметрические пред­ставляют собой функции, зависящие непосредственно от ва­риант данной совокупности с их частотами. Параметрические служат для проверки гипотез о параметрах совокупностей, распределяемых по нормальному закону, непараметрические – для проверки рабочих гипотез независимо от формы распределения совокупностей.

При нормальном распределении признака параметрические критерии обладают большей безошибочностью и мощностью, чем непараметриче­ские критерии. В случае очень больших отличий в распределении признака от нормального вида применяют непараметрические критерии. В ситуациях, когда варьирующие признаки выража­ются не числами, а условными знаками, применение непараметрических критериев оказывается единственно возможным. Из параметрических критериев в биометрии чаще всего применяют t-критерий Стьюдента и F-критерий Фишера. Первый используют для сравнительной оценки средних величин, второй – для оценки дисперсий.

В биологии очень часто возникает необходимость сравнивать те или иные генеральные параметры изучаемых совокупностей, которые, как правило, остаются неизвестными. Невозможно сравнивать неизвестные показатели, но можно сравнить выборочные характеристики, которые являются оценками генеральных параметров. По разности между выборочными показателями, наблюдаемой между сравниваемыми выборками, учитывая статистические ошибки, судят о разнице между генеральными параметрами. Вопрос о достоверности выборочной разности с ее ошибкой решают исходя из той или иной гипотезы относительно параметров сравниваемых групп. Гипотеза выражается в терминах вероятности и может быть проверена по выборочным характеристикам.

Оценка разности средних. При сравнении друг с другом двух независимых выборок, взятых из нормально распреде­ляющихся совокупностей с параметрами 1 и 2, можно предположить, что 1 - 2 = D. Значения этих генеральных параметров неизвестны, однако можно найти величины выборочных средних и разность между ними ( 1 2) = d. Нулевая гипотеза сводится к предположению, что 1 = 2 и t-критерий вы­ражается в виде отношения разности выборочных средних к ошибке разности средних:

,

где для равновеликих выборок (n1 = n2) ,

для неравновеликих (n1 n2)

Н0 - гипотезу отвергают, если фактически установленная ве­личина t-критерия (обозначаемая символом tф.) превзойдет или окажется равной критическому (стандартному) значению tst этой величины для принятого уровня значимости и числа сте­пеней свободы k = n1 + n2 — 2, т. е при условии tф > tst. Если фактическое значение tф меньше табличного (k = n1 + n2 -2), то разность между средними не выходит за пределы случайных колебаний.