Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
t6.doc
Скачиваний:
12
Добавлен:
15.11.2019
Размер:
1.95 Mб
Скачать

ТЕМА 6

Статистические гипотезы и их проверка

  1. статистике, как и в жизни, важные утверждения редко удается доказать окончательно и неоспоримо. Можно только выдвинуть утверждение, справедливое с некоторой степенью достоверности. Такое

утверждение называют статистической гипотезой .

Наиболее частыми задачами медицинских и биологических исследований, для решения которых оказывается необходимым сформулировать статистические гипотезы, являются следующие:

  1. анализ соответствия распределения значений признака в изучаемой группе какому-либо определенному закону (например, анализ соответствия нормальному закону)

  2. сравнение групп по параметрам распределений признака (например, по средним значениям, дисперсиям).

Для решения любой подобной задачи формулируются две статистические гипотезы:

  1. Нулевая гипотеза Н0 –предположение, что разница между

генеральными параметрами сравниваемых групп равна нулю и различия, наблюдаемые между выборочными характеристиками, носят исключительно случайный характер;

  1. Альтернативная гипотеза Н1 –противоположная нулевой –

гипотеза о существовании различий между генеральными параметрами сравниваемых групп.

Обычно статистическая гипотеза формулируется таким образом, что бы она была противоположна той исследовательской (медицинской, биологической) гипотезе, которая послужила поводом для проведения исследования. Например, необходимо проверить эффективность применения препарата. Пусть есть две группы испытуемых. Одна принимает препарат, а

вторая нет. Тогда в качестве нулевой гипотезы Н

0можно принять гипотезу об

отсутствии различия между результатами первой и второй группы. Тогда

альтернативная гипотеза Н

1-наличие различий между группами.

Для проверки нулевой гипотезы применяют специальные статистические критерии. В результате возникают следующие 4 ситуации: (табл. 6.1).

Ошибка первого рода иначе называется уровнем статистической

значимости. Уровень значимости - это максимально приемлемая для

исследователя вероятность ошибочно отклонить нулевую гипотезу, когда она на самом деле верная, т.е. допускаемая исследователем величина ошибки первого рода. Величина уровня значимости устанавливается исследователем произвольно, однако обычно принимается равным 0,05, 0,01 или 0,001. Вероятность ошибки второго рода не имеет какого-то особого

общепринятого названия, на письме обозначается греческой буквой β .

Однако с этой величиной тесно связана другая, имеющая большое

статистическое значение – мощность (чувствительность) критерия . Она

вычисляется по формуле (1 − β) . Таким образом, чем выше мощность, тем меньше вероятность совершить ошибку второго рода.

Таблица 6.1.

Возможные решения при различных соотношениях результатов статистического теста и истинной ситуации в генеральной совокупности

  1. генеральной совокупности

Нневерна

Н

0верна

Истинно-

положительный

Ложно-

положительный

Н

0отклонена

результат

результат (ошибка первого

рода или  -

  1. статистическом ошибка)

тесте

Ложно-

отрицательный

результат

(ошибка второго

рода или -

ошибка)

Истинно-

отрицательный

вариант

Н0не отклонена

Как видно из вышеприведенного, ошибки первого и второго рода являются взаимно-симметричными, то есть, если поменять местами гипотезы

H

0

  1. H

  1. то ошибки первого рода превратятся в ошибки второго рода, и

наоборот. Тем не менее, в большинстве практических ситуаций путаницы не

происходит, поскольку принято считать, что нулевая гипотеза H

0

соответствует состоянию «по умолчанию» (естественному, наиболее ожидаемому положению вещей) – например, что обследуемый человек здоров, или что проходящий через рамку металлодетектора пассажир не имеет запрещённых металлических предметов. Соответственно,

альтернативная гипотеза H

1обозначает противоположную ситуацию, которая

обычно трактуется как менее вероятная, неординарная, требующая какой- либо реакции.

  1. учётом этого ошибку первого рода часто называют ложной тревогой, ложным срабатыванием или ложноположительным срабатыванием – например, анализ крови показал наличие заболевания, хотя на самом деле человек здоров, или металлодетектор выдал сигнал тревоги, сработав на металлическую пряжку ремня. Слово «положительный» в данном случае не имеет отношения к желательности или нежелательности самого события. Термин широко используется в медицине. Например, тесты, предназначенные для диагностики заболеваний, иногда дают положительный результат (т. е. показывают наличие заболевания у пациента), когда, на самом деле пациент этим заболеванием не страдает. Такой результат называется ложноположительным.

Из-за возможности ложных срабатываний не удаётся полностью автоматизировать борьбу со многими видами угроз. Как правило,

вероятность ложного срабатывания коррелирует с вероятностью пропуска события (ошибки второго рода). То есть, чем более чувствительна система, тем больше опасных событий она детектирует и, следовательно, предотвращает. Но при повышении чувствительности неизбежно вырастает и вероятность ложных срабатываний. Поэтому чересчур чувствительная (параноидально) настроенная система защиты может выродиться в свою противоположность и привести к тому, что побочный вред от неё будет превышать пользу.

Соответственно, ошибку второго рода иногда называют пропуском события или ложноотрицательным срабатыванием – человек болен, но анализ крови этого не показал, или у пассажира имеется холодное оружие, но рамка металлодетектора его не обнаружила (например, из-за того, что чувствительность рамки отрегулирована на обнаружение только очень массивных металлических предметов).

Слово «отрицательный» в данном случае не имеет отношения к желательности или нежелательности самого события.

Термин широко используется в медицине. Например, тесты, предназначенные для диагностики заболеваний, иногда дают отрицательный результат (т.е. показывают отсутствие заболевания у пациента), когда, на самом деле пациент страдает этим заболеванием. Такой результат называется ложноотрицательным.

  1. ходе применения статистического метода вычисляется значение тестовой статистики (например, при применении критерия Стьюдента –

значение t ), а также соответствующее ему и числу степеней свободы

значение р –вероятность справедливости нулевой гипотезы.

Метод проверки статистических гипотез заключается в сравнении

полученного значения р с принятым уровнем значимости:

-если рассчитанное в статистическом тесте значение р оказывается

больше принятого уровня значимости, то нулевую гипотезу Н

0

не

отклоняют и различия групп называются статистически

незначимыми.

-если значение р оказывается меньше уровня значимости, то нулевую

гипотезу Н

0

отклоняют, при этом следует принять альтернативную

гипотезу Н

1.

  1. данном случае различия групп называют

статистически значимыми (при р<0,05) или статистически

высокозначимыми (при р<0,01).

  1. биомедицинской статистике обычно выбирают уровень значимости, равный 0,05 или 0,01. Чем меньше выбрано значение уровня, тем ниже вероятность ошибки первого рода, то есть ошибочного отклонения верной нулевой гипотезы. Однако не следует забывать, что при этом возрастает вероятность ошибки второго рода, т.е. ошибочного принятия ложной нулевой гипотезы.

При сравнении двух выборок могут выдвигаться направленные и

ненаправленные гипотезы. Ненаправленная альтернативная гипотеза

предполагает, что значения переменной в первой выборке отличны от

значений во второй (или отличны от некоторого фиксированного числа).

Направленная альтернативная гипотеза предполагает, что значения

переменной в первой выборке больше значений во второй (или фиксированного числа). Направленные и ненаправленные гипотезы проверяются, соответственно, с помощью односторонних и двусторонних критериев.

Стандартная, но существеннейшая статистическая задача – сравнение значений переменной (или нескольких однотипных переменных) в нескольких группах (или подгруппах), выбранных из генеральной совокупности согласно некоему условию. Подобные выборки могут быть

независимыми (несвязанными) или зависимыми (связанными, сопряженными,

парными). Например, значения уровня сахара в крови у пациентов мужского

пола в клинике и у пациентов женского пола являются независимыми, а значения уровня сахара крови, измеренные у одних и тех же пациентов утром

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]