- •Методические указания
- •Раздел 1. Статистические методы анализа групповых свойств биологических объектов Практическое занятие 1: Построение и описание гистограмм
- •Ьбю.Срсп 1. Вычисление статистических характеристик случайных величин
- •Дидактический блок
- •Пример расчета
- •Срсп 2. Проверка гипотезы о нормальности распределения случайной величины.
- •Контрольные вопросы
- •Алгоритм подбора критериев при сравнении двух выборок
- •Раздел 2. Теория проверки статистических гипотез Практическое занятие 2.Критерий Стьюдента для анализа биомедицинских данных. Доверительный интервал
- •Практическое занятие 3.Непараметрические критерии проверки статистических гипотез.
- •Срс 1. Определение минимального объема выборки.
- •Раздел 3. Анализ относительных величин срсп 3.Сравнение относительных величин
- •Срсп 4. Анализ качественных признаков. Таблицы сопряженности
- •Срс 2. Оценка рисков и шансов. Оценка специфичности, чувствительности и прогностической значимости диагностических тестов.
- •Раздел 4. Методы прогнозирования Практическое занятие 4. Линейная корреляция. Ранговый коэффициент корреляции Спирмена
- •Корреляции
- •Коэффициент корреляции Пирсона
- •Коэффициент корреляции рангов к. Спирмена
- •Практическое занятие 5. Метод анализа выживаемости
- •Срсп 5. Прогнозирование на основе линейной регрессии
- •Срсп 6: Прогнозирование на основе кривой выживаемости
- •Срс 3. Прогнозирование на основе среднего абсолютного прироста
- •Раздел 5. Практическое занятие 6. Дисперсионный анализ. Метод однофакторного дисперсионного анализа.
- •Срсп 7.Анализ научной публикации
- •Приложения Критические значения коэффициента асимметрии As
- •Критические точки двустороннего t-критерия Стьюдента
- •Критические значения χ2
- •Критические значения f-критерияФишера
- •Примерный вариант заданий к рубежному контролю
- •Формулы подсчета статистических показателей
Срсп 4. Анализ качественных признаков. Таблицы сопряженности
Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?
В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.
Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.
Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).
В общем случае Н(0)формулируется следующим образом:
в генеральных совокупностях доля объектов с интересующими нас признаками одинакова
или частота встречаемости одного признака не зависит от частоты встречаемости другого признака
или какой-либо фактор не влияет на частоту встречаемости признака (признаков)
СЛУЧАЙ 1. Выборки независимые
Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности
|
Первая признак (первая градация) |
Первый признак (вторая градация) |
Всего |
Второй признак (первая градация) |
Частота встречаемости a |
Частота встречаемости b |
a +b |
Второй признак (вторая градация) |
Частота встречаемости c |
Частота встречаемости d |
с+d |
|
n1=a+c |
n2=b+d |
n =a+b+c+d |
Критерием для проверки нулевой гипотезы является хи-квадрат Пирсонас поправкой Йетса
Его критическое значение находится для заданного уровня значимости α и числа степеней свободы f=(m-1)(n-1), где m-число столбцов,n– число строк (Приложение 5).
Если тоН(0) принимается,
В случае принимаетсяН(1)
Можно вычислить меру связи между двумя признаками – ею является коэффициент ассоциацииЮла Q(аналог коэффициента корреляции)
Qлежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю – связь отсутствует.
Работа с преподавателем
Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я - аспирин. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.
В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й -у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?
Зададим уровень значимости α=0,05
Сформулируем Н(0): в генеральной совокупности доля больных тромбозом не зависит от приема аспирина.
Занесем результаты испытания в таблицу.
|
Тромбоз есть |
Тромбоза нет |
|
Плацебо |
18 |
7 |
25 |
Аспирин |
6 |
13 |
19 |
Всего |
24 |
20 |
44 |
Посчитаем значение критерия хи-квадрат с поправкой Йетса
Q=0,7
Мы задали 5% -ный уровень значимости α = 0,05 . Тогда критическое значение = 3,84 (по таблице для f=1). Полученное значение χ2=5,56 больше, чем критическое, следовательно, мы отвергаем Н(0) гипотезу о том, что аспирин не влияет на проявление тромбоза шунта. Следовательно, мы можем утверждать с вероятностью 95%, что использование аспирина эффективно снижает риск тромбоза в генеральной совокупности.
Q=0,7 показывает сильную связь между приемом аспирина и вероятностью тромбоза.
Случай 2. Выборки зависимые
Над одними и теми же объектами проводятся два наблюдения: до и после. (прием лекарства, обучение, внушение и т.д.)
Подсчитывается сколько раз данное свойство встречается:
и «до» и «после», (+,+)
только «до» (+,-)
только «после» (-,+)
ни «до» ни «после» (-,-)
|
Наличие признака«после» | |
Наличие признака«до» |
нет(-) |
есть(+) |
есть(+) |
a Число изменений от (+) к (-) |
c Число сохранивших (+) |
нет (-) |
b Число сохранивших (-) |
d Число изменений от (–) к (+) |
Н(0) – доля объектов с интересующим нас признаком«после» не изменилась по сравнению с «до»
Вычисляем критерий хи-квадрат Мак-Нимара
Если то Н(0) принимается
Если то принимаем Н(1),
Работа с преподавателем.Было проведено исследование эффективности антитабачной рекламы. Для этого сравнили соотношение курящих/некурящих до и после проведения рекламной компании.
Сформулируем Н(0): рекламная компания, проведенная в генеральной совокупности, не повлияет на долюкурящих.
Или - соотношение курящих и некурящих среди членов генеральной совокупности после рекламной компании не изменится.
Зададим уровень значимости α=0,01
Рекламная компания была проведена среди 100 человек. В результате исследования были получены следующие результаты
|
После рекламы | |
До рекламы |
Не курят (-) |
Курят (+) |
Курят (+) |
32 (курили , но не стали курить) |
25 (курили и курят) |
Не курят (-) |
43 (не курили и не курят) |
0 (не курили, но стали курить) |
Мы задали 1% -ный уровень значимости α = 0,01 . Тогда критическое значение = 6,64 (по таблице для f=1). Полученное значение χ2=30 больше, чем критическое, следовательно:
мы отвергаем нулевую гипотезу и принимаем альтернативную о том, что с вероятностью 99 % рекламная компания повлияет на соотношение курящих и некурящих в популяции (генеральной совокупности).
Контрольные вопросы
Для каких целей используются таблицы сопряженности
Структура таблицы сопряженности
Сформулирйте нулевую гипотезу для общего случая
Какие данные заносятся в таблицу сопряженности в случае зависимых выборок
Какие критерии используются при анализе таблицы сопряженности
Задание к СРСП 4.
Сформулируйте цель проведенного исследования
Сформулируйте нулевую и альтернативную гипотезы
Составьте таблицу сопряженности
Решите задачу на уровне значимости 0,05
Вариант 1
Исследовалась заболеваемость в сельской и городской местности. Выборочные исследования показали, что в селе из ста жителей обращались к врачу 36 человека, в городе из 100 жителей посетили врача 28 человек. Определить зависит ли обращаемость к врачу от места жительства.
Вариант 2.
Среди 84 лиц, страдающих гипертонией, с давлением более 160 мм.рт.ст. было 24 человека. После приема препарата их стало 18. Сделайте вывод об эффективности препарата.
Вариант 3
Сравнивалась эффективность двух методов лечения и получены следующие данные
|
1 вид лечения |
2 вид лечения |
Вылечились |
58 |
36 |
Не вылечились |
54 |
19 |
Отличаются ли по эффективности эти два вида лечения?
Вариант 4
В конце первого года обучения в вузе в группе студентов из 15 человек было 6 отличников. В конце второго года обучения их стало 8. Определить, меняется ли успеваемость на втором курсе.
Вариант 5
1000 человек классифицировали по признаку дальтонизма. По приведенным ниже данным проверить, есть ли зависимость между наличием дальтонизма и полом человека.
|
Мужчины |
Женщины |
Дальтоники |
38 |
6 |
Не дальтоники |
442 |
514 |
Вариант 6
Во время эпидемии гриппа изучалась эффективность прививок против этого заболевания. Получены следующие результаты:
С прививкой |
Без прививки | ||
заболели |
не заболели |
заболели |
не заболели |
4 |
192 |
34 |
111 |
Указывают ли эти результаты на эффективность прививок?
Вариант 7
До внедрения новой системы профилактики заболеваний к врачу обращался каждый третий из 90 человек. После внедрения уже обращается каждый шестой. Охарактеризовать эффективность новой системы профилактики.
Вариант 8
Данные социологического исследования показали, что среди молодежи спортом занимаются 42 человека из 200 опрошенных, среди лиц старшего возраста – 55 из 325 опрошенных. Определите, есть ли зависимость увлеченности спортом от возраста.
Вариант9.
Среди 84 подземных рабочих хронический бронхит регистрируется у четверти, у строителей он диагностирован у трети из 105 обследованных. Определить влияет ли профессия на риск возникновения хронического бронхита. У кого эта вероятность выше?
Вариант 10.
500 человек классифицировали по признаку аллергии к полыни. По приведенным ниже данным проверить, есть ли зависимость между наличием аллергии и полом человека.
|
Мужчины |
Женщины |
Есть аллергия |
19 |
20 |
Нет аллергии |
221 |
240 |
Вариант 11
До открытия бассейна в детском саду у 16 детишек из 150 наблюдались частые ОРВИ. Через год занятий в бассейне в этой группе количество таких лиц уменьшилось до 12.
Нужно ли строить бассейны в детских садах.
Вариант 12.
После первого года обучения в группе студентов было 9 хорошистов и 6 троечников. На втором курсе группа пополнилась еще тремя студентами и по итогам сессии 11 стали хорошистами и 7 троечниками. Определить меняется ли успеваемость от курса к курсу?
Вариант 13.
В исследуемом регионе в текущем году родилось 286 мальчиков и 314 девочек. Соотносятся ли эти данные с предположением, что вероятность рождения мальчиков и девочек одинакова.