- •Тема. Числовые характеристики дискретного статистического распределения: выборочное среднее, выборочная дисперсия, среднее квадратичное отклонение, мода, медиана Базовые вопросы к теме
- •Дидактический блок
- •Работа с преподавателем
- •Базовые вопросы к теме
- •Информационно-дидактический блок Параметрические критерии для проверки гипотезы о различии (или сходстве) между средними значениями
- •Определение достоверности различия двух зависимых выборочных совокупностей.
- •Тема: Непараметрические критерии проверки статистических гипотез.
- •Информационно-дидактический блок
- •Тема: Анализ качественных признаков. Таблицы сопряженности
- •Информационно-дидактический блок
- •Тема: Линейная корреляция.
- •Информационно-дидактический блок
- •Коэффициент корреляции Пирсона
- •Коэффициент корреляции рангов к. Спирмена
- •Тема: Линейная регрессия
- •Тема: Дисперсионный анализ. Метод однофакторного дисперсионного анализа.
- •Тема: Статистические методы в эпидемиологическом анализе Метод стандартизованных коэффициентов
- •Тема: Метод анализа выживаемости
- •Примерный вариант заданий к рубежному контролю №1
- •Примерный вариант заданий к рубежному контролю №2
- •Задания по срс
Тема: Анализ качественных признаков. Таблицы сопряженности
Базовые вопросы к теме
Цели биостатистики, предмет биостатистики
Применение статистического анализа в медицинских исследованиях
Понятие случайной величины
Генеральная совокупность и выборка
Классификация признаков: количественные и качественные признаки
Правила построения гистограмм
Основные статистические характеристики случайных величин и их интерпретация
Понятие статистических гипотез, гипотезы в медицинских исследованиях
Нулевая и альтернативная гипотезы
Уровень значимости
Статистические критерии – параметрические и непараметрические
Алгоритм проверки гипотез
Критерий Стъюдента для проверки статистических гипотез: случай зависимых и независимых выборок.
Понятие доверительного интервала
Непараметрические критерии проверки статистических гипотез
Информационно-дидактический блок
Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?
В этих случаях изучается распространенность признаков, частота встречаемости признаков в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.
Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.
Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).
Случай 1. Выборки независимые
Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц.
признак А - район проживания (градации: А1 – городские жители, А2 – сельские жители)
признак В - наличие анемии (градации: В1 – есть анемия, В2 – нет анемии)
В результате проведенного в одной области исследования были получены следующие данные
|
А1 (городские) |
А2 (сельские) |
Всего |
В1 (анемия есть) |
a |
b |
a +b |
В2 (анемии нет) |
c |
d |
с+d |
|
n1=a+c |
n2=b+d |
n =a+b+c+d |
Определить отличается ли соотношение больных и здоровых в городе от соотношения в селе. Или иными словами, зависит ли распространенность анемии от места проживания (есть ли связь между местом жительства и уровнем заболевания).
Выдвигаем Н(0): (о независимости) распространенность анемии не зависит от места проживания. Или «соотношение здоровых и больных одинаково в городе и селе».
Поскольку у нас имеются лишь выборочные данные подтвердить или отвергнуть гипотезу мы можем с определенной долей вероятности.
Задаемся уровнем значимости α
Критерием является (хи-квадрат) Пирсона
Находим его критическое значение для заданного уровня значимости α и числа степеней свободы f=1
Если
то Н(0) принимается, т.е. с вероятностью α распространение анемии не зависит от места проживания
В случае
принимается Н(1)
Случай 2. Выборки зависимые
Над одними и теми же объектами проводятся два наблюдения: до и после. (прием лекарства, воздействие, обучение, внушение и т.д.)
Подсчитывается сколько раз данное свойство встречается:
и «до» и «после», (+,+)
только «до» (+,-)
только «после» (-,+)
ни «до» ни «после» (-,-)
|
Температура после | |
Температура до |
нет (-) |
есть (+) |
есть (+) |
a Число изменений от (+) к (-) |
c Число сохранивших (+) |
нет (-) |
b Число сохранивших (-) |
d Число изменений от (–) к (+) |
Задаемся уровнем значимости α
Н(0) – препарат не влияет на температуру, т.е. соотношение людей «с» и «без» температуры после приема препарата не изменилось
Вычисляем критерий хи-квадрат Макнимара
Если
то Н(0) принимается, т.е. нет оснований утверждать, что препарат влияет на температуру.
Если
то принимаем Н(1), т.е. с вероятностью более (1- σ) можно утверждать, что препарат влияет на температуру
Работа с преподавателем
Случай 1 Независимые выборки.
Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я - аспирин. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.
В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й -у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?
|
Есть тромбоз |
Нет трамбоза |
Всего |
Плацебо |
a |
b |
|
Аспирин |
c |
d |
|
|
|
|
|
H(0):
α =
(Пирсона) =
Случай 2 Зависимые выборки
Было проведено исследование эффективности антитабачной рекламы. Для этого сравнили соотношение курящих/некурящих до и после проведения рекламной компании.
Рекламная компания была проведена среди 100 человек. В результате исследования были получены следующие результаты
|
После рекламы | |
До рекламы |
Не курят (-) |
Курят (+) |
Курят (+) |
|
|
Не курят (-) |
|
|
H(0):
α =
(Макнимара) =
Задачи для самостоятельного решения
Вариант 1
До применения нового препарата соотношение между больными и здоровыми составляло 2:3, после его применения стало 1:3. Был ли эффект от применения препарата? Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05
Вариант 2.
В исследуемой выборке количество холостых мужчин составило 42%, а незамужних женщин - 58%. На основании этих данных сделайте вывод о теоретической возможности всех женщин выйти замуж (с уровнем значимости 0,05). Сформулируйте нулевую гипотезу.
Вариант 3
Исследования показали, что в некотором районе до и после проведения профилактических бесед доля курящих составляла 15% и 8% населения, соответственно. Был ли эффект от профилактических бесед. Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант 4
Сравнивалась эффективность двух методов лечения и получены следующие данные
|
1 вид лечения |
2 вид лечения |
Вылечились |
58 |
36 |
Не вылечились |
54 |
19 |
Отличаются ли по эффективности эти два вида лечения? Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант 5
На экзамене по биостатистике билет состоял из вопросов из двух разных разделов. Экзамен сдавало 20 студентов. Оказалось, что из первого раздела попались 22 вопроса, из второго раздела - 18. Соотносятся ли эти данные с предположением, что вопросы из обоих разделов попадаются с равной вероятностью. Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант 6
1000 человек классифицировали по признаку дальтонизма. По приведенным ниже данным проверить, есть ли зависимость между наличием дальтонизма и полом человека, при α = 0,05. Сформулируйте нулевую гипотезу.
|
Мужчины |
Женщины |
Дальтоники |
38 |
6 |
Не дальтоники |
442 |
514 |
Вариант 7
Во время эпидемии гриппа изучалась эффективность прививок против этого заболевания. Получены следующие результаты:
После прививки |
Без прививки | ||
заболели |
не заболели |
заболели |
не заболели |
4 |
192 |
34 |
111 |
Указывают ли эти результаты на эффективность прививок? Сформулируйте нулевую гипотезу. Принять α = 0,05.
Вариант 8
На предприятии химической промышленности заболеваемость составила 37%, в то время как в целом в данном регионе она регистрируется на уровне 23%. Влияют ли условия предприятия на заболеваемость? Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант 9
Данные социологического исследования показали, что среди молодежи спортом занимаются 42 человека из 200 опрошенных, среди лиц старшего возраста – 55 из 325 опрошенных. Определите, есть ли зависимость увлеченности спортом от возраста. Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант10.
Среди 84 подземных рабочих хронический бронхит регистрируется у четверти, у строителей он диагностирован у трети из 105 обследованных. Определить влияет ли профессия на риск возникновения хронического бронхита. У кого эта вероятность выше? Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант 11.
500 человек классифицировали по признаку аллергии к полыни. По приведенным ниже данным проверить, есть ли зависимость между наличием аллергии и полом человека, при α = 0,05.
|
Мужчины |
Женщины |
Есть аллергия |
19 |
20 |
Нет аллергии |
221 |
240 |
Вариант 12
Сравнивалась эффективность двух антибиотиков и получены следующие данные
|
1 антибиотик |
2 антибиотик |
Есть эффект |
23 |
38 |
Нет эффекта |
76 |
65 |
Отличаются ли по эффективности эти два антибиотика? Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант 13.
После первого года обучения в группе студентов было 9 хорошистов и 6 троечников. На втором курсе группа пополнилась еще тремя студентами, и по итогам сессии 11 стали хорошистами и 7 троечниками. Определить меняется ли успеваемость от курса к курсу и в какую строну? Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.
Вариант 14.
До применения нового препарата в исследуемой группе насчитывалось 15 больных и 37 здоровых. После применения препарата вылечилось 7 человек. Сформулируйте нулевую гипотезу. Определить эффективность нового препарата с уровнем значимости 0,05.
Вариант 15.
В исследуемом регионе в текущем году родилось 286 мальчиков и 314 девочек. Соотносятся ли эти данные с предположением, что вероятность рождения мальчиков и девочек одинакова. Сформулируйте нулевую гипотезу. Сделайте вывод на уровне значимости 0,05.