- •Методические указания
- •Тема 1: Анализ медико-биологических данных на основе их графического представления.
- •Тема 2. Выборочный метод. Дискретный статистический ряд распределения
- •Дидактический блок
- •Работа с преподавателем
- •Тема 3. Проверка гипотезы о нормальности распределения случайной величины.
- •Алгоритм подбора критериев при сравнении двух выборок
- •Тема 5. Доверительный интервал
- •5.1 Доверительный интервал генеральной средней
- •5.2 Доверительный интервал для разности генеральных средних двух независимых групп
- •5.3 Доверительный интервал для разности генеральных средних двух зависимых групп
- •Тема 6. Оценка относительных величин в биостатистике
- •6.1 Доверительный интервал относительных показателей
- •Тема 7.Непараметрические критерии проверки статистических гипотез.
- •Тема 8. Анализ качественных признаков. Таблицы сопряженности
- •8.1 Оценка рисков
- •8.2 Сравнение диагностических тестов
- •8.3 Оценка прогностической значимости
- •Контрольные задания «Основные статистические характеристики случайных величин»
- •Контрольные задачи по теме «Теория проверки статистических гипотез» Вариант 1.
- •Вариант 2.
- •Вариант 3.
- •Вариант №12
- •Тема 9. Линейная корреляция. Ранговый коэффициент корреляции Спирмена
- •Корреляции
- •Коэффициент корреляции Пирсона
- •Коэффициент корреляции рангов к. Спирмена
- •Тема 10. Линейная регрессия
- •Тема 11. Дисперсионный анализ. Метод однофакторного дисперсионного анализа.
- •Тема 12. Метод анализа выживаемости
- •Критические значения коэффициента асимметрии As
- •Критические точки двустороннего t-критерия Стьюдента
- •Критические значенияχ2
- •Критические значенияF-критерия Фишера
- •Задания по срс «медико биологическое исследование»
- •Задание по срс» «анализ научной публикации»
- •Примерный вариант заданий к рубежному контролю
- •Формулы подсчета статистических показателей
Тема 8. Анализ качественных признаков. Таблицы сопряженности
Базовые вопросы к теме
Цели биостатистики, предмет биостатистики
Применение статистического анализа в медицинских исследованиях
Понятие случайной величины
Генеральная совокупность и выборка
Классификация признаков: количественные и качественные признаки
Правила построения гистограмм
Основные статистические характеристики случайных величин и их интерпретация
Понятие статистических гипотез, гипотезы в медицинских исследованиях
Нулевая и альтернативная гипотезы
Уровень значимости
Статистические критерии – параметрические и непараметрические
Алгоритм проверки гипотез
Критерий Стъюдента для проверки статистических гипотез: случай зависимых и независимых выборок.
Понятие доверительного интервала
Непараметрические критерии проверки статистических гипотез
Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?
В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.
Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.
Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).
В общем случае Н(0) формулируется следующим образом:
в генеральных совокупностях доля объектов с интересующими нас признаками одинакова
или частота встречаемости одного признака не зависит от частоты встречаемости другого признака
или какой-либо фактор не влияет на частоту встречаемости признака (признаков)
СЛУЧАЙ 1. Выборки независимые
Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности
|
Первая признак (первая градация) |
Первый признак (вторая градация) |
Всего |
Второй признак (первая градация) |
Частота встречаемости a |
Частота встречаемости b |
a +b |
Второй признак (вторая градация) |
Частота встречаемости c |
Частота встречаемости d |
с+d |
|
n1=a+c |
n2=b+d |
n =a+b+c+d |
Критерием для проверки нулевой гипотезы является хи-квадрат Пирсона
Но для таблицы 2х2 более точные результаты дает критерий с поправкой Йетса
Его критическое значение находится для заданного уровня значимости α и числа степеней свободы f=(m-1)(n-1), где m-число столбцов, n – число строк (Приложение 5).
Если то Н(0) принимается,
В случае принимается Н(1)
Можно вычислить меру связи между двумя признаками – ею является коэффициент ассоциации Юла Q (аналог коэффициента корреляции)
Q лежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю – связь отсутствует.
Работа с преподавателем
Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я - аспирин. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.
В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й -у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?
Зададим уровень значимости α=0,05
Сформулируем Н(0):
Занесем результаты испытания в таблицу.
|
Тромбоз есть |
Тромбоза нет |
|
Плацебо |
|
|
|
Аспирин |
|
|
|
Всего |
|
|
|
Посчитаем значение критерия хи-квадрат
Вывод:
Случай 2. Выборки зависимые
Над одними и теми же объектами проводятся два наблюдения: до и после. (прием лекарства, обучение, внушение и т.д.)
Подсчитывается сколько раз данное свойство встречается:
и «до» и «после», (+,+)
только «до» (+,-)
только «после» (-,+)
ни «до» ни «после» (-,-)
|
Наличие признака «после» | |
Наличие признака «до» |
нет (-) |
есть (+) |
есть (+) |
a Число изменений от (+) к (-) |
c Число сохранивших (+) |
нет (-) |
b Число сохранивших (-) |
d Число изменений от (–) к (+) |
Н(0) – доля объектов с интересующим нас признаком «после» не изменилась по сравнению с «до»
Вычисляем
Если то Н(0) принимается
Если то принимаем Н(1),
Работа с преподавателем. Было проведено исследование эффективности антитабачной рекламы. Для этого сравнили соотношение курящих/некурящих до и после проведения рекламной компании.
Сформулируем Н(0):.
Зададим уровень значимости α=0,01
Рекламная компания была проведена среди 100 человек. В результате исследования были получены следующие результаты
|
После рекламы | |
До рекламы |
Не курят (-) |
Курят (+) |
Курят (+) |
|
|
Не курят (-) |
|
|
Вывод: