Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Biostat2013.docx
Скачиваний:
113
Добавлен:
20.05.2015
Размер:
782.74 Кб
Скачать

Тема 8. Анализ качественных признаков. Таблицы сопряженности

Базовые вопросы к теме

  1. Цели биостатистики, предмет биостатистики

  2. Применение статистического анализа в медицинских исследованиях

  3. Понятие случайной величины

  4. Генеральная совокупность и выборка

  5. Классификация признаков: количественные и качественные признаки

  6. Правила построения гистограмм

  7. Основные статистические характеристики случайных величин и их интерпретация

  8. Понятие статистических гипотез, гипотезы в медицинских исследованиях

  9. Нулевая и альтернативная гипотезы

  10. Уровень значимости

  11. Статистические критерии – параметрические и непараметрические

  12. Алгоритм проверки гипотез

  13. Критерий Стъюдента для проверки статистических гипотез: случай зависимых и независимых выборок.

  14. Понятие доверительного интервала

  15. Непараметрические критерии проверки статистических гипотез

Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?

В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.

Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.

Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).

В общем случае Н(0) формулируется следующим образом:

  • в генеральных совокупностях доля объектов с интересующими нас признаками одинакова

  • или частота встречаемости одного признака не зависит от частоты встречаемости другого признака

  • или какой-либо фактор не влияет на частоту встречаемости признака (признаков)

СЛУЧАЙ 1. Выборки независимые

Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности

Первая признак (первая градация)

Первый признак (вторая градация)

Всего

Второй признак (первая градация)

Частота встречаемости

a

Частота встречаемости

b

a +b

Второй признак (вторая градация)

Частота встречаемости

c

Частота встречаемости

d

с+d

n1=a+c

n2=b+d

n =a+b+c+d

Критерием для проверки нулевой гипотезы является хи-квадрат Пирсона

Но для таблицы 2х2 более точные результаты дает критерий с поправкой Йетса

Его критическое значение находится для заданного уровня значимости α и числа степеней свободы f=(m-1)(n-1), где m-число столбцов, n – число строк (Приложение 5).

Если то Н(0) принимается,

В случае принимается Н(1)

Можно вычислить меру связи между двумя признаками – ею является коэффициент ассоциации Юла Q (аналог коэффициента корреляции)

Q лежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю – связь отсутствует.

Работа с преподавателем

Руководствуясь тем, что аспирин препятствует образованию тромбов, Г. Харатер решил проверить, нельзя ли снизить риск тромбоза назначением небольших доз аспирина (160 мг/сут.). Было проведено контролируемое испытание. Все больные, согласившиеся принять участие в испытании и не имевшие противопоказаний к аспирину, были случайным образом разделены на две группы: 1-я получала плацебо, 2-я - аспирин. Исследование проводилось до тех пор, пока общее число больных с тромбозом шунта не достигло 24. Группы практически не различались по возрасту, полу и продолжительности лечения гемодиализом.

В 1-й группе тромбоз шунта произошел у 18 из 25 больных, во 2-й -у 6 из 19. Можно ли говорить о статистически значимом различии доли больных тромбозом, а тем самым об эффективности аспирина?

Зададим уровень значимости α=0,05

Сформулируем Н(0):

Занесем результаты испытания в таблицу.

Тромбоз есть

Тромбоза нет

Плацебо

Аспирин

Всего

Посчитаем значение критерия хи-квадрат

Вывод:

Случай 2. Выборки зависимые

Над одними и теми же объектами проводятся два наблюдения: до и после. (прием лекарства, обучение, внушение и т.д.)

Подсчитывается сколько раз данное свойство встречается:

  • и «до» и «после», (+,+)

  • только «до» (+,-)

  • только «после» (-,+)

  • ни «до» ни «после» (-,-)

Наличие признака «после»

Наличие признака «до»

нет (-)

есть (+)

есть (+)

a

Число изменений от (+) к (-)

c

Число сохранивших (+)

нет (-)

b

Число сохранивших (-)

d

Число изменений от (–) к (+)

  • Н(0) – доля объектов с интересующим нас признаком «после» не изменилась по сравнению с «до»

  • Вычисляем

Если то Н(0) принимается

  • Если то принимаем Н(1),

Работа с преподавателем. Было проведено исследование эффективности антитабачной рекламы. Для этого сравнили соотношение курящих/некурящих до и после проведения рекламной компании.

Сформулируем Н(0):.

Зададим уровень значимости α=0,01

Рекламная компания была проведена среди 100 человек. В результате исследования были получены следующие результаты

После рекламы

До рекламы

Не курят (-)

Курят (+)

Курят (+)

Не курят (-)

Вывод:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]