5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных
.pdfСтатистический анализ медицинских данных ."
дования) соответственно для каждого сочетания значений перво го и второго факторов.
Вернувшись в третье диалоговое окно (см. рис. 10.6), можно
приступить к собственно статистическому анализу таблИI:JЫ со
пряженности, т.е. к проверке статистических гипотез.
Этап 2-й - анализ таблицы сопряженности. После по
строения табличы сопряженности у исследователя естественно
возникает вопрос о том, существует ли статистическая взаимо
связь двух анализируемых признаков, т.е. влияет ли один при
знак (например, метод лечения) на распределение числа объек
тов исследования по другому признаку (например, исходам забо левания), и является ли это влияние статистически значимым,
т.е. ассочиированы ли эти два признака.
Для решения такой задачи мо.жно сформулировать и прове
рить нулевую статистическую гипотезу. В данном случае нулевая
гипотеза может быть сформулирована по-разному:
-шпотеза об однородности - группы (детерминируемые зна
чениями одного из двух анализируемых признаков) происхо
дят из одной и той же популячии, т.е. идентичны в отноше
нии другого признака;
-шпотеза о неза8исимоспiи признаков - распределение по
одному признаку не влияет на распределение по другому при
знаку.
Соответственно альтернативными гипотезами являются сле
дующие:
-группы (выборки) получены из разных популячий, т.е. раз
личаются по второму признаку;
-признаки являются зависимыми.
Для проверки любой из нулевых гипотез по табличе сопря женности в ППП STАТISTICA предлагается использовать сле
дующие методы:
-"Пирсона и МП1 хи-квадрат" ( "Pearson and ML Chi-square")
- применяются для любых двумерных (прямоугольных) таб-
лич;
"Точный Фишера2, Йетса3, МакНемара4 (табличы 2><2)" ("Fisher exact, Yates, McNemar (2х2 taЬles)") - применя-
1Максимального правдоподобия.
2Точный критерий Фишера.
'Хи-квадрат с поправкой Йетса.
4 Критерий МакНемара.
152
Глава 10. Сравнение групп по качественному признаку
ются для анализа четырехпольных таблиц, т.е. для анализа двух признаков, каждый из которых является бинарным (под
робнее см. главу 11).
Возможно также вычисление следующих мер сопряженности
признаков:
- "Фи (таблицы 2х2) и Крамера V и С"1 - коэффициенты
сопряженности, которые применяются для анализа четырех
польных таблиц, т.е. двух признаков, каждый из которых яв
ляется бинарным (подробнее см. главу 11).
"Тау-Ь и тау-с Кендалла"2 - коэффициенты сопряженности
(непараметрической, или ранговой, корреляции; см. главу 12).
"Гамма"3 - коэффициент сопряженности (непараметриче
ской, или ранговой, корреляции; см. главу 12).
"Корреляция Спирмена"4 - коэффициент сопряженности
(непараметрической, или ранговой, корреляции; см. главу 12).
"Соммера d" 5 - несимметричная мера связи между двумя
признаками.
- "Коэффициенты неопределенности"6 измеряют информаци
онную связь между факторами (строками и столбцами таб лицы). Статистика S(Y,X) является симметричной и измеря
ет количество информации в признаке У относительно при
знака Х или в признаке Х относительно признака У. Эга ве
личина равна нулю, если Х и У независимы. Статистики S(xjY) и S(YjX) выражают направленную зависимость [24].
Мы остановимся в данной главе лишь на первом и наиболее
универсальном из перечисленных методов - критерии х2•
Если таблица сопряженности была получена с использовани
ем подмодуля "Таблицы и заголовки" ( "ТаЫеs and Banners"),
то для проверки гипотезы о сопряженности (зависимости) при
знаков ( т.е. о том, влияет ли распределение по одному признаку
на распределение по другому признаку, например, влияет ли ме
тод лечения на исходы заболевания) можно применить крите рий х2• Ддя этого в диалоговом окне "Результаты кросстабуля-
1 Phi (2х2 taЬ!es) and Cramer's V&C (англ.).
2Kendall's tau-b & tau-c (англ.).
3Gamma (англ.).
• Spearman гank order correlation (англ.). ' Sommer's d (англ.).
" Uncertainty coefficients (англ.).
153
Статистический анализ медицинских данных ...
- при р<О,05 нулевая гипотеза отклоняется, и принимается
альтернативная гипотеза о различии групп или об ассоgии
рованности признаков.
Замечание. Ее.ли резу.льтать1 расчетов по методу Пир
сона и по методу максима.льною пра8доподобия да.ли 8е.ли
чины р, находящиеся по разные стороны от поро208ой 8е.ли
чиныуробня значимос11ш 0,05, то можно 8оспо.льзо8аться тем,
который ".лучше" ( соот8етст8ует меньшему значению р).
Дµ.льнейший анализ этой ситуации может быть про8еден
.лишь 8ысокок8а.лифициро8анным статистиком. Представление результатов. Привести следующую инфор-
МаIJИЮ:
-таблиIJУ сопряженности;
-название статистического метода и его варианта (Пирсона или МП);
-точное значение р.
156
Глава 11 . Сравнение групп
по качественному бинарному
признаку
Бинарные (дихотомические) признаки наиболее часто ана
лизируются в эпидемиологических исследованиях и клинических
испытаниях. Обычно они представляют собой альтернативные клинические исходы для объектов исследования, например: улуч шение - без улучшения; заболел - не заболел; есть осложнение
-нет осложнения.
Именно на анализе истинных клинических исходов построе
ны все современные методики клинических испытаний, соответ
ствующих принgипам доказательной медиgины. Изучение так называемых суррогатных, или промежуточных, исходов (резуль татов лабораторных и инструментальных исследований) в настоя
щее время не может считаться доказательством наличия или от
сутствия клинической эффективности препаратов. В клинических
испытаниях их рассматривают лишь в качестве косвенных крите
риев оgенки эффективности вмешательства.
В данной главе рассмотрено несколько наиболее широко рас пространенных задач анализа качественных бинарных данных:
-сравнение выборочной относительной частоты с популяgион
ной (см. раздел 11.1 ) ;
-сравнение двух относительных частот внутри одной и в двух
группах (см. раздел 11.2);
-сравнение частот бинарного признака в двух несвязанных
группах (см. раздел 11. 3);
-сравнение частот бинарного признака в двух связанных груп пах (см. раздел 11.4);
-сравнение частот бинарного признака в трех и более несвя
занных группах (см. раздел 11. 5).
Особый случай сравнения бинарных признаков, являющихся ди
агностическими или экспертными заключениями, рассмотрен в раз
деле 15.5.2.
157
Статистический анализ медицинских данных ...
11 . 1. Сравнение выборочной
относительной частоты с популяционной
Задача: сравнить относительную частоту Р какого-либо явле
ния, наблюдаемую в изучаемой выборке, с известным (или ожи
даемым) популяgионным значением относительной частоты это
го события Р/
Пример: наблюдаемая относительная частота случаев атопи
ческого дерматита у 500 обследованных учеников школы No 7315
г. Н-ска равна 11 о/о. Известно, что в среднем по России относи
тельная частота этого заболевания среди школьников составляет
бо/о (95о/о ДИ - [4о/о; 8о/о] ). Необходимо узнать, действитель
но ли в этой школе данное заболевание встречается чаще, чем в
общей популяgии?
Решение. Могут использоваться следующие подходы:
-сравнение ДИ для выборочной относительной частоты (про
порgии, доли) с популяgионным значением (см. раздел
11.1.1);
-методы проверки гипотез о совпадении наблюдаемых и ожи
даемых частот;
z-критерий (см. раздел 11.1.2);
-критерий Х2 (см. раздел 11.1.3).
11. 1. 1. Сравнение доверительного интервала
для выборочной относительной частоты
с популяционной
Решение. Построение ДИ для относительной частоты значе ния бинарного признака описано в разделе 9.3.
В отношении популяgионного значения могут рассматриваться
две ситуаgии:
-известна точечная оgенка популяgионной частоты, т.е. одно
число (в нашем примере - бо/о);
-известна интервальная оgенка популяgионной частоты, т.е.
ДИ (в нашем примере - [4о/о; 8о/о] ).
Решение заключается соответственно либо в рассмотрении,
попадает ли популяgионное значение в граниgы вычисленного
1 Prevalence (англ.) - распространенность; в отечественной литературе иногда также используется термин "преnаленс".
158
Глава 11. Сравнение групп по качественному бинарному признаку
ДИ (в первой ситуаqии), либо в рассмотрении, перекрываются
ли доверительные интервалы для выборочного и популяqионного значений.
Интерпретация результатов. Если точечная оqенка попу
ляqионного значения находится вне рассчитанного по выборке
ДИ, то можно считать, что выборка статистически значимо (с
уровнем значимости 0,05 в случае сравнения с 95°!о ДИ) отлича
ется от hопуляqии по значению изучаемого бинарного признака
(пропорqии). Если же популяqионное значение попадает внутрь
ДИ, то выборка не отличается от популяqии.
Аналогично в случае наличия ДИ для популяqионного значе ния. Если доверительные интервалы выборочной и популяqион
ной величин перекрываются, то различия статистически незначи
мы. Если не перекрываются, то можно считать выборку стати
стически значимо отличающейся от популяqии.
11.1.2. Проверка гипотез (z-критерий)
Проверка указанной нулевой гипотезы о совпадении наблю
даемой (выборочной) и ожидаемой (популяqионной) частот
может быть осуществлена следующим способом:
1) необходимо вычислить стандартную ошибку т для пред
Р
полагаемого (ожидаемого) популяqионного значения в данной
выборке по формуле:
тр=JPP(l:Pp) '
где п - число наблюдений (объектов исследования) в выборке;
Р - относительная частота (распространенность) изучаемого
р
состояния в популяqии;
2) вычислить значение z-статистики критерия (с учетом по
правки на аппроксимаqию биномиального распределения нор мальным) по формуле:
IP-PР1-_2!п_
z=---~~
тр
где Р - относительная частота, наблюдаемая в выборке;
3) воспользоваться "Вероятностным калькулятором" (рис. 11.1)
для вычисления значения р по значению z в qелях проверки нуле
вой гипотезы о том, что наблюдаемая в выборке относительная
частота и популяqионная относительная частота не различаются.
159