Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных

.pdf
Скачиваний:
9
Добавлен:
24.03.2024
Размер:
15.15 Mб
Скачать

Статистический анализ медицинских данных ...

8.5. Сравнение трех связанных

(зависимых) групп и более

(непараметрический метод Фридмена)

Задача. Сопоставить значения признака на разных этапах

динамического исследования.

Пример: сравнить значения вязкости крови на трех этапах ле­ чения препаратом, улучшающим реологические свойства крови.

Решение. Необходимо сопоставить значения одного и того

же признака в разные моменты времени, т.е. сопоставить не груп­

пы участников исследования, а одних и тех же участников иссле­

дования в разные моменты времени (повторные наблюдения, представленные в разных столбIJах таблиIJЫ данных). Для этого в

ППП STAТISТICA предлагаются следующие про1Jедуры непара­

метрического дисперсионного анализа:

-ранговый дисперсионный анализ по Фридмену1 :

-вычисление коэффи1Jиента конкордаIJИИ Кендалла2• Этот ко-

эффи1Jиент часто используется таюке для решения о том, на­

сколько согласованы оgенки экспертов.

При использовании данного статистического критерия про­

веряется нулевая статистическая гипотеза об отсутствии разли­ чий групп. Если нулевая гипотеза отклоняется, то следует при­

нять альтернативную гипотезу о существовании различий групп.

Условия применимости метода. Анализируемые призна­ ки должны быть количественными (с любым видом распределе­ ния).

STАТISТICA:

~ Модуль "Непараметрические статистики"

( "Nonparametrics/Distrib.")

~ Про1Jедура "Фридмана ANOVА и конкордаqия Кендалла" ("Friedman ANOVA & Kendall's concordance")

В открывающемся диалоговом окне необходимо указать со­ поставляемые признаки ( столбIJЫ таблиIJЫ данных), а затем "ы­ полнить анализ. Будет выведено окно результатов (рис. 8.17).

1Friedшan ANOVA (анrл.).

2Keпdall's concordaпce (англ.).

132

Статистический анализ медицинских данных ...

Глава 9. Описание качественных

признаков

Как уже упоминалось ранее, качественные признаки (пере­

менные, данные) могут быть номинальными (иногда использует-

ся термин "номинативные") , в том числе бинарными, и поряд-

ковыми.

Номинальными называются признаки, значения которых представляют собой условные коды неизмеряемых категорий

(например, коды пола или коды диагноза). Значения таких при­

знаков не могут быть упорядочены по какому-либо семантиче­

скому принчипу.

Порядкобыми (ранzобыми) называются признаки, значе­ ния которых отражают степень выраженности какой-либо ха­ рактеристики объекта исследования (например, стадии заболе­ вания, степени выраженности симптома). При этом в отличие

от количественных признаков "расстояния" между значениями

порядковых признаков не могут быть оченены с помощью ка­ кой-либо известной шкалы, однако все же значения порядкового признака могут быть упорядочены (ранжированы). Порядковые

признаки являются качественными (иногда их называют "полу­ количественными") оченками какой-либо характеристики.

Все объекты исследования выборки могут быть разделены на подгруппы в соответствии со значениями любого из имеющихся

качественных признаков, например, по полу. Число объектов ис­

следования с определенным значением качественного признака

называется абсолютной частотой. Кроме абсолютных частот

широко используются и относительные частоты. Относитель­ ная частота - это отношение числа объектов с каким-либо значением признака к объему числу объектов.

Анализ качественных данных начинается с простейшего под­

счета абсолютных и относительных частот для каждого значения

(градачии) такого признака. Если объекты исследования в груп­

пе распределяются в соответствии со значениями двух качествен­

ных признаков, то строят прямоугольные таблиgы сопряженно­

сти, или табличы кросстабулячии (рис. 9.1).

134

 

Глава 9. Описание

качественных признаков

Конституция

Мужчины

Женщины

Астеники

5

8

Нормостеники

25

30

Гиперстеники

12

11

Рис. 9.1. При.мер таблицы сопряженности признаков пола и кон­

ституции.

В ячейках таблиgы указаны количества объектов исследования, соот­ ветствующих различным сочетаниям значений признаков (абсолютные частоты).

В общем случае при наличии нескольких качественных при­

знаков для анализа взаимосвязи между отдельными парами каче­

ственных признаков ётроятся таблиqы сопряженности для всех

возможных пар таких признаков.

Если число качественных признаков, по значениям которых

распределяются объекты исследования выборки, равно трем и боль­ ше, то возможно построение таблиq сопряженности с тремя ося­ ми в многомерном пространстве признаков и более. Для анализа

таких таблиq используют достаточно сложные методы статистиче­

ского анализа, такие как логлинейный анализ, логистическая рег­ рессия, анализ деревьев классификаqий и т.д. Эги методы в на­ стоящем издании не описываются, так как представляют собой достаточно сложные статистические задачи. Следует помнитъ, од­ нако, что при увеличении числа признаков, по которым табулиру­ ются объекты исследования, абсолютные частотъ1 в ячейках табли­

qы резко уменьшаются, а, следовательно, становится меньше шан­

сов получатъ надежные статистические выводы при анализе таких

таблиq.

Для порядковых признаков имеет смысл вычислять парамет­

ры распределения - медиану, моду, квартили.

Для номинальных признаков qелесообразнее представление в виде относительных частот объектов исследования.

Для признаков бинарного типа ( т.е. имеющих только два

значения - "да" и "нет", часто такие признаки называют еще

дихотомическими) - представление в виде относительной час­ тоты (доли, пропорqии) и ее доверительного интервала.

Дальнейший анализ качественных признаков состоит обычно

в сопоставлении соответствующих частот в исследуемых группах

135

Статистический анализ медицинских данных ...

или сравнении параметров распределения. Эго может быть про­

верка гипотез о равенстве медиан в сравниваемых группах или

сравнение долей (пропорций) в этих группах. Методы сравне­ ния групп по качественным признакам описаны в главах 10 и 11.

Замечание. Частой ошибкой исс.ледоfJате.лей яfJляется анализ порядкоfJых данных (имеющих небольшое чис.ло до­

пустимых значений) как ко.личестfJенных. ДfйстfJите.льно, никому не может прийти (J 20.лofJy fJычис.лить средний по.л, который яfJляется качестfJенным номинальным признаком, (J

изучаемой fJы.борке, но очень часто fJычис.ляют, например, сред­ ний ба.л.л, ее.ли какой-.либо качестfJенный порядкоfJый признак

измеряется (J ба.л.лах по какой-.либо шкале (например, 5-ба.л.ль­

ной), хотя это не меньшая бессмыслица. Ведь для качестfJен-

ных данных не опреде.лено "расстояние" между значениями

порядко8020 признака, поэтому интерпретироfJать промежу-

11wчные ( дробны.е) значения неfJозможно (см. так.же z.лafJy 2). Наиболее распространенной ошибкой (J этом с.лучае яfJ­

ляется испо.льзоfJание t-критери.я Стьюдента для сраfJнени.я

средних (J zруппах. Мноzочис.ленны.е примеры таких ошибок

читатели моzут найти (J Интернете по адресу Ьttp:// www.doktor.ru/doctor/Ьioтetr/kk/iпdex.IJtm

Следует также отметить, что в современной статистике раз­ работаны, а в ряде статистических пакетов и реализованы специ­

альные методы оцифровки качественных признаков [20].

Тем не менее, как уже упоминалось в главе 2, при достаточно большом числе возможных значений качественного порядкового

признака (обычно приближающемся к 20) на практике для ана­

лиза таких признаков могут применяться те же непараметриче­

ские методы, что и для количественных признаков.

Пример: Скандинавская шкала оценки неврологического де­ фицита при инсульте имеет минимально возможное значение О, максимальное значение 60. В подобных случаях принято

применять те же методы анализа, что и для количественных

признаков (предварительно анализируя, как обычно, вид рас­

пределения).

Существуют следующие основные способы описания качест­

венных данных:

-вычисление параметров распределения качественных данных

-моды (для номинальных данных), медианы, моды и квартилей (для порядковых данных);

136

Глава 9. Описание качественных признаков

- вычисление абсолютных и относительных частот ( пропор­

ций, долей, процентов) и доверительных интервалов для них.

9. 1. Вычисление параметров

распределения качественных признаков

Для описания распределения качественных номинальных при­

знаков можно использовать единственный параметр. Эrим пара­

метром (параметром положения) является мода (Мо) - наи­

более часто встречающееся на данной выборке, типичное для нее

значение номинального признака.

Моду также можно вычислять и для качественных порядко­ вых признаков. Вычисление других параметров распределения

возможно только для порядковых признаков (но не номиналь­ ных!):

-медиана (Ме) - центральное значение признака в выбор­

ке, слева и справа от которого расположены равные количе­

ства объектов исследования;

-проIJенти.ли распределения, в том числе нижний квар­

тиль ( LQ, или Q1) и верхний квартиль ( UQ, или Q)1 -

для характеристики рассеяния в выборке.

Вычисление этих параметров можно осуществить с использо­

ванием следующей процедуры пакета.

STAТISTICA:

--+Модуль "Непараметрические статистики"

("Nonparametrics/Distrib.")

--+ Процедура "Обычные описательные статистики

(медиана, мода... )" "Ordinal descri ptive statistics (median, mode... )"

Медиану и квартили также можно рассчитать, используя дру­ гой модуль пакета.

STATISТICA:

--+ Модуль "Основные статистики и таблиgы"

("Basic statistics/TaЬles") (см. рис. 7.1)

1 Напомним, что нижний квартиль отсекает 25% объектов с наименьшими значе­ ниями признака, а верхний квартиль - 25% объектов с наибольшими значениями

признака.

137

Статистический анализ медицинских данных ...

~ Подмодуль "Описательные статистики"

("Descriptive statistics") (см.·рис. 7.2)

~ Кнопка "Другие статистики"

( "More statistics")

~Окно выбора необходимых

статистик(см. рис. 7.6)

Рекомендуемое представление результатов. Привести следующую информаgию:

-для номинального признака - значение моды;

-для порядкового признака - значение медианы и квартилей

в формате Ме (LQ; UQ) или значение моды и квартилей в

формате Мо (LQ; UQ).

9.2. Вычисление абсолютных

и относительных частот (долей, процентов, вероятностей, шансов)

Часто задачей исследования является подсчет числа объектов

исследования (абсолютной частоты) или их доли (относительной

частоты) в исследуемой выборке, соответствующей значению ка­

кого-либо признака. Иными словами, необходимо ответить на вопрос: сколько больных (абсолютное число, абсолютная часто­ та) или какая доля, проgент от общего числа больных (относи­ тельная частота) характеризовались тем или иным значением

признака.

Абсолютная частота признака - это количество объек­

тов исследования в группе, имеющих данную характеристику

(значение признака).

Относительная частота признака (распространен­ ность) - это доля объектов исследования в группе, имеющих

данную характеристику (значение признака) по отношению к общему числу наблюдений (объектов исследования) в группе. Выражается обычно в десятичных долях единиgы (например, 0,3) или проgентах (например, 30%).

В современной литературе таюке широко используются по­

нятия "пропорgия", "доля", "вероятность" и "шанс". Послед­

ний термин применяется преимущественно по отношению к

бинарным данным.

138

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение