5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных
.pdfСтатистический анализ медицинских данных ...
- Если объем выборки больше 100 объектов исследования, то проgент указывается не более чем с одним разрядом десятич ной дроби.
Замечание. Модуль "Табмщы частот" ("Freqиeпcy Tables") можно испо.льзо6ать только для построения одномер ных таблиц частот, т.е. для построения таблиц частот
отдельно для каждою признака.
9.3. Описание относительной частоты бинарного признака с использованием
доверительного интервала
В современной научной литературе относительные частоты
бинарных признаков - "событий" (т.е. признаков, имеющих
только два возможных значения - "да" и "нет") - принято
приводить вместе с указанием их ДИ.
Напомним, что ДИ - это интервал, в котором с некоторой
вероятностью (например, 95% в случае 95% ДИ) находится
истинное популяgионное значение. Граниgы ДИ вычисляют на основании анализа данных выборки.
Задача: оgенить популяgионное значение относительной час
тоты какого-либо состояния по данным выборки.
Пример: благоприятный результат стереотаксической опе
раgии наблюдается у 67% больных идиопатическим паркинсо
низмом в изучаемой выборке. Возникает вопрос: какой проgент благоприятных результатов будет наблюдаться при применении данной операgии у паgиентов данной категории в другой ана логичной клинике, другим врачом подобной квалификаgии и
т.д. (т.е. в общей популяgии таких больных)? Понятно, что в
общей популяgии будет наблюдаться определенный разброс в результатах этого метода лечения. Вычислить граниgы этого раз броса на основании собственных данных - и означает опреде
лить граниgы ДИ.
Решение: ДИ определяется, как всегда в статистике, с опре
деленной долей уверенности. Обычно используют коэффиgиент
доверительной вероятности 95%, но можно использовать 90%, 99% и др. При этом с соответствующей долей уверенности мож
но считать, что истинное популяgионное значение находится в
граниgах такого ДИ.
142
Глава 9. Описание качественных признаков
Замечание. Вычисление границ ДИ для бинарного при
знака - достатоцно сложная задача. Существует несколь
ко способов ее решения (см., например, [21, 22]). К сожалению,
в ППП STAТISТICA не содержится программы для вычисления
таких ДИ.
Поэтому в Приложении 4 мы приводим таблиgу с точно вы численными rраниgами ДИ, а таюке математическое описание одного из простых способов вычисления rраниg ДИ для бинар
ного признака.
Условия применимости метода. Использование значений t-критерия в описанной ниже формуле возможно в случае одно
временного выполнения следующих условий:
пР~5,
-п(1-Р) ~5,
-0,3 s;p s;0,7,
где Р - относительная частота события, выраженная десятичной дробью, п - общее число объектов исследования в выборке. Пе речисленные ограничения применимости метода связаны с необ ходимостью обоснования использования нормальной аппрокси
маgии биномиального распределения (21, 23].
Если указанные условия не выполняются, то следует поль
зоваться более сложными формулами, которые мы в данном издании не приводим, либо таблиgей, приведенной в Прило жении 4.
При вычислении соответственно верхней и нижней rраниg
ДИ для относительной частоты бинарного признака (доли) можно
использовать следующую приближенную формулу:
P±tx[JP(l-P) +....!....)
п 2п '
где Р - относительная частота события, выраженная десятичной дробью, п - общее число объектов исследования в выборке, t - значение t-критерия, соответствующее объему исследуемой вы
борки и ДК {95, 90 или 99°1о), обычно принимается приближен-
но равным 1,96 для 95°1о ДИ, 2\п - поправка на непрерывность,
компенсирующая ошибку, возникающую при аппроксимаgии биномиального распределения нормальным.
143
Статистический анализ медицинских данных ...
Точное значение t для конкретного случая можно узнать, вос
пользовавшись опqией "Вероятностного калькулятора":
STАТISТICA:
~Модуль "Основные статистики и таблиqы"
( "Basic statistics/TaЬles")
~Подмодуль "Вероятностный калькулятор"
( "ProbaЬility calculator")
Вдиалоговом окне (см. рис. 7.9) необходимо выполнить следую
щее:
-выбрать вид распределения "t Стьюдента" ("Student t test");
-выбрать опqии "Обратная ф.р. " , ",u,nА~ усторонняя" ( "Тwo-s1'd-
ed") и "1-ф.р.";
-задать число степеней свободы "Ст. св." ( "df'), dj=п-1;
-задать значение р (например, 0,05 для вычисления rраниq
95% ДИ);
-нажать кнопку "Вычислить" ("compute") .
Искомое значение t появится в окне "t".
Интерпретаqия результата. С определенной долей уверен ности (соответствующей ДК) можно утверждать, что истинное
популяqионное значение лежит в rраниqах вычисленного ДИ.
Замечание. Особыми являются ситуации, когда Р=О,00 и.ли Р= 1,00. При Р=О,00 бычисляется только верхняя грани ца АИ, Р= 1,00 - только нижняя граница АИ. В этих случаях ширина АИ будет больше (на 2,5% для 95% АИ, на 0,5% для
99% АИ, на 5% для 90% ДИ), так как неопределенности в
одном из направлений не сущест8ует. В этих ситуациях не следует пользоваться приведенной формулой, а рекомендует
ся воспользоваться таблицей, при8еденной в При.ложении 4. Она содержит бо.лее то•то рассчитанные 95% АИ.
144
Глава 10. Сравнение групп
по качественному признаку
Выбор метода сравнения групп по качественному признаку
зависит от типа этого признака, количества и связанности сопос
тавляемых групп. Ниже перечислены сочетания этих факторов и
ссылки на соответствующие методы и разделы настоящего изда
ния:
-признак бинарный (имеет только два возможных значе ния) - методы для анализа таких признаков описаны в главе 11.
-признак номинальный (имеет три неупорядоченных зна чения и более) - тест Х2 (применяется для всех перечисленных
ниже елучаев):
-сравнение наблюдаемых и ожидаемых частот (анализ одной группы; см. раздел 10.1);
-сравнение двух групп и более (см. раздел 10.2);
признак порядковый (имеет три упорядоченных значения
иболее);
-сравнение наблюдаемых и ожидаемых частот (анализ
одной группы; см. раздел 10.1);
сравнение двух несвязанных групп;
-тесты Манна-Уитни, Вальда-Вольфовиqа,
Колмогорова-Смирнова (см. раздел 8.2.3);
-критерий Х2 (см. раздел 10.2);
сравнение двух связанных групп;
-критерий Вилкоксона, критерий знаков (см. раздел
8.3.3);
-критерий Х2 (см. раздел 10.2);
-сравнение трех несвязанных групп и более;
-анализ вариаgий (ANOVA) по Краскелу-Уоллису
(см. раздел 8.4.2);
-критерий Х2 (см. раздел 10.2)
сравнение трех связанных групп и более;
-анализ вариаgий (ANOVA) по Фридмену (см. раздел 8.5);
-критерий Х2 (см. раздел 10.2).
145
Статистический анализ медицинских данных ...
Как можно заметить, для порядковых признаков во многих
случаях пригодны те же методы, что и для номинальных призна
ков. Однако помимо них для анализа порядковых данных можно
та1оке применять и непараметрические методы анализа, которые
используются и при анализе количественных данных. В связи с
этим мы привели выше отсылки к описанию соответствующих
непараметрических методов анализа в других главах и разделах
настоящего издания.
Таким образом, в данной главе мы рассмотрим наиболее уни версальный метод сопоставления групп по качественным призна
кам. В ППП STАТISТICA реализованы два способа применения
критерия х2:
-сравнение наблюдаемых и ожидаемых частот (анализ одной
группы);
сравнение двух групп.
Рассмотрим их последовательно.
1О.1. Сравнение наблюдаемых
и ожидаемых частот (анализ одной группы)
Задача: сравнить распределение частот значений номиналь ного или порядкового признака с ожидаемым (на основании априорных представлений) распределений частот.
Пример: известно, что в популяgии распределение геноти
пов 1, 11 и Ш следующее: генотип I - 10%, генотип 11 - 60%,
генотип Ш - 30%. В исследуемой выборке (300 человек, про
живающих на изолированной территории) наблюдается сле дующее распределение генотипов - у 54 человек (18%), у 171 человека (57%) и у 75 человек (25%) соответственно.
Требуется исследовать, отличается ли выборочное распределе
ние генотипов от популяgионного, или наблюдаемые колеба
ния случайны.
Решение: применение критерия Х2 для сравнения наблю
даемой и ожидаемой частот. Для реализаgии этого способа сна чала следует сформировать следующую таблиgу (рис. 10.1). Ожи
•Ааемые абсолютные частоты являются произведениями ожидае
мых относительных частот на объем выборки.
В нашем примере ожидаемые частоты вычисляются следую щим образом:
146
Глава 10. Сравнение групп по качественному признаку
группирующего и анализируемого. Таблиqа, содержащая такие абсолютные частоты, называется таблиqей сопряженности, или
таблиqей кросстабуляqии.
Таблица сопр.яженности. - это таблиqа, содержащая аб
солютные частоты для всех возможных сочетаний взаимоисклю
чающих значений анализируемых признаков. В принqипе табли
qа сопряженности может содержать различное количество строк
и столбqов. При этом строки таблиqы соответствуют значениям первого признака, а столбqы - значениям второго признака1 •
Таблиqа с двумя строками и двумя столбqами (так называе
мая таблиqа 2><2) является частным случаем таблиqы сопряжен ности и называется четырехпольной таблицей (так как содержит
четыре "поля "-ячеики..... ) .
Подчеркнем, что в ячейках таблиqы сопряженности могут
находиться лишь абсолютные частоты, т.е. количества объектов
исследования, но не относительные частоты (доли, проqенты),
средние значения и т.д.
Алгоритм, с помощью которого возможны построение и даль
нейший анализ таблиqы сопряженности, реализован в ППП STA- ТISTICA в следующем модуле.
STATISТICA:
-+ Модуль "Основные статистики и таблиqы"
("Basic statistics /ТаЫеs")
-+ Подмодуль "Таблиqы и заголовки" ("TaЬles and Banneгs") (рис. 10.4)
Для построения двумерной (прямоугольной) таблиqы сопря женности в открывшемся первом диалоговом окне (см. рис. 10.4)
сначала необходимо активизировать проqедуру "Задать таблиqы"
( "Specify taЬles"). При этом откроется второе диалоговое окно (рис. 10.5) для задания признаков для строк и столбqов, по ко
торым необходимо провести анализ. Как можно видеть, в ППП
предусмотрена возможность указания до 6 признаков для по строения таблиq сопряженности, однако рассмотрение таких таб-
1 Таблиgа сопряженности может быть не только двумерной (при анализе двух
признаков), но и трех-, четь1рехмерной и т.д. (если анализируются одновременно
три, четыре и т.д. признака соответственно). Рассмотрение сложных статистиче
ских методов анализа таких таблиg не входит в содержание данного издания.
149