Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных

.pdf
Скачиваний:
9
Добавлен:
24.03.2024
Размер:
15.15 Mб
Скачать

Статистический анализ медицинских данных ...

- Если объем выборки больше 100 объектов исследования, то проgент указывается не более чем с одним разрядом десятич­ ной дроби.

Замечание. Модуль "Табмщы частот" ("Freqиeпcy Tables") можно испо.льзо6ать только для построения одномер­ ных таблиц частот, т.е. для построения таблиц частот

отдельно для каждою признака.

9.3. Описание относительной частоты бинарного признака с использованием

доверительного интервала

В современной научной литературе относительные частоты

бинарных признаков - "событий" (т.е. признаков, имеющих

только два возможных значения - "да" и "нет") - принято

приводить вместе с указанием их ДИ.

Напомним, что ДИ - это интервал, в котором с некоторой

вероятностью (например, 95% в случае 95% ДИ) находится

истинное популяgионное значение. Граниgы ДИ вычисляют на основании анализа данных выборки.

Задача: оgенить популяgионное значение относительной час­

тоты какого-либо состояния по данным выборки.

Пример: благоприятный результат стереотаксической опе­

раgии наблюдается у 67% больных идиопатическим паркинсо­

низмом в изучаемой выборке. Возникает вопрос: какой проgент благоприятных результатов будет наблюдаться при применении данной операgии у паgиентов данной категории в другой ана­ логичной клинике, другим врачом подобной квалификаgии и

т.д. (т.е. в общей популяgии таких больных)? Понятно, что в

общей популяgии будет наблюдаться определенный разброс в результатах этого метода лечения. Вычислить граниgы этого раз­ броса на основании собственных данных - и означает опреде­

лить граниgы ДИ.

Решение: ДИ определяется, как всегда в статистике, с опре­

деленной долей уверенности. Обычно используют коэффиgиент

доверительной вероятности 95%, но можно использовать 90%, 99% и др. При этом с соответствующей долей уверенности мож­

но считать, что истинное популяgионное значение находится в

граниgах такого ДИ.

142

Глава 9. Описание качественных признаков

Замечание. Вычисление границ ДИ для бинарного при­

знака - достатоцно сложная задача. Существует несколь­

ко способов ее решения (см., например, [21, 22]). К сожалению,

в ППП STAТISТICA не содержится программы для вычисления

таких ДИ.

Поэтому в Приложении 4 мы приводим таблиgу с точно вы­ численными rраниgами ДИ, а таюке математическое описание одного из простых способов вычисления rраниg ДИ для бинар­

ного признака.

Условия применимости метода. Использование значений t-критерия в описанной ниже формуле возможно в случае одно­

временного выполнения следующих условий:

пР~5,

-п(1-Р) ~5,

-0,3 s;p s;0,7,

где Р - относительная частота события, выраженная десятичной дробью, п - общее число объектов исследования в выборке. Пе­ речисленные ограничения применимости метода связаны с необ­ ходимостью обоснования использования нормальной аппрокси­

маgии биномиального распределения (21, 23].

Если указанные условия не выполняются, то следует поль­

зоваться более сложными формулами, которые мы в данном издании не приводим, либо таблиgей, приведенной в Прило­ жении 4.

При вычислении соответственно верхней и нижней rраниg

ДИ для относительной частоты бинарного признака (доли) можно

использовать следующую приближенную формулу:

P±tx[JP(l-P) +....!....)

п 2п '

где Р - относительная частота события, выраженная десятичной дробью, п - общее число объектов исследования в выборке, t - значение t-критерия, соответствующее объему исследуемой вы­

борки и ДК {95, 90 или 99°1о), обычно принимается приближен-

но равным 1,96 для 95°1о ДИ, 2\п - поправка на непрерывность,

компенсирующая ошибку, возникающую при аппроксимаgии биномиального распределения нормальным.

143

Статистический анализ медицинских данных ...

Точное значение t для конкретного случая можно узнать, вос­

пользовавшись опqией "Вероятностного калькулятора":

STАТISТICA:

~Модуль "Основные статистики и таблиqы"

( "Basic statistics/TaЬles")

~Подмодуль "Вероятностный калькулятор"

( "ProbaЬility calculator")

Вдиалоговом окне (см. рис. 7.9) необходимо выполнить следую­

щее:

-выбрать вид распределения "t Стьюдента" ("Student t test");

-выбрать опqии "Обратная ф.р. " , ",u,nА~ усторонняя" ( wo-s1'd-

ed") и "1-ф.р.";

-задать число степеней свободы "Ст. св." ( "df'), dj=п-1;

-задать значение р (например, 0,05 для вычисления rраниq

95% ДИ);

-нажать кнопку ычислить" ("compute") .

Искомое значение t появится в окне "t".

Интерпретаqия результата. С определенной долей уверен­ ности (соответствующей ДК) можно утверждать, что истинное

популяqионное значение лежит в rраниqах вычисленного ДИ.

Замечание. Особыми являются ситуации, когда Р=О,00 и.ли Р= 1,00. При Р=О,00 бычисляется только верхняя грани­ ца АИ, Р= 1,00 - только нижняя граница АИ. В этих случаях ширина АИ будет больше (на 2,5% для 95% АИ, на 0,5% для

99% АИ, на 5% для 90% ДИ), так как неопределенности в

одном из направлений не сущест8ует. В этих ситуациях не следует пользоваться приведенной формулой, а рекомендует­

ся воспользоваться таблицей, при8еденной в При.ложении 4. Она содержит бо.лее то•то рассчитанные 95% АИ.

144

Глава 10. Сравнение групп

по качественному признаку

Выбор метода сравнения групп по качественному признаку

зависит от типа этого признака, количества и связанности сопос­

тавляемых групп. Ниже перечислены сочетания этих факторов и

ссылки на соответствующие методы и разделы настоящего изда­

ния:

-признак бинарный (имеет только два возможных значе­ ния) - методы для анализа таких признаков описаны в главе 11.

-признак номинальный (имеет три неупорядоченных зна­ чения и более) - тест Х2 (применяется для всех перечисленных

ниже елучаев):

-сравнение наблюдаемых и ожидаемых частот (анализ одной группы; см. раздел 10.1);

-сравнение двух групп и более (см. раздел 10.2);

признак порядковый (имеет три упорядоченных значения

иболее);

-сравнение наблюдаемых и ожидаемых частот (анализ

одной группы; см. раздел 10.1);

сравнение двух несвязанных групп;

-тесты Манна-Уитни, Вальда-Вольфовиqа,

Колмогорова-Смирнова (см. раздел 8.2.3);

-критерий Х2 (см. раздел 10.2);

сравнение двух связанных групп;

-критерий Вилкоксона, критерий знаков (см. раздел

8.3.3);

-критерий Х2 (см. раздел 10.2);

-сравнение трех несвязанных групп и более;

-анализ вариаgий (ANOVA) по Краскелу-Уоллису

(см. раздел 8.4.2);

-критерий Х2 (см. раздел 10.2)

сравнение трех связанных групп и более;

-анализ вариаgий (ANOVA) по Фридмену (см. раздел 8.5);

-критерий Х2 (см. раздел 10.2).

145

Статистический анализ медицинских данных ...

Как можно заметить, для порядковых признаков во многих

случаях пригодны те же методы, что и для номинальных призна­

ков. Однако помимо них для анализа порядковых данных можно

та1оке применять и непараметрические методы анализа, которые

используются и при анализе количественных данных. В связи с

этим мы привели выше отсылки к описанию соответствующих

непараметрических методов анализа в других главах и разделах

настоящего издания.

Таким образом, в данной главе мы рассмотрим наиболее уни­ версальный метод сопоставления групп по качественным призна­

кам. В ППП STАТISТICA реализованы два способа применения

критерия х2:

-сравнение наблюдаемых и ожидаемых частот (анализ одной

группы);

сравнение двух групп.

Рассмотрим их последовательно.

1О.1. Сравнение наблюдаемых

и ожидаемых частот (анализ одной группы)

Задача: сравнить распределение частот значений номиналь­ ного или порядкового признака с ожидаемым (на основании априорных представлений) распределений частот.

Пример: известно, что в популяgии распределение геноти­

пов 1, 11 и Ш следующее: генотип I - 10%, генотип 11 - 60%,

генотип Ш - 30%. В исследуемой выборке (300 человек, про­

живающих на изолированной территории) наблюдается сле­ дующее распределение генотипов - у 54 человек (18%), у 171 человека (57%) и у 75 человек (25%) соответственно.

Требуется исследовать, отличается ли выборочное распределе­

ние генотипов от популяgионного, или наблюдаемые колеба­

ния случайны.

Решение: применение критерия Х2 для сравнения наблю­

даемой и ожидаемой частот. Для реализаgии этого способа сна­ чала следует сформировать следующую таблиgу (рис. 10.1). Ожи­

•Ааемые абсолютные частоты являются произведениями ожидае­

мых относительных частот на объем выборки.

В нашем примере ожидаемые частоты вычисляются следую­ щим образом:

146

Глава 10. Сравнение групп по качественному признаку

группирующего и анализируемого. Таблиqа, содержащая такие абсолютные частоты, называется таблиqей сопряженности, или

таблиqей кросстабуляqии.

Таблица сопр.яженности. - это таблиqа, содержащая аб­

солютные частоты для всех возможных сочетаний взаимоисклю­

чающих значений анализируемых признаков. В принqипе табли­

qа сопряженности может содержать различное количество строк

и столбqов. При этом строки таблиqы соответствуют значениям первого признака, а столбqы - значениям второго признака1

Таблиqа с двумя строками и двумя столбqами (так называе­

мая таблиqа 2><2) является частным случаем таблиqы сопряжен­ ности и называется четырехпольной таблицей (так как содержит

четыре "поля "-ячеики..... ) .

Подчеркнем, что в ячейках таблиqы сопряженности могут

находиться лишь абсолютные частоты, т.е. количества объектов

исследования, но не относительные частоты (доли, проqенты),

средние значения и т.д.

Алгоритм, с помощью которого возможны построение и даль­

нейший анализ таблиqы сопряженности, реализован в ППП STA- ТISTICA в следующем модуле.

STATISТICA:

-+ Модуль "Основные статистики и таблиqы"

("Basic statistics /ТаЫеs")

-+ Подмодуль "Таблиqы и заголовки" ("TaЬles and Banneгs") (рис. 10.4)

Для построения двумерной (прямоугольной) таблиqы сопря­ женности в открывшемся первом диалоговом окне (см. рис. 10.4)

сначала необходимо активизировать проqедуру "Задать таблиqы"

( "Specify taЬles"). При этом откроется второе диалоговое окно (рис. 10.5) для задания признаков для строк и столбqов, по ко­

торым необходимо провести анализ. Как можно видеть, в ППП

предусмотрена возможность указания до 6 признаков для по­ строения таблиq сопряженности, однако рассмотрение таких таб-

1 Таблиgа сопряженности может быть не только двумерной (при анализе двух

признаков), но и трех-, четь1рехмерной и т.д. (если анализируются одновременно

три, четыре и т.д. признака соответственно). Рассмотрение сложных статистиче­

ских методов анализа таких таблиg не входит в содержание данного издания.

149

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение