Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных

.pdf
Скачиваний:
6
Добавлен:
24.03.2024
Размер:
15.15 Mб
Скачать

О.Ю. Реброва

Статистический анализ

медицинских данных

Применение пакета

прикладных программ STATISTICA

!М Издательство Медиа Сфера

Москва

2002

УДК 616:519.2

ББК 519

р 31

О.Ю. Реброва. Статистический анализ медицинских

данных. Применение пакета прикладных программ

STATISTICA

М., МедиаСфера, 2002. 312с.

В книге в контексте концепции доказательной медицины пред­

ставлены наиболее актуальные методы статистического анали­ за медицинских данных, способы корректной интерпретации

результатов статистического анализа, современные междуна­

родные требования к представлению результатов статистиче­

ского анализа в статьях и диссертациях.

Книга рассчитана на проводящих научные исследования меди­

ков и биологов, аспирантов и студентов, заинтересованных в

освоении методов статистики в научных исследованиях.

Научное и учебное издание Редактор М.Н. Соловова

STATISTICд®- зарегистрированный товарный знак StatSoft lnc. (USA).

MS Windows, MS Word, MS Excel - зарегистрированные товарные зна­ ки Microsoft (USA)

© 0.Ю. Реброва, 2002

ISBN 5-89084-013-4 © Медиа Сфера, Москва, 2002 - оформление

Отпечатано в типографии ООО «Информnолиграф», Москва

Оглавление

Предисловие автора".""""""""""".."""""""""""""""""". 9

f Лава 1. Доказательная МедИIJИНа И планирование

научных исследований " ...........

"."...." ............

" .... 12

1.1.Основные понятия доказательной медиgины """" """""" """"". 12

1.2.Источники научно обоснованной медиgинской информаgии ". 16

1.3. Определение gели исследования """"""""""""""" """ "" """ """" 17

1.4.Планирование исследования .. ""."".""""""""""""""""".""".".". 18

1.4.1.Типы исследований """"".""""""""""."""""""""."""""""19

1.4.2.Достоверность и обобщаемость результатов

исследования ............................................................................

23

1.4.3.Систематические и случайные ошибки""""""""""""""". 25

1.5.Некоторые вопросы планирования клинических

испытаний .. "". ". "." """" ".. ". """" "". ".. """. "." ". "." ". "." ". "."" """ 29

1.5.1.Виды структуры клинических испытаний"""""".""."""". 29

1.5.2.Распределение участников по группам

в рандомизированных клинических испытаниях""""""". 30

1.5.3.Маскирование вмешательства""""""."""""""""."".""."". 34

rлава 2. Типы данных"."""""""""""""""""""""""""""". 36

Глава 3. Подготовка данных к статистическому

анализу .....................

" .....................

"...........

"...." ......

40

3.1.Подготовка первичных данных".""""""""."""""""""""""""""" 42 3.1.1. Оgенка точности данных "" """ """" """"""".""" """ ".""". 42

3.1.2. Предварительные расчеты "".""."""""""""""""""""".""" 43

3.1. 3. Идентификаgия участников (объектов)

исследования ..................

"......

"..............

"..............................

" 44

3.1.4.Пропущенные (отсутствующие) значения данных """""44

3.1.5.Данные динамических исследований".".".""."."""."."""" 45

3.1.6.Данные для анализа времени до наступления

исхода ........................................................................

" .. "..........

46

3.1.7.Проверка данных"""""""""""""""""""""""""""""""""" 47

3.1.8.Перенос данных, подготовленных в других

программах, в таблиlJУ данных пакета прикладных

программ STATISTICA ..........

"......"""""..."."""".".""".."49

3.2. Подготовка вторичных данных """""""""""""""""""""""""""" 50

Глава 4. Управление данными. и. сохранение

результатов анализа в пакете

прикладных программ STАТISТICA """""".""" 52

4.1.Огбор строк табли!JЫ данных по условию"""""""""""""""""". 52

4.2.Формирование подгрупп (разделение файлов)"""""""""""""". 53

4.3.Объединение файлов""."."."".. ""."."."""""""".".""""."."".".""" 54

4.4.Оперщии со столбIJаМИ """""""""""""""""""""""""""""""""" 55

4.5.Оперщии со строками""""""""""""""""""""""""""""""""""" 57

4.6.Сохранение результатов статистического анализа """""""""""" 58

Глава 5. Основные при.нqи.пы и. методы

статистического анализа""""""""""""""""""".60

5.1.Описательная статистика и статистическая О!Jенка """""""""". 60

5.2.Проверка статистических гипотез "" "" """"""" """ """"""""""". 64

5.3.Статистическое моделирование."."."""""""".""""."""".".""""" 69

5.4.Статистическая и клиническая значимость полученных

результатов ...........................................................................................

69

5.5.Первичный и вторичный анализ данных""""""""""""""""""". 70

5.6.Классифика!JИЯ статистических методов"""""""""""""""""""" 71

Глава 6. Методы статистического анализа,

содержащиеся в пакете прикладных

программ STATISTICA """""""""""""""""""""" 75

Глава 7. Описание количественных признаков".."""". 77

7.1. Анализ соответствия вида распределения признака

закону нормального распределения """ """" """" """""" "" """"". 77 7.2. Описание количественных данных в зависимости

от вида их распределения"""""""""""""""""""""""""""""""". 83

7.3.Некоторые частные аспекты представления

количественных данных "". ". "." ". "." """".". "." "" "". ". ". ". ".... " " .. 92

7.3.1.Точность представления описательных статистик

количественных данных .". "." ". "." ".. "." ". "."."."." ".. " ". "." 92

7.3.2.Данные связанных групп""""""""""""""""""""""""""". 92

7.3.3.Преобразование количественных данных"""""""""".""" 93

7.3.4.Описание данных, полученных в малых выборках"""""" 94

7.3.5.Анализ выпадающих данных"""".".""."."."""""".".""""" 94

rлава 8. Сравнение групп по количественному

признаку ....................

"."...................

"..............

" ...." 96

8.1.Сравнение одной группы с популяgией ."."".""""".".""""""""" 98

8.1.1.Случай нормально распределенного признака"""""".""" 98

8.1.2.Случай любого распределения признака ".""".""""""."""100

8.2.Сравнение двух независимых (несвязанных) групп""""."".""" 101

8.2.1.Доверительный интервал для разности средних"""""""" 102

8.2.2.Параметрический метод (t-критерий Стьюдента

для независимых групп) ........................................................

104

8.2.3.Непараметрические методы (критерии Манна-Уитни, Вальда-Вольфовиgа,

Колмогорова-Смирнова)""."".""""."."."".""".""""."."" 109

8.3. Сравнение двух зависимых (связанных) групп .". """.""."".". "" 111

8.3.1.Доверительный интервал для средней разности """"""""112

8.3.2.Параметрический метод (t-критерий Стьюдента

для зависимых групп) """"""""""."".".""."""""."."""""" 114

8.3.3.Непараметрические методы (критерий знаков,

критерий Вилкоксона) ".""""" """ """" """." """"."."" "."" 116

8.4.Сравнение трех независимых (несвязанных) групп

иболее "."."""".""""""."".""" .. """" .. ""."".""""" .. "".".".""".".".118

8.4.1.Параметрический дисперсионный анализ ".".".""."."""."119

8.4.1.1.Проверка гипотез о равенстве дисперсий """""" 120

8.4.1.2.Собственно дисперсионный анализ""""""""""". 122

8.4.1.3.Апостериорные сравнения групп ".""."."""."""".125

8.4.2.Непараметрические методы сравнения независимых групп (метод Краскела-Уоллиса,

медианный тест)""""".""""""."."".. "".""."""""."."" .. """ 129

8.5.Сравнение трех связанных (зависимых) групп

иболее (непараметрический метод Фридмена)"""""""""."."". 132

Глава 9. Описание качественных признаков ..""" """""134

9.1. Вычисление параметров распределения

 

качественных признаков ...................................................................

137

9.2.Вычисление абсолютных и относительных частот

(долей, проgентов, вероятностей, шансов) .""."."""."""".""""" 138

9.3. Описание относительной частоты бинарного

 

признака с использованием доверительного

 

интервала .............................................................................................

142

Глава 10. Сравнение групп по качественному

признаку".""""""".".""""""".""..""""""."""."". 145

10.1. Сравнение наблюдаемых и ожидаемых частот (анализ

одной группы) ".""".""""."".""""""."""."."""".".".""."."""".". 146 10.2. Сравнение двух групп и более".""."""""."."""".""."".""""."." 148

Глава 11. Сравнение групп по качественному

бинарному признаку ""."..""."""""...""""."".". 157

11.1.Сравнение выборочной относительной частоты

с популяgионной """ .. """ "" ". "". "."." """ ".. "" ".. ". "." "."." """ ".. 158

11.1.1.Сравнение доверительного интервала для выборочной относительной частоты

спопуляgионной "" """" "" """" "". ".. "". """" "."." """. "." 158

11.1.2.Проверка гипотез (<:-критерий) """"".""."""""."""""" 159

11.1.3.Проверка гипотез (критерий ;(2 ) """""""""""""" . """" 161

11.2.Сравнение относительных частот внутри одной

группы и в двух группах"" """""""."""""."".""" "."""". """" "." 162

11.3. Сравнение частот бинарного признака в двух несвязанных (независимых) группах

(анализ таблиg 2х2) ."."""""" .. "."".""""."."".".".""."."."".".""166

11.3.1. Доверительный интервал для разности

относительных частот"""""""."."."""""."."."."".""""."." 171 11.3.2. Доверительный интервал для относительного риска "." 173 11.3. 3. Доверительный интервал для отношения шансов """"" 175

11.3.4. Проверка гипотез (точный критерий Фишера,

;( 2 с поправкой Йетса) """""""""""."".""""""""."."""" 176

11.4. Сравнение частот бинарного признака в двух

связанных (зависимых) группах наблюдений

(случай парных наблюдений)""""""""""""."."""""."".""".""" 180 11.4.1. Доверительный интервал для разности

относительных частот""."."." ". ". "." """ ". ". ". "." """ ". "." .. 181

11.4.2.Проверка гипотез (критерий МакНемара) """""".""".183

11.5.Сравнение трех групп и более по бинарному

признаку""""""."."""."""".".""."".""""".. " ... ".""."."""" .. """"" 183

11.5.1.Случай неупорядоченных групп""."""""""""."".""""""184

11.5.2.Случай упорядоченных групп""."""".""""""""""""""". 184

Глава 12. Анализ связи (корреляции, ассоциации)

двух признаков """""""."""""."".."""""""""." 185

12.1.Параметрический метод (метод Пирсона) """""""""""""""".188

12.2.Непараметрические методы (методы Спирмена,

Кендалла, гамма) .. """ .. ""."." ... "....... "" ... "."."." ... ".""."".".""." .. 191

12.3.Доверительный интервал для коэффиIJиента

корреляIJИИ ........................................................................................

194

12.4. Сравнение двух коэффиIJиентов корреляIJИИ """"""""""""""" 195

Глава 13. Многофакторный анализ данных """"""""""198

13.1. Многофакторный параметрический

 

дисперсионный анализ ....................................................................

199

13.2. Дискриминантный анализ """".""""""."."""""."".""""".""""" 202

13. 3. Кластерный анализ ...........................................................................

207

13.4.Анализ главных компонент и факторный анализ"""".""""""" 208

13.5.Многофакторный анализ объектов исследования

с пропущенными значениями ........................................................

208

13.6. Проверка работоспособности многофакторных моделей""""" 210

Глава 14. Анализ вида зависимости одного

признака от одного или нескольких

признаков (регрессионный анализ) """"""""211

14.1.Линейный регрессионный анализ"""""""."".""""".""""""."". 213

14.2.Логистическая регрессия как один из методов

нелинейного регрессионного анализа".""""""""""""""""".""" 221

Глава 15. Некоторые общие проблемы

и частные задачи статистического

анализа""""""."....""""""""."""""."".""""""""" 227

15.1.Проблема множественных сравнений""""."."... ""."""."."" .. "" 227

15.2.Определение интервала нормы (референтного

интервала) для количественного признака"".""".""."."."".""". 230

15.3.Определение необходимых объемов выборок

при планировании исследования. Статистическая

мощность (чувствительность) исследования ""." """"""""."."". 234

15.4.Анализ времени до наступления исхода"."""""""""""""""""" 238

15.4.1.Анализ вероятности наступления изучаемого исхода

вопределенный период времени (выживания) """"".". 240

15.4.2.Исследование влияния одного фактора

на время до наступления изучаемого исхода """" .". "."". 243

15.4.3.Анализ влияния нескольких факторов на время до наступления изучаемого исхода """""""""" """" """". 246

15.5.Анализ точности диагностического метода""""""""""""""""" 247

15.5.1.Операционные характеристики диагностического

метода ................

"....................................................................

247

15.5.2. Анализ согласованности независимых

диаrnостических заключений""""""""""""""""""""""". 251

Глава 16.

Объединение результатов нескольких

 

 

исследований (мета-анализ) ..............................

254

Глава 17.

Современные требования к описанию

 

 

в публикациях процедуры и результатов

 

 

статистического анализа медико-

 

 

биологических данных.........................................

261

17.1.Рекомендации по разделу "Введение"""""""""""""""""""""" 262

17.2.Рекомендации по разделу "Материальr и методы" """""""""" 262

17.3.Рекомендации по разделу "Результаты" .""""""""""""""""""" 265

17.4.Рекоменда!JИИ по разделу "Обсуждение" ." .. ""."" ...... "."".""" .. 268

17.5.Описание ограничений исследования""""."""""""".""".""."." 269

17.6.Рекомендации по разделу "Выводы" """"""""."."".".""""."."" 269

Литература ............

""................................................................

 

270

Приложение 1.

Аннотированный список рекомендуемой

 

 

литературы на русском языке."."."""".""."."""" 272

Приложение 2.

Список рекомендуемой литературы

 

 

 

на английском языке"."."."".".""""""""."""""". 285

Приложение 3. Ранги, с помощью которых вычисляется

 

 

доверительный интервал для медианы

 

 

распределения"""."".. """.".""""""""""" .. ""."."" 286

Приложение 4.

Нижние и верхние rранИIJЫ 95°!0 доверительных

 

интервалов для относительных частот,

 

 

представленных в виде простых дробей"""".".". 290

Толковый словарь терминов ...............................

".....".......

:294

Предисловие автора

Тот, кто не знает математики, не может узнать

никакой другой науки и даже не может

обнаружить своего невежества, а поэтому

не ищет от него лекарства.

Р. Госкон

Наука начинается тогда, когда человек

подходит к явлениям природы с числом

и мерою.

В.И. Вернадский

Предлагаемая книга является руководством по применению

статистики в медичинских - клинических и эпидемиологиче­

ских - исследованиях. Описываемый подход основан на исполь­ зовании пакета прикладных программ (ППП) STAТISТICA фир­

мы StatSoft Inc. (США) для персонэ!\Ьного компьютера, однако

изложенные принчипы применения статистики универсальны и

могут применяться при использовании любых пакетов статисти­

ческих программ.

Для чтения книги знание основ математической статистики является желательным, но не обязательным. Тем же, кто знаком

с основами статистики, книга поможет рсвоить технологию ана­

лиза данных с использованием ППП STATISТICA. Книга снаб­ жена списками дополнительной литературы (см. Приложения 1 и 2), которой читатель может воспользоваться при желании глубже

освоить те или иные методы статистики.

Довольно широко распространено мнение, что необходимость анализа данных в биологических экспериментальных исследова­

ниях отсутствует: "если требуется анализ данных, это значит, что сам эксперимент плох" (в том смысле, что фиксируемый эффект

незначителен). Однако применение статистики в медичинских и

биологических исследованиях не ограничивается анализом дан­

ных. Статистические методы следует использовать таюке на эта­

пе планирования биологического эксперимента или медичинско­ го исследования. Мы придерживаемся мнения, что и в биологи­ ческом эксперименте для анализа данных необходимо примене-

9

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение