5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_медицинских_данных_Применение_пакета_прикладных
.pdfО.Ю. Реброва
Статистический анализ
медицинских данных
Применение пакета
прикладных программ STATISTICA
!М Издательство Медиа Сфера
Москва
2002
УДК 616:519.2
ББК 519
р 31
О.Ю. Реброва. Статистический анализ медицинских
данных. Применение пакета прикладных программ
STATISTICA
М., МедиаСфера, 2002. 312с.
В книге в контексте концепции доказательной медицины пред
ставлены наиболее актуальные методы статистического анали за медицинских данных, способы корректной интерпретации
результатов статистического анализа, современные междуна
родные требования к представлению результатов статистиче
ского анализа в статьях и диссертациях.
Книга рассчитана на проводящих научные исследования меди
ков и биологов, аспирантов и студентов, заинтересованных в
освоении методов статистики в научных исследованиях.
Научное и учебное издание Редактор М.Н. Соловова
STATISTICд®- зарегистрированный товарный знак StatSoft lnc. (USA).
MS Windows, MS Word, MS Excel - зарегистрированные товарные зна ки Microsoft (USA)
© 0.Ю. Реброва, 2002
ISBN 5-89084-013-4 © Медиа Сфера, Москва, 2002 - оформление
Отпечатано в типографии ООО «Информnолиграф», Москва
Оглавление
Предисловие автора".""""""""""".."""""""""""""""""". 9
f Лава 1. Доказательная МедИIJИНа И планирование
научных исследований " ........... |
"."...." ............ |
" .... 12 |
1.1.Основные понятия доказательной медиgины """" """""" """"". 12
1.2.Источники научно обоснованной медиgинской информаgии ". 16
1.3. Определение gели исследования """"""""""""""" """ "" """ """" 17
1.4.Планирование исследования .. ""."".""""""""""""""""".""".".". 18
1.4.1.Типы исследований """"".""""""""""."""""""""."""""""19
1.4.2.Достоверность и обобщаемость результатов
исследования ............................................................................ |
23 |
1.4.3.Систематические и случайные ошибки""""""""""""""". 25
1.5.Некоторые вопросы планирования клинических
испытаний .. "". ". "." """" ".. ". """" "". ".. """. "." ". "." ". "." ". "."" """ 29
1.5.1.Виды структуры клинических испытаний"""""".""."""". 29
1.5.2.Распределение участников по группам
в рандомизированных клинических испытаниях""""""". 30
1.5.3.Маскирование вмешательства""""""."""""""""."".""."". 34
rлава 2. Типы данных"."""""""""""""""""""""""""""". 36
Глава 3. Подготовка данных к статистическому
анализу ..................... |
" ..................... |
"........... |
"...." ...... |
40 |
3.1.Подготовка первичных данных".""""""""."""""""""""""""""" 42 3.1.1. Оgенка точности данных "" """ """" """"""".""" """ ".""". 42
3.1.2. Предварительные расчеты "".""."""""""""""""""""".""" 43
3.1. 3. Идентификаgия участников (объектов)
исследования .................. |
"...... |
".............. |
".............................. |
" 44 |
3.1.4.Пропущенные (отсутствующие) значения данных """""44
3.1.5.Данные динамических исследований".".".""."."""."."""" 45
3.1.6.Данные для анализа времени до наступления
исхода ........................................................................ |
" .. ".......... |
46 |
3.1.7.Проверка данных"""""""""""""""""""""""""""""""""" 47
3.1.8.Перенос данных, подготовленных в других
программах, в таблиlJУ данных пакета прикладных
программ STATISTICA .......... |
"......"""""..."."""".".""".."49 |
3.2. Подготовка вторичных данных """""""""""""""""""""""""""" 50
Глава 4. Управление данными. и. сохранение
результатов анализа в пакете
прикладных программ STАТISТICA """""".""" 52
4.1.Огбор строк табли!JЫ данных по условию"""""""""""""""""". 52
4.2.Формирование подгрупп (разделение файлов)"""""""""""""". 53
4.3.Объединение файлов""."."."".. ""."."."""""""".".""""."."".".""" 54
4.4.Оперщии со столбIJаМИ """""""""""""""""""""""""""""""""" 55
4.5.Оперщии со строками""""""""""""""""""""""""""""""""""" 57
4.6.Сохранение результатов статистического анализа """""""""""" 58
Глава 5. Основные при.нqи.пы и. методы
статистического анализа""""""""""""""""""".60
5.1.Описательная статистика и статистическая О!Jенка """""""""". 60
5.2.Проверка статистических гипотез "" "" """"""" """ """"""""""". 64
5.3.Статистическое моделирование."."."""""""".""""."""".".""""" 69
5.4.Статистическая и клиническая значимость полученных
результатов ........................................................................................... |
69 |
5.5.Первичный и вторичный анализ данных""""""""""""""""""". 70
5.6.Классифика!JИЯ статистических методов"""""""""""""""""""" 71
Глава 6. Методы статистического анализа,
содержащиеся в пакете прикладных
программ STATISTICA """""""""""""""""""""" 75
Глава 7. Описание количественных признаков".."""". 77
7.1. Анализ соответствия вида распределения признака
закону нормального распределения """ """" """" """""" "" """"". 77 7.2. Описание количественных данных в зависимости
от вида их распределения"""""""""""""""""""""""""""""""". 83
7.3.Некоторые частные аспекты представления
количественных данных "". ". "." ". "." """".". "." "" "". ". ". ". ".... " " .. 92
7.3.1.Точность представления описательных статистик
количественных данных .". "." ". "." ".. "." ". "."."."." ".. " ". "." 92
7.3.2.Данные связанных групп""""""""""""""""""""""""""". 92
7.3.3.Преобразование количественных данных"""""""""".""" 93
7.3.4.Описание данных, полученных в малых выборках"""""" 94
7.3.5.Анализ выпадающих данных"""".".""."."."""""".".""""" 94
rлава 8. Сравнение групп по количественному
признаку .................... |
"."................... |
".............. |
" ...." 96 |
8.1.Сравнение одной группы с популяgией ."."".""""".".""""""""" 98
8.1.1.Случай нормально распределенного признака"""""".""" 98
8.1.2.Случай любого распределения признака ".""".""""""."""100
8.2.Сравнение двух независимых (несвязанных) групп""""."".""" 101
8.2.1.Доверительный интервал для разности средних"""""""" 102
8.2.2.Параметрический метод (t-критерий Стьюдента
для независимых групп) ........................................................ |
104 |
8.2.3.Непараметрические методы (критерии Манна-Уитни, Вальда-Вольфовиgа,
Колмогорова-Смирнова)""."".""""."."."".""".""""."."" 109
8.3. Сравнение двух зависимых (связанных) групп .". """.""."".". "" 111
8.3.1.Доверительный интервал для средней разности """"""""112
8.3.2.Параметрический метод (t-критерий Стьюдента
для зависимых групп) """"""""""."".".""."""""."."""""" 114
8.3.3.Непараметрические методы (критерий знаков,
критерий Вилкоксона) ".""""" """ """" """." """"."."" "."" 116
8.4.Сравнение трех независимых (несвязанных) групп
иболее "."."""".""""""."".""" .. """" .. ""."".""""" .. "".".".""".".".118
8.4.1.Параметрический дисперсионный анализ ".".".""."."""."119
8.4.1.1.Проверка гипотез о равенстве дисперсий """""" 120
8.4.1.2.Собственно дисперсионный анализ""""""""""". 122
8.4.1.3.Апостериорные сравнения групп ".""."."""."""".125
8.4.2.Непараметрические методы сравнения независимых групп (метод Краскела-Уоллиса,
медианный тест)""""".""""""."."".. "".""."""""."."" .. """ 129
8.5.Сравнение трех связанных (зависимых) групп
иболее (непараметрический метод Фридмена)"""""""""."."". 132
Глава 9. Описание качественных признаков ..""" """""134 |
|
9.1. Вычисление параметров распределения |
|
качественных признаков ................................................................... |
137 |
9.2.Вычисление абсолютных и относительных частот
(долей, проgентов, вероятностей, шансов) .""."."""."""".""""" 138
9.3. Описание относительной частоты бинарного |
|
признака с использованием доверительного |
|
интервала ............................................................................................. |
142 |
Глава 10. Сравнение групп по качественному
признаку".""""""".".""""""".""..""""""."""."". 145
10.1. Сравнение наблюдаемых и ожидаемых частот (анализ
одной группы) ".""".""""."".""""""."""."."""".".".""."."""".". 146 10.2. Сравнение двух групп и более".""."""""."."""".""."".""""."." 148
Глава 11. Сравнение групп по качественному
бинарному признаку ""."..""."""""...""""."".". 157
11.1.Сравнение выборочной относительной частоты
с популяgионной """ .. """ "" ". "". "."." """ ".. "" ".. ". "." "."." """ ".. 158
11.1.1.Сравнение доверительного интервала для выборочной относительной частоты
спопуляgионной "" """" "" """" "". ".. "". """" "."." """. "." 158
11.1.2.Проверка гипотез (<:-критерий) """"".""."""""."""""" 159
11.1.3.Проверка гипотез (критерий ;(2 ) """""""""""""" . """" 161
11.2.Сравнение относительных частот внутри одной
группы и в двух группах"" """""""."""""."".""" "."""". """" "." 162
11.3. Сравнение частот бинарного признака в двух несвязанных (независимых) группах
(анализ таблиg 2х2) ."."""""" .. "."".""""."."".".".""."."."".".""166
11.3.1. Доверительный интервал для разности
относительных частот"""""""."."."""""."."."."".""""."." 171 11.3.2. Доверительный интервал для относительного риска "." 173 11.3. 3. Доверительный интервал для отношения шансов """"" 175
11.3.4. Проверка гипотез (точный критерий Фишера,
;( 2 с поправкой Йетса) """""""""""."".""""""""."."""" 176
11.4. Сравнение частот бинарного признака в двух
связанных (зависимых) группах наблюдений
(случай парных наблюдений)""""""""""""."."""""."".""".""" 180 11.4.1. Доверительный интервал для разности
относительных частот""."."." ". ". "." """ ". ". ". "." """ ". "." .. 181
11.4.2.Проверка гипотез (критерий МакНемара) """""".""".183
11.5.Сравнение трех групп и более по бинарному
признаку""""""."."""."""".".""."".""""".. " ... ".""."."""" .. """"" 183
11.5.1.Случай неупорядоченных групп""."""""""""."".""""""184
11.5.2.Случай упорядоченных групп""."""".""""""""""""""". 184
Глава 12. Анализ связи (корреляции, ассоциации)
двух признаков """""""."""""."".."""""""""." 185
12.1.Параметрический метод (метод Пирсона) """""""""""""""".188
12.2.Непараметрические методы (методы Спирмена,
Кендалла, гамма) .. """ .. ""."." ... "....... "" ... "."."." ... ".""."".".""." .. 191
12.3.Доверительный интервал для коэффиIJиента
корреляIJИИ ........................................................................................ |
194 |
12.4. Сравнение двух коэффиIJиентов корреляIJИИ """"""""""""""" 195
Глава 13. Многофакторный анализ данных """"""""""198
13.1. Многофакторный параметрический |
|
дисперсионный анализ .................................................................... |
199 |
13.2. Дискриминантный анализ """".""""""."."""""."".""""".""""" 202 |
|
13. 3. Кластерный анализ ........................................................................... |
207 |
13.4.Анализ главных компонент и факторный анализ"""".""""""" 208
13.5.Многофакторный анализ объектов исследования
с пропущенными значениями ........................................................ |
208 |
13.6. Проверка работоспособности многофакторных моделей""""" 210
Глава 14. Анализ вида зависимости одного
признака от одного или нескольких
признаков (регрессионный анализ) """"""""211
14.1.Линейный регрессионный анализ"""""""."".""""".""""""."". 213
14.2.Логистическая регрессия как один из методов
нелинейного регрессионного анализа".""""""""""""""""".""" 221
Глава 15. Некоторые общие проблемы
и частные задачи статистического
анализа""""""."....""""""""."""""."".""""""""" 227
15.1.Проблема множественных сравнений""""."."... ""."""."."" .. "" 227
15.2.Определение интервала нормы (референтного
интервала) для количественного признака"".""".""."."."".""". 230
15.3.Определение необходимых объемов выборок
при планировании исследования. Статистическая
мощность (чувствительность) исследования ""." """"""""."."". 234
15.4.Анализ времени до наступления исхода"."""""""""""""""""" 238
15.4.1.Анализ вероятности наступления изучаемого исхода
вопределенный период времени (выживания) """"".". 240
15.4.2.Исследование влияния одного фактора
на время до наступления изучаемого исхода """" .". "."". 243
15.4.3.Анализ влияния нескольких факторов на время до наступления изучаемого исхода """""""""" """" """". 246
15.5.Анализ точности диагностического метода""""""""""""""""" 247
15.5.1.Операционные характеристики диагностического
метода ................ |
".................................................................... |
247 |
15.5.2. Анализ согласованности независимых
диаrnостических заключений""""""""""""""""""""""". 251
Глава 16. |
Объединение результатов нескольких |
|
|
исследований (мета-анализ) .............................. |
254 |
Глава 17. |
Современные требования к описанию |
|
|
в публикациях процедуры и результатов |
|
|
статистического анализа медико- |
|
|
биологических данных......................................... |
261 |
17.1.Рекомендации по разделу "Введение"""""""""""""""""""""" 262
17.2.Рекомендации по разделу "Материальr и методы" """""""""" 262
17.3.Рекомендации по разделу "Результаты" .""""""""""""""""""" 265
17.4.Рекоменда!JИИ по разделу "Обсуждение" ." .. ""."" ...... "."".""" .. 268
17.5.Описание ограничений исследования""""."""""""".""".""."." 269
17.6.Рекомендации по разделу "Выводы" """"""""."."".".""""."."" 269
Литература ............ |
""................................................................ |
|
270 |
Приложение 1. |
Аннотированный список рекомендуемой |
|
|
|
литературы на русском языке."."."""".""."."""" 272 |
||
Приложение 2. |
Список рекомендуемой литературы |
|
|
|
на английском языке"."."."".".""""""""."""""". 285 |
||
Приложение 3. Ранги, с помощью которых вычисляется |
|
||
|
доверительный интервал для медианы |
|
|
|
распределения"""."".. """.".""""""""""" .. ""."."" 286 |
||
Приложение 4. |
Нижние и верхние rранИIJЫ 95°!0 доверительных |
||
|
интервалов для относительных частот, |
|
|
|
представленных в виде простых дробей"""".".". 290 |
||
Толковый словарь терминов ............................... |
"....."....... |
:294 |
Предисловие автора
Тот, кто не знает математики, не может узнать
никакой другой науки и даже не может
обнаружить своего невежества, а поэтому
не ищет от него лекарства.
Р. Госкон
Наука начинается тогда, когда человек
подходит к явлениям природы с числом
и мерою.
В.И. Вернадский
Предлагаемая книга является руководством по применению
статистики в медичинских - клинических и эпидемиологиче
ских - исследованиях. Описываемый подход основан на исполь зовании пакета прикладных программ (ППП) STAТISТICA фир
мы StatSoft Inc. (США) для персонэ!\Ьного компьютера, однако
изложенные принчипы применения статистики универсальны и
могут применяться при использовании любых пакетов статисти
ческих программ.
Для чтения книги знание основ математической статистики является желательным, но не обязательным. Тем же, кто знаком
с основами статистики, книга поможет рсвоить технологию ана
лиза данных с использованием ППП STATISТICA. Книга снаб жена списками дополнительной литературы (см. Приложения 1 и 2), которой читатель может воспользоваться при желании глубже
освоить те или иные методы статистики.
Довольно широко распространено мнение, что необходимость анализа данных в биологических экспериментальных исследова
ниях отсутствует: "если требуется анализ данных, это значит, что сам эксперимент плох" (в том смысле, что фиксируемый эффект
незначителен). Однако применение статистики в медичинских и
биологических исследованиях не ограничивается анализом дан
ных. Статистические методы следует использовать таюке на эта
пе планирования биологического эксперимента или медичинско го исследования. Мы придерживаемся мнения, что и в биологи ческом эксперименте для анализа данных необходимо примене-
9