Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_данных_в_медицинских_исследованиях_в_2_ч_Красько

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
5.96 Mб
Скачать

поддерживающей химиотерапии, поэтому было принято решение исключить группу 1–4 из анализа риска. Оставшийся объем выборки составил 360 пациентов.

Рис.23–1. Графики выживаемости в зависимости от количества проведенных курсов поддерживающей химиотерапии

Шаг 2.

Мы закодировали бинарную переменную следующим образом “отсутствие химиотерапии” – “0”, “наличие химиотерапии” – “1” (изучаем фактор преимущества лечения). На основании логрангового теста мы уже могли говорить о том, что наличие поддерживающей химиотерапии повышает причинно-специфическую 5- летнюю выживаемость. Также мы построили регрессию Кокса (Раздел 18.6), оценили значимость модели с этим предиктором (Табл.23–2), получили оценку

параметра βˆ1 0,51 (Табл. 23–3). Поскольку наличие химиотерапии – интересующее

состояние и закодировано “1”, и коэффициент регрессии будет читаться как “логарифм отношения рисков групп с наличием и отсутствием химиотерапии”. Отношение рисков, связанное с наличием химиотерапии составило

exp βˆ1 exp 0,5108 0,60 , 95% ДИ составил (0,41÷0,88) Это означает, что наличие химиотерапии снижает риск неблагоприятного исхода в 1,6 раз (на 40%).

Таблица 22–2. Тест отношения правдоподобия для Кокс-регрессии с предиктором "наличие химиотерапии"

 

L

χ 2

df

p

Модель без предиктора

672,40

 

 

 

 

 

 

 

 

Модель с

668,86

7,089

1

0,0078

предиктором"Наличие

 

 

 

 

химиотерапии"

 

 

 

 

 

 

 

 

 

Таблица 22–3. Оценка параметров регрессии с предиктором "наличие химиотерапии"

 

βˆ

SE βˆ

 

 

Статистика

p

 

 

Вальда

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

Наличие химиотерапии

–0,5108

0,198

–2,58

0,00987

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

231

Второй вопрос, который надо было решить, был связан с возрастом как типичным конфаундером в исследованиях такого рода (квазиэкспериментальные когортные исследования). Мы должны были учесть влияние возраста на исследуемый фактор – фактор преимущества химиотерапии.

Распределение пациентов по возрасту в когорте показано на рис. 23–2. Медиана возраста – 62 года, Q25 53 года, Q75 68 лет.

 

70

 

60

Возраст

50

 

40

 

30

Рис.22–2. Распределение возраста в исследуемой когорте

Поскольку возраст является количественной переменной, то есть два основных подхода к анализу такой переменной в анализе выживаемости – либо разбить эту переменную на несколько интервалов (например, в соответствии с квартилями на 4 интервала, 4 равных группы) или исследовать ее влияние с помощью Кокс-регрессии. Мы выбрали использование однофакторной модели Кокса. Тест отношения правдоподобия выявил значимость параметра “возраст” как фактора риска (Табл. 32–4). Изменение возраста на 1 год вызывает увеличение риска неблагоприятного исхода (Табл.23–5) в среднем в 1,018 раз (на 1,8%).

Таблица 23–4. Тест отношения правдоподобия для Кокс-регрессии с предиктором "возраст"

 

L

χ 2

df

p

Модель без предиктора

672,40

 

 

 

 

 

 

 

 

Модель с предиктором

670,42

3,9679

1

0,04638

"возраст"

 

 

 

 

 

 

 

 

 

Таблица 22–5. Оценка параметров регрессии с одним количественным предиктором "возраст"

 

βˆ

SE βˆ

 

 

Статистика

p

 

 

Вальда

 

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

Возраст

0,017938

0,009185

1,953

0,0508

 

 

 

 

 

 

 

График изменения логарифма относительного риска от возраста представлен на рис. 23–3.

232

 

0.2

риск)

0.0

относительный

-0.2

(

 

Ln

0.4

 

-

 

-0.6

30

40

50

60

70

Возраст

Рис.23–3. Изменение логарифма относительного риска с возрастом по модели

Использование модели Кокса только с бинарным предиктором дает грубую оценку относительного риска при наличии химиотерапии. Следующий шаг исследования – составить модель Кокса для оценки снижения относительного риска при наличии химиотерапии с коррекцией на возраст. Тест отношения правдоподобия для предикторов и оценки параметров такой модели приведены в Табл. 23–6 и 23–7.

Таблица 22–6. Тест отношения правдоподобия для Кокс-регрессии с двумя предикторами

 

LR χ 2

df

p

 

 

 

 

Наличие химиотерапии

4,6443

1

0,0312

 

 

 

 

Возраст

1,5232

1

0,2171

 

 

 

 

Таблица 22–7. Оценка параметров регрессии с двумя предикторами

 

 

Оценки βˆ

Оценки

Статистика

p

 

 

SE βˆ

 

 

Вальда

Наличие химиотерапии

β1

–0,4362

0,2071

–2,107

0,0351

 

 

 

 

 

 

Возраст

β2

0,0116

0,0095

1,219

0,2229

 

 

 

 

 

 

Как видно из Tабл. 23–4, в модели введение ковариаты, связанной с возрастом, изменила оценку относительного риска из-за наличия химиотерапии. Однако, предиктор Возраст престал быть значимым. Фактически значение

относительного риска exp βˆ1 exp 0,4362 0.65 – это значение относительного риска для среднего возраста по имеющейся выборке, 95% ДИ (0,43÷0,97) .

Построим модель со взаимодействием двух предикторов и проверим предположение о взаимодействии возраста и исследуемого фактора преимущества лечения (Раздел 18.8).

Для модели со взаимодействием тест отношения правдоподобия для предикторов и оценки параметров такой модели приведены в Табл. 23–8 и Табл. 23– 9.

233

Таблица 23–8. Тест отношения правдоподобия для Кокс-регрессии с двумя взаимодействующими предикторами

 

LR χ 2

df

p

 

 

 

 

Наличие химиотерапии

4,6443

1

0,0312

 

 

 

 

Возраст

1,5232

1

0,2171

 

 

 

 

Наличие химиотерапии х

2,8329

1

0,0924

Возраст

 

 

 

 

 

 

 

Таблица 23–9. Оценка параметров регрессии с двумя взаимодействующими предикторами

 

Параметр

Оценки βˆ

Оценки SE βˆ

Статистика

p

 

в модели

Вальда

 

 

 

 

 

 

 

 

 

 

Наличие

β1

–2,5377

1,2953

–1,959

0,0501

химиотерапии

 

 

 

 

 

 

 

 

 

 

 

Возраст

β2

0,0013

0,0111

0.114

0,9089

 

 

 

 

 

 

Возраст х Наличие

β3

0,0354

0,0213

1,658

0,0973

химиотерапии

 

 

 

 

 

 

 

 

 

 

 

Из Табл. 23-8 видно, что вклад в снижение вариации (девиации) модели у переменной "Наличие химиотерапии" значим, однако оценка параметра (Таблица 23-9) незначима на уровне p=0,05.

Сначала “прочтем” модель (см. Раздел 16.6).

Среднее исхода y при Возраст =0 и Отсутствии химиотерапии есть β1 ;

изменение в среднем исхода (логарифма относительного риска) y при увеличении переменной Возраст на 1 и Отсутствии химиотерапии есть β2 ; β3 – это разность в

уклонах двух регрессионных уравнений: для Наличия химиотерапии и для

Отсутствия химиотерапии при изменении возраста на 1.

Из Табл. 23–9 следует, что возраст изменяет отношение рисков, связанное с преимуществом лечения, между двумя группами. Однако, значимость параметра, связанного со взаимодействием двух переменных 0,05 p 0,1 (Табл. 23–8). Мы

решили, что такое взаимодействие должно быть принято во внимание. Был построен график зависимости логарифма относительного риска от возраста для двух групп – при наличии и при отсутствии химиотерапии (рис. 23–4). Из этого графика видно, что отсутствие химиотерапии – это постоянный относительный риск в любом возрасте постановки диагноза (в течение 5 лет, поскольку мы строили модель по пятилетней причинноспецифической выживаемости). Более низкий относительный риск, связанный с наличием химиотерапии, возрастает с увеличением возраста пациента на момент диагноза.

234

Рис.23–4. Изменение логарифма относительного риска с возрастом в группах с химиотерапией и без химиотерапии

Мы рассчитали (Табл. 23–10) отношение рисков при наличии и отсутствии химиотерапии для различных возрастов по имеющейся модели. Необходимо обратить внимание на доверительные интервалы оценок для разных возрастов. Для значений возраста больших медианы они содержат 1. Формально, это означает, что для оценок отношения рисков p 0,05.

Таблица 23–10. Отношение рисков для определенного возраста

 

Отношение рисков при наличии и отсутствии

Возраст, годы

химиотерапии

 

 

значение

Нижняя граница

Верхняя граница

 

 

95% ДИ

95% ДИ

 

 

 

 

40

0,33

0,13

0,82

 

 

 

 

50

0,46

0,26

0,82

 

 

 

 

60

0,66

0,45

0,98

 

 

 

 

Q50=62

0,71

0,47

1,06

 

 

 

 

70

0,94

0,53

1,67

 

 

 

 

Нам не хватает мощности исследования, чтобы сделать окончательные выводы по всем возрастным группам. Но, тем не менее, мы получили достаточно полную картину, чтобы понять, что проведение поддерживающей химиотерапии в возрасте до 60 лет статистически значимо снижает неблагоприятный исход. Этот вывод имеет клиническую важность. Возможна разработка протокола лечения, по которому поддерживающая химиотерапия будет обязательным этапом лечения в возрасте до 60 лет.

Утверждение, что "отношение рисков для групп с наличием и отсутствием химиотерапии с коррекцией на возраст (по модели с двумя предикторами без взаимодействия) составило 0,65 (0,43÷0,97) для исследуемой когорты, т.е. снижение

235

риска на 35% (3%÷57%)", статистически значимо ( p 0,05), но верхняя граница

доверительного интервала близка к 1 (нижняя граница процентного интервала близка к нулю), и практическая полезность этой информации невелика.

Примечания к примеру.

1.При изложении логики исследования опущена часть, связанная с проверкой линейности и пропорциональности рисков для того, чтобы не отвлекаться от основного изложения. В реальном исследовании такая проверка была проведена, предположения модели Кокса не были нарушены.

2.Мы видели на графике ( и можем доказать расчетами), что возраст не влияет на относительный риск неблагоприятного исхода для группы с отсутствием химиотерапии. Сложность заключалось в том, что возраст играл роль в модели только при наличии химиотерапии, редуцируя ее положительное влияние при увеличении. Если бы мы отдельно построили 2 модели для этих двух групп (с химиотерапией и без нее), то для группы с отсутствием химиотерапии оценка параметра предиктора возраст была бы незначимой, в регрессионном подходе трактуется как отсутствие связи между переменными. Таким образом, наша задача оценки относительного риска при наличии химиотерапии вылилась в задачу – как учесть влияние возраста, причем, как выяснилось, только на одну из групп1. Можно еще раз отметить, что визуализация при анализе – очень мощная поддержка исследователю в понимании своих данных.

Данные для расчета этого примера и R-скрипты для выполнения анализа приведены в Приложении R-13.

Основные аспекты

Если за данными, имеющимися в вашем распоряжении, видеть проблему, если внимательно их анализировать, то вы найдете свою систему доказательств.

1 Для такого анализа могут использоваться так называемые иерархические модели, в которых учитывается различный уклон количественных переменных на разных уровнях категориальной переменной.

236

Заключение

Пособие написано на основе многолетней работы в области статистического анализа медико-биологических данных. Но это не справочник, который можно открыть на любой странице. Фактически, это сквозное прохождение всех этапов анализа в основных типах дизайнов исследования. Примеры взяты из реальных исследований и немного адаптированы для изложения. В примерах мне хотелось донести связь излагаемого материала – как характеристики исследования, характеристики данных влияют на поиск решения, на обоснование статистических доказательств. Я повторю, что с каждым исследователем мы начинали все заново, потому что мы выстраивали систему доказательств на конкретном дизайне исследования с учетом особенностей данных. Нет готовых решений, к решению надо придти. Поэтому статистические пакеты – только инструмент в руках исследователя.

Выводы – за вами!

Я очень благодарна коллегам-медикам за то, что они разрешили мне использовать их данные в примерах, за их вопросы, которые иногда приводили к длительным поискам по литературе и помогали мне лучше понять весь аппарат анализа. Но главное, я благодарна им за ту работу, который они делают ежедневно – лечат людей.

С уважением,

Ольга Красько

P.S. Найденные в тексте пособия ошибки любой природы: от методологических до грамматических – исключительно моя ответственность.

237

Рекомендуемая литература

Некоторые теоретические и математические аспекты статистического анализа сложны для неподготовленных читателей, поэтому даются ссылки книги или пособия, которые излагают этот материал без привлечения сложных разделов математики. В некоторых случаях приводятся книги для более глубокого изучения определенной проблемы или вида анализа. Безусловно, литературы по статистическому анализу в медицине, биологии, эпидемиологии намного больше, но данное пособие – не теоретическое исследование, а руководство по методам прикладного статистического анализа с уклоном в медико-биологические данные.

Раздел 1.

Флетчер Р., Флетчер С., Вагнер Э. Клиническая эпидемиология. Основы доказательной медицины. — М.: Медиа Сфера, —1998. — 352 с.

Richard K. Riegelman. Studying a study and testing a test: how to read the medical evidence. – Lippincott Williams & Wilkins, — 2005. — 403p.

Раздел 2.

Флетчер Р., Флетчер С., Вагнер Э. Клиническая эпидемиология. Основы доказательной медицины. — М. : Медиа Сфера, —1998. — 352 с.

Stewart A. Basic statistics and epidemiology. A practical guide, Oxford: Radcliffe Publishing, — 2010. — 208 p.

Szklo, M. Nieto F.J. Epidemiology: Beyond the Basics, Boston: Jones and Bartlett, — 2007. — 490p.

Research metods in Occupational Epidemiology, edited by Brian MacMahon, Oxford University Press, — 1989. — 344p.

ICH E9 – Statistical Principles for Clinical Trials, —EMEA, — 2006. — 37p. ICH E10 – Choice of Control Group in Clinical Trials, —EMEA, — 2006. — 30p.

Раздел 3.

Гланц C. Медико-биологическая статистика, — М.: Практика, —1998. — 459 с.

Петри А., Сэбин К. Наглядная статистика в медицине, — М.: ГЭОТАР-МЕД, —

2003. — 144c.

Chap T. Le. Introductory biostatistics, — NY: John Wiley & Sons, —2003. — 536p.

Stewart A. Basic statistics and epidemiology. A practical guide, Oxford: Radcliffe Publishing, — 2010. — 208 p.

Раздел 4.

Гланц C. Медико-биологическая статистика, — М.: Практика, —1998. — 459 с.

Петри А., Сэбин К. Наглядная статистика в медицине, — М.: ГЭОТАР-МЕД, —

2003. — 144c.

Chap T. Le. Introductory biostatistics, — NY: John Wiley & Sons, — 2003. — 536p.

Stewart A. Basic statistics and epidemiology. A practical guide, Oxford: Radcliffe Publishing, — 2010. — 208 p.

Chow S.C., Wang H., Shao J. Sample Size Calculations in Clinical Research, — Chapman & Hall/CRC Biostatistics Series, — 2008. — 466 р.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

238

Раздел 6.

Гланц C. Медико-биологическая статистика, — М.: Практика, —1998. — 459 с.

Петри А., Сэбин К. Наглядная статистика в медицине, — М.: ГЭОТАР-МЕД, —

2003. — 144c.

Chap T. Le. Introductory biostatistics, — NY: John Wiley & Sons, —2003. — 536p.

Stewart A. Basic statistics and epidemiology. A practical guide, Oxford: Radcliffe Publishing, — 2010. — 208 p.

Newman S. C. Biostatistical Methods in Epidemiology, NY: John Wiley & Sons, — 2001. — 382p.

Раздел 7.

Гланц C. Медико-биологическая статистика, — М.: Практика, —1998. — 459 с.

Петри А., Сэбин К. Наглядная статистика в медицине, — М.: ГЭОТАР-МЕД, —

2003. — 144c.

Chap T. Le. Introductory biostatistics, — NY: John Wiley & Sons, —2003. — 536p.

Stewart A. Basic statistics and epidemiology. A practical guide, Oxford: Radcliffe Publishing, — 2010. — 208 p.

Newman S. C. Biostatistical Methods in Epidemiology, NY: John Wiley & Sons, — 2001. — 382p.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Раздел 8.

Гланц C. Медико-биологическая статистика, — М.: Практика, —1998. — 459 с.

Петри А., Сэбин К. Наглядная статистика в медицине, — М.: ГЭОТАР-МЕД, —

2003. — 144c.

Chap T. L. Introductory biostatistics, NY: John Wiley & Sons, — 2003. — 536p.

Stewart A. Basic statistics and epidemiology. A practical guide, Oxford: Radcliffe Publishing, — 2010. — 208 p.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Раздел 9.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Agresti A. Categorical Data Analysis, — NY: John Wiley & Sons, —2002. — 734p.

Breslow N. E., Day N. E. Statistical Methods in Cancer Research. Volume I. The analysis of case-control studies, — IARC Scientific Publications, —1984. — 338p.

Раздел 10.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Петри А., Сэбин К. Наглядная статистика в медицине, — М.: ГЭОТАР-МЕД, —

2003. — 144c.

Chap T. Le. Introductory biostatistics, — NY: John Wiley & Sons, —2003. — 536p.

239

Stewart A. Basic statistics and epidemiology. A practical guide, Oxford: Radcliffe Publishing, — 2010. — 208 p.

Раздел 11.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Newman S. C. Biostatistical Methods in Epidemiology, — NY: John Wiley & Sons, — 2001. — 382p.

Bishop Y.M., Fienberg S.E., Holland P.W. Discrete multivariate analysis: Theory and practice, — NY: Springer, — 2007. —558p.

Agresti A. Categorical Data Analysis, — NY: John Wiley & Sons, —2002. — 734p.

Раздел 12.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Bishop Y.M., Fienberg S.E., Holland P.W. Discrete multivariate analysis: Theory and practice, — NY: Springer, — 2007. —558p.

Agresti A. Categorical Data Analysis, — NY: John Wiley & Sons, — 2002. — 734p.

Раздел 13.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Agresti A. Categorical Data Analysis, — NY: John Wiley & Sons, — 2002. — 734p.

Breslow N. E., Day N. E., Statistical Methods in Cancer Research. Volume II.The Design and Analysis of Cohort Studies, — IARC Scientific Publications No. 82, — 1987. — 406p.

Dmitrienko A., Molenberghs G., Chuang-Stein C., Offen W., Analysis of Clinical Trials Using SAS®: A Practical Guide, — Cary, NC: SAS Institute Inc. , — 2005. — 420p.

Раздел 14.

Matthews D., Farewell, V. Using and Understanding Medical Statistics, —Karger,— 2007. —322p.

Bishop Y.M., Fienberg S.E., Holland P.W. Discrete multivariate analysis: Theory and practice, — NY: Springer, — 2007. —558p.

Agresti A. Categorical Data Analysis, — NY: John Wiley & Sons, —2002. — 734p.

Breslow N. E., Day N. E. Statistical Methods in Cancer Research. Volume II.The Design and Analysis of Cohort Studies, — IARC Scientific Publications No. 82, — 1987. — 406p.

Dmitrienko A., Molenberghs G., Chuang-Stein C., Offen W., Analysis of Clinical Trials Using SAS®: A Practical Guide, — Cary, NC: SAS Institute Inc. , — 2005. — 420p.

Раздел 15.

Монтгомери Д. К. Планирование эксперимента и анализ данных: Пер.—Л.: Судостроение, 1980.—384 с.

Regression methods in biostatistics: linear, logistic, survival, and repeated measures models / Eric Vittinghoff ... [et al.], — NY: Springer, — 2005. — 338p.

240

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение