Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_данных_в_медицинских_исследованиях_в_2_ч_Красько

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
5.96 Mб
Скачать

если наблюдаемая ассоциация не корректна, поскольку имеются переменные, ассоциированные как с потенциальными предикторами, так и с исходом, хотя и не являются причиной исхода сами по себе, то говорят о конфаундерах;

если наблюдаемый эффект имеет место, но его величина различна для различных групп (например мужчины и женщины), то говорят о модификации эффекта (взаимодействии).

6.Для бинарного исхода (логистическая и Кокс-регрессия) лучше сначала тестировать возможную нелинейность и трансформировать или категоризировать количественную переменную до включения в предварительную мультивариантную модель (т.е. модель с несколькими переменными и их взаимодействием).

7.Для категориальной переменной определить категории, которые возможно объединить без потери медико-биологической информативности.

8.При построении предварительной мультивариантной модели есть несколько подходов к ее формированию: пошаговое включение переменных в модель, пошаговое исключение, полный перебор комбинаций переменных. Каждый подход имеет свои преимущества и недостатки и не гарантирует, что предположения, лежащие в основе модели будут соблюдены.

9.Не гонитесь за количеством предикторов, правило для исследования бинарного исхода (логистическая регрессия или регрессия Кокса): не менее 10 наблюдений с исследуемым исходом на один параметр модели. Для количественного исхода (линейная регрессия) – это не менее 6–8 наблюдений на один параметр модели.

10.Выявление важных независимых предикторов – одна из целей построения модели. Определение лучшей модели – это баланс между сложностью и интерпретируемостью. Нужна большая осторожность в интерпретации слабых ассоциаций.

11. Модели с несколькими предикторами часто страдают от мультиколлинеарности – корреляции между предикторами, которая дает следующий эффект: кажется, что ни одна переменная не значима, когда модель включает мультиколлинеарные предикторы. Может казаться, что у предиктора небольшой эффект, потому он уже "предсказывается" другими предикторами, которые коррелируют с ним. Удаление избыточного предиктора необходимо, но нужно определить, какой именно предиктор избыточен и решение принимает исследователь не только на основании математических расчетов, но и на основании медико-биологического смысла предиктора.

12.Как правило, сложная модель строится в несколько итераций. Поэтому возможно повторение шагов изучения взаимосвязи двух переменных в наборе данных, корректировка линейности (пропорциональности), проверка взаимосвязи предикторов, прежде чем переменная окончательно включается в мультивариантную модель.

13.При построении регрессии вы будете использовать некоторый статистический пакет для расчетов. Убедитесь, что вы правильно понимаете все расчеты, которые выдает пакет. Как правило, в пакетах есть контрольные примеры. Найдите походящий пример и выполните сначала его.

14.Документируйте результаты как предварительных расчетов и предварительных моделей, так и окончательных. Это поможет избежать повторов, утвердится в правильности пути анализа.

211

20.Использование результатов моделирования для прогноза1

Влинейных регрессионных моделях в первую очередь мы изучали связь предиктора и исхода, силу этой связи, влияние вмешивающихся переменных и иные нюансы поведения предиктора и исхода. Следующий шаг, который кажется логичным – использовать построенную модель для предсказания результатов нового наблюдения. Но несмотря на то, что математически вы можете это сделать, будет ли ваш результат прогноза верным?

Очень важный момент исследований – это экстраполяция результатов исследования на популяцию.

Выше было кратко сказано, что на основании моделей можно делать прогноз. Но нужно быть крайне осторожным, поскольку ваша выборка имеет ограниченную “зону влияния”.

Необходимо принимать во внимание тип дизайна исследования. При дизайне “случай-контроль” исследуется связь и сила связи предиктора и исхода, но группы исследования не отражают состояние распространенности заболевания в популяции. Когортное исследование является более подходящим для построения модели прогноза, но оно может иметь систематические ошибки, которые модель не

всостоянии устранить.

Висследовании так или иначе создаются искусственные ограничения (включение и исключение пациентов в исследование), реальные клинические случаи более вариативны.

Например, исследования шли в Европе, и 90% пациентов в исследовании имели белую расу. В окончательную модель конфаундер “раса” не был включен. Будет ли ваша модель работоспособна для пациентов другой расы?

Для того, чтобы модель могла быть экстраполирована на всю популяцию, первый шаг – валидация модели. Валидация модели бывает внутренней и внешней

(internal and external validity).

Внутренняя валидация подразумевает, что после построения модели на данных выборки, эти же данные определенным образом используются для валидации. Внутренняя валидация скорее служит целям показать внутреннюю непротиворечивость модели, отсутствие систематических ошибок.

Для внешней валидации используется другой набор данных аналогичного исследования. В этом случае выборку, по которой строилась модель, называют обучающей, внешняя выборка называется тестовой. Объем тестовой выборки должен быть сравним с объемом обучающей выборки.

Существуют определенные критерии “производительности” моделей. Это

мера объясненной вариации R2 , оценка Брира (Brier score), индекс согласованности

(concordance index, c-index) и др.

Если валидация модели показала удовлетворительные результаты, то следующий шаг – это калибровка модели. Калибровка – это оценка разногласий модели и реальных данных, введение поправок. Она выполняется как на обучающей так и на тестовой выборке.

Также может быть рассчитана чувствительность и специфичность модели: ее возможность правильно различать бинарные исходы.

1 Только для ознакомления

212

Если есть доказательства того, что линейная модель пригодна для прогнозирования, то, благодаря линейности комбинации предикторов, может быть построена номограмма и проведена калибровка номограммы.

В любом случае, построение модели прогноза – это сложный этап, и не всегда построение модели является целью исследования. Чаще модели используются для оценки влияния исследуемого фактора на исход с учетом вмешивающихся переменных для определения истинной силы влияния исследуемого фактора.

Основные аспекты

Модели прогноза используются для практических целей, для клинической практики, эпидемиологических служб и т.п. Поэтому кроме того, что доказана статистическая значимость модели, надо убедится, что она пригодна к практическому применению.

213

21.ANOVA с повторяющимися измерениями

Анализ вариаций (ANOVA) – мощный инструмент для анализа количественных измерений, которые могут быть сгруппированы по некоторым признакам. Зависимая переменная является количественной переменной, группировок (категориальных переменных) может быть несколько. Основная интерпретация такого анализа – как изменяются средние значения количественной переменной в зависимости от того, какой группе (подгруппе) принадлежит наблюдение и каково соотношение между ними. Интерес исследования, как правило, связан с категориальной переменной – группами исследования, но о различии групп мы судим по средним значениям количественной переменной.

ANOVA с повторяющимися измерениями предполагает, что одна категориальная переменная определена особым образом и связана с дизайном исследования. Чаще в медико-билогических исследованиях это некоторые точки времени (timepoint, visit), в которых измерения повторяются для всех наблюдений (для всех пациентов, включенных в исследование). Также ANOVA с повторяющимися измерениями используется для обработки данных в дизайне, который предполагает исследование действия различных препаратов на одну и ту же группу испытуемых. Особенностью является то, что проводятся повторные измерения у одного и того же пациента, и ANOVA с повторяющимися измерениями учитывает это при оценках эффектов (различий) между группами. Группы, по возможности, должны иметь одинаковую численность, сбалансированы по численности.

Типичная задача 1 – исследовать, как изменился некоторый параметр (давление, уровень лейкоцитов, концентрация препарата в организме и т.п.) за время между двумя или более точками во времени. Это может быть длительное лечение некоторого заболевания. Исследуется несколько типов лечения. В этом случае группы должны быть исходно однородны, т.е. не различаться по исследуемому параметру, а также по конфаундерам, которые могут влиять на исследуемый параметр.

Типичная задача 2 – группы изначально разделены по уровню исследуемого параметра. Необходимо проследить динамику этого параметра в связи с одним и тем же воздействием (например, лечением) у различных групп. Предполагается, что группы однородны по конфаундерам.

Типичная задача 3 – взяты образцы тканей (биопсия, кровь) у различных испытуемых, разделены на несколько частей, осуществляется несколько различных воздействий на части каждого образца. Как вариант дизайна, в рандомизированных клинических испытаниях исследуется несколько препаратов и испытуемый получает все препараты в случайном порядке1. Этот дизайн относится к так называемому полному однофакторному эксперименту. Здесь нет фактора времени, есть различные уровни воздействия фактора на одну группу, т.е. исследуемыми группами становятся результаты каждого воздействия на одни и те же образцы. Задача – оценить различия в исследуемом параметре в связи с различными уровнями воздействия фактора. Если важно исходное состояние образцов, то добавляют еще одну группу – контроля, которая фиксирует неизменное состояние, и после выполнения ANOVA может проводиться сравнение с контрольной группой (критерий Даннетта/Dunnett test).

1 Это экспериментальное исследование. Полное описание этого типа дизайна не приводится. Каждое такое исследование строго регламентировано и документ, сопровождающий такие испытания, может занимать 300-500 страниц.

214

Задачи на типы поделены условно в данном пособии. На самом деле первые два типа задач называют моделями со смешанными эффектами, двухфакторная

ANOVA с повторяющимися измерениями (mixed effects models , 2-ways repeated measures ANOVA). Задачи третьего типа – однофакторная ANOVA с повторяющимися измерениями (one-way repeated measures ANOVA).

Далее рассмотрим задачи 1-2 типа, которые включают повторные измерения во времени у нескольких групп.

Ремарка: Фармакокинетические исследования – это также повторяющиеся наблюдения, но для обработки таких данных используется специальный математический аппарат.

Очень многих начинающих исследователей пугает математический аппарат, лежащий в основе ANOVA. В других главах приведены таблицы ANOVA, которые используются для оценки значимости снижения вариации моделей (см. Разделы16,

17, 22)

Цель этой главы – научить “читать” таблица ANOVA для повторяющихся измерений.

Основной источник вариации в таких исследованиях – различия между пациентами, вариация в эффекте группы (межгрупповые различия) может быть относительно меньше, чем вариация самих пациентов. Использование ANOVA с повторяющимися измерениями позволяет учесть вариацию (индивидуальные характеристики) пациентов.

Различия между группами и различия между точками времени – носят название основных эффектов (main effects). Учет различной динамики в различных группах носит название эффекта взаимодействия (interation effect).

Источники вариации в модели ANOVA с повторяющимися измерениями: SSG – вариация, связанная с различием групп;

SSP(G) – вариация, связанная с различием пациентов ;

SSV – вариация, связанная с различием точек времени;

SS(GV) – вариация, связанная со взаимодействием различных точек времени и различных групп;

SSE – остаточная вариация (SSresidual).

Оценка значимости различий между группами проводится на основании отношения SSG и SSP(G) с учетом соответствующих степеней свободы, оценка значимости динамики в различных точках времени – на основании отношения SSV и SSE с учетом соответствующих степеней свободы, оценка значимости различий в динамике у различных групп – на основании отношения SS(GV) и SSE с учетом соответствующих степеней свободы. Все оценки проводятся с помощью F-критерия.

Обычно статистические пакеты выдают полный набор вариаций (SSx), а также MSx – среднее соответствующей вариации SSx, т.е. SSx деленное на число ее степеней свободы, и соответствующие значения F-критерия. На графиках, сопровождающих ANOVA, обычно показаны средние и их доверительные интервалы в разных точках времени, линией соединены одинаковые группы в различные точки времени.

Дадим интерпретацию значимости для моделей, в которых динамика оценивается по двум точкам: начальной и конечной (Таблица 21-1).

Отношение MSV/MSE характеризует есть ли эффект от лечения вообще (т.е. как изменился исследуемый параметр между начальной и конечной точками), отношение MSG/MSP(G) характеризует различия между исследуемыми группами;

215

отношение MS(GV)/MSE характеризует различия между группами в динамике наблюдений.

Таблица 21-1. Интерпретация и визуализация расчетов ANOVA

 

MSG/MSP(G)

MSV/MSE

MS(GV)/MSE Визуализация

 

Возможные причины1

 

 

 

 

 

 

 

 

 

 

 

 

 

1

незначимо

значимо

незначимо

 

 

 

 

 

 

Возможно, все типы лечения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

одинаково

эффективны.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Динамика одинакова у всех

 

 

 

 

 

 

 

 

 

 

 

 

 

 

групп.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На первом рисунке значения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

исследуемоого

параметра

 

 

 

 

 

 

 

 

 

 

 

 

 

 

повышаются, на втором,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

снижаются по сравнению с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

начальным состоянием.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

незначимо

значимо

значимо

 

 

 

 

 

 

Возможно, у одной

группы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

есть эффект от лечения, у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

остальных нет. За счет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

этого

различий

между

 

 

 

 

 

 

 

 

 

 

 

 

 

 

группами не наблюдается, а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

наблюдается

 

только

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

частный эффект в

одной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

группе и эта группа по

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

численности меньше других

 

 

 

 

 

 

 

 

 

 

 

 

 

 

групп.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

данном

случае

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рекомендуется

 

более

 

 

 

 

 

 

 

 

 

 

 

 

 

 

тщательно

выполнить

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дизайн

 

исследования,

 

 

 

 

 

 

до

 

после

 

 

 

 

 

 

 

 

 

 

возможно,

необходимо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

увеличить

численность

 

 

 

 

 

 

 

 

 

 

 

 

 

 

групп

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

значимо

значимо

незначимо

 

 

 

 

 

 

Возможно,

изначально

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пациентов делили на группы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

по уровню

исследуемого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

показателя, а все типы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лечения

 

одинаково

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эффективны

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до после

1 Комментарии даны из личного опыта автора. Безусловно, варианты объяснений могут быть другими.

216

4

значимо

значимо

значимо

 

 

 

 

 

 

Есть значимый эффект от

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лечения в целом, между

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

группами

 

 

(вариантами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лечения) значимые различия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в эффективности

типов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лечения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

Как

вариант,

изучалось

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

воздействие

 

 

одного

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

препарата

 

на

организм.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Разделение на группы шло по

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

некоторому

 

признаку,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

который

 

 

 

 

как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

предполагалось,

 

менял

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

эффект лечения.

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

значимо

незначимо

значимо

 

 

 

 

 

 

 

 

 

 

Возможно,

 

 

изначально

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пациентов делили на группы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

по

уровню

исследуемого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

показателя,

а

различные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

типы

лечения

имеют

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

противоположные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

эффекты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

первом

 

случае

также

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

возможно,

что проводятся

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

испытания

 

одного

и того

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

же

препарата,

который

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нормализует отклонения

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

исследуемом параметре

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Во втором случае возможно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

изучается

 

 

некоторый

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

неблагоприятный

фактор,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

который

 

 

дисбалансирует

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

состояние

 

 

изучаемого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

параметра.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

значимо

незначимо

незначимо

 

 

 

 

 

 

Группы

 

изначально

не

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рандомизированны,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

возможно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

несбалансированны.

 

Не

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

соотносите

различия

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

исходном

 

 

состоянии

с

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

различием

в результатах

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лечения.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

незначимо

незначимо

незначимо

 

 

 

 

 

 

Нет никаких эффектов.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8 незначимо

незначимо значимо

 

 

 

 

 

 

В

 

медицинских

 

 

 

 

 

 

 

 

 

 

 

исследованиях

 

такие

 

 

 

 

 

 

 

 

 

 

 

взаимодействия

редки,

 

 

 

 

 

 

 

 

 

 

 

считается, что

вероятно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

существует

 

фактор,

 

 

 

 

 

 

 

 

 

 

 

который

не

учтен

при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

до

 

после

 

составлении

дизайна

при

 

 

 

 

 

 

 

 

 

 

 

условии,

что

использовано

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

одно и то же лечение.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

217

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Например, группы разделены по уровню исследуемого фактора, в одну группу включены мужчины с высоким уровнем исследуемого показателя, в другую – женщины с низким уровнем показателя, третья группа смешана и уровень показателя средний. Т.е. использовано два признака деления на группы вместо одного. В этом случае фактор пола должен быть ковариатой и его вариация должна учитываться в составе модели.

В социологических исследованиях некоторые мотивации дают различное воздействие на различные социальные группы и такие взаимодействия изучаются.

После общего анализа можно оценить средние значения в каждой группе в каждой точке времени ( до и после). Оценка средних обычно проводится методом наименьших квадратов ( LS means). Также можно оценить размер эффектов – разность в средних между группами, разность в средних между точками времени, разность между изменениями в группах. Статистические пакеты предоставляют такую возможность с учетом поправок на множественность сравнений.

Пример

Некоторый биохимический параметр BioChem (который исходно повышен) замерялся до начала лечения и спустя 2 недели (категориальная переменная "timepoint" с двумя уровнями before/after. Лечение было направлено на снижение данного параметра. Исследование изучало три типа лечения (категориальная переменная "treatment", три уровня – A, B, C). Данные приведены в Приложении R-12.

Шаг 1.

Проверим предположения, лежащие в основе анализа вариаций.

Проверим данные до и после лечения на соответствие закону нормального распределения в каждой из групп лечения на каждой точке времени критерием согласия Шапиро-Уилка. ANOVA устойчива к небольшим отклонениям данных от закона нормального распределения, но в нашем примере ни одна из подгрупп не нарушает предположения о согласии с законом нормального распределения1.

Выполним тест на гомогенность дисперсий и убедимся, что предположение не нарушается (р= 0,5233).

Шаг 2.

Выполним анализ.

В результате получим расчеты, приведенные в Таблице 21-2.

Таблица 21-2. Расчеты ANOVA, статистический пакет R, библиотека ez

Effect

DFn

DFd

SSn

SSd

F

p

ges

 

 

 

 

 

 

 

 

(Intercept)

1

24

18592,67

403,00

1107,26

0,0000

0,98

 

 

 

 

 

 

 

 

treatment

2

24

72,33

403,00

2,15

0,1379

0,13

 

 

 

 

 

 

 

 

timepoint

1

24

75,85

73,22

24,86

0,0000

0,14

 

 

 

 

 

 

 

 

treatment:timepoint

2

24

68,93

73,22

11,30

0,0003

0,13

 

 

 

 

 

 

 

 

SSn – вариация соответствующего эффекта (Sum of Squares in the numerator, a.k.a. SSeffect);

1 Это предположение не является обязательным. Более важно соблюдение предположения о гомогенности дисперсий, а также о нормальности распределения остатков модели. Тем не менее, предпочтительнее данные, которые изначально подчиняются закону нормального распределения.

218

SSd вариация с которой сравнивается вариация эффекта по F-критерию

(Sum of Squares in the denominator , a.k.a. SSerror);

DFn и DFd – степени свободы соответствующих вариаций; F – значение F-критерия;

ges – оценка величины эффекта: доля вариации зависимой переменной (BioChem), которая объясняется независимой переменной при фиксированных значениях остальных переменных.

Таблица 21-3. Расчеты ANOVA, статистический пакет R, библиотека lme4

Effect

Sum Sq

Mean Sq

NumDF

DenDF

F.value

Pr(>F)

 

 

 

 

 

 

 

treatment

13,14

6,571

2

24

2,15

0,1379

 

 

 

 

 

 

 

timepoint

75,85

75,852

1

24

24,86

0,0000

 

 

 

 

 

 

 

treatment:timepoint

68,93

34,463

2

24

11,30

0,0003

 

 

 

 

 

 

 

Для сравнения, эта же результаты, представленные в пакете Statistica, выглядят, как показано в Таблице 21-4.

Таблица 21-4. Расчеты ANOVA, статистический пакет Statistica

 

SS

Degr. of

MS

F

p

 

 

Freedom

 

 

 

 

 

 

 

 

 

Intercept

18592,67

1

18592,67

1107,26

0,0000

 

 

 

 

 

 

treatment

72,33

2

36,17

2,15

0,1379

 

 

 

 

 

 

Error

403,00

24

16,79

 

 

 

 

 

 

 

 

timepoint

75,85

1

75,85

24,86

0,0000

 

 

 

 

 

 

timepoint*treatment

68,93

2

34,46

11,30

0,0003

 

 

 

 

 

 

Error

73,22

24

3,05

 

 

 

 

 

 

 

 

Шаг 3.

Проверка предположений о распределении остатков модели.

На Рис.21-1 представлен график “квантиль-квантиль” остатков модели.

Рис. 21-1. График “квантиль-квантиль” остатков модели.

219

Шаг 4.

Расчет эффектов и визуализация. Разультаты оценки средних и различий в средних по группам и лечению не приводятся.

На Рис.21-2 представлена различная визуализация результатов на основании оценки средних.

Рис. 21-2. Визуализация расчетов средних для ANOVA.

Таким образом, существует значимый общий эффект, связанный с лечением всех исследуемых пациентов(p<0,0001), различия в типах лечения незначимы (p=0,1379) Феномен одной из групп требует дополнительного изучения (действительно ли он связан с лечением или с особенностями пациентов данной группы).

Данные для расчета этого примера и R-скрипты для выполнения анализа приведены в Приложении R-12.

21.1. Контроль ошибки первого рода при множественных сравнениях

После проведения анализа вариаций у исследователя возникает желание сравнить группы между собой, например, по эффективности лечения.

Что обычно делают неправильно?

1. сравнивают только результаты (последнюю точку визитов);

Такое сравнение допустимо, если группы не различались между собой перед началом лечения. И, тем не менее, более грамотным будет учитывать начальные различия, пусть даже незначимые, при расчете эффектов, связанных с лечением.

2. не учитывают поправку на множественные сравнения.

Множественные сравнения обычно сопровождают анализ нескольких групп, независимо от того, являлись ли измерения повторяющимися или нет. Они выполняются после проверки общей гипотезы (omnibus hypothesis) о наличии неоднородности. Если отклонения от общей гипотезы незначимы, по выполнение попарных множественных сравнений проводить не имеет смысла. Мы можем получить некоторые частные эффекты (при парных сравнениях), однако общий

220

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение