Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / ОЗИЗО Общественное здоровье и здравоохранение / Статистический_анализ_данных_в_медицинских_исследованиях_в_2_ч_Красько

.pdf
Скачиваний:
3
Добавлен:
24.03.2024
Размер:
5.96 Mб
Скачать

значения, равные 0,5 – говорят о том, что вероятность наступления исхода “50 на 50”; если значения больше единицы, то исход скорее наступит, чем не наступит.

Отношение шансов (odds ratio) в двух группах OR BA CD .

Отношение шансов также измеряется в шкале отношений 0, . Его

интерпретация: исход скорее произойдет в группе под воздействием фактора, чем в группе без воздействия фактора (контрольной группе), если отношение шансов больше единицы; например если OR 3, то исход в 3 раза более вероятен в группе под воздействием фактора, чем в группе без воздействия фактора.

Если отношение шансов меньше единицы, то исход менее вероятен в исследуемой группе по сравнению с контрольной.

При OR 1 фактор не оказывает влияния на исход (не ассоциирован с исходом).

2.7.3. Взаимосвязь между относительным риском и отношением шансов

Рассчитаем пропорции возникновения заболевания в группах с наличием фактора и без наличия фактора, при условии, что группы (под воздействием фактора и без воздействия фактора) приняты за единицу (Табл.2–4).

Таблица 2–4. Пропорции в группах

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Фактор риска

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(прогноза)

 

 

 

 

 

 

 

 

 

 

 

 

Да

Нет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заболевание

 

Есть

 

 

π1

π2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(состояние)

 

Нет

 

 

 

1–π1

1–π2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

 

 

π

 

 

A

, π

 

 

 

B

.

 

 

 

 

 

 

 

 

 

1

 

A C

2

 

B

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Относительный риск RR

π1

 

, отношение шансов OR

π1

 

1–π2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

π2

 

 

π2

 

1 π1

Как видно, если π1 и π2 достаточно малы, то отношение шансов является хорошим приближением для оценки относительного риска (поскольку отношение

1–π2 очень близко к единице).

1 π1

В исследованиях случай-контроль нельзя оценить относительный риск, но всегда можно оценить отношение шансов, хотя иногда это может привести к ложным заключениям, если заключение распространяется на всю популяцию.

2.8. Подходы к анализу рисков при множественных исходах и нескольких уровнях фактора

Если у фактора есть 3 уровня, то возможно построение таблицы 2 3, которую можно проанализировать аналогично вышеприведенному и определить риски или отношения шансов (Табл.2–5).

Таблица 2–5. Представление данных таблицей 2 3

21

 

Фактор риска (прогноза)

Нет

Малый

Большой

 

Есть

 

 

A

 

C

E

A+C+E

Заболевание

 

 

 

 

 

 

 

 

(состояние) Нет

 

 

B

 

D

F

B+D+F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A+B

C+D

E+F

N

В этом случае определяется относительный риск от базового значения

фактора. Если за базовый принят столбец “Нет”, то

 

 

RR2

C C D

 

E E F

 

 

 

 

, RR3

 

.

 

 

 

A A B

A A B

 

 

 

Далее может оценивается гомогенность (однородность) относительных рисков, их тренды: возрастает ли относительный риск с увеличением уровня воздействия фактора ( RR3 RR2), убывает (RR3 RR2) или различий нет.

Для отношения шансов при нескольких уровнях фактора действия аналогичны.

OR2 CA BD , OR3 EF BA .

Аналогичные рассуждения можно применить и к множественным исходам, перейдя к таблицам, которые называются r c таблицы, таблицы сопряженности (contingency tables). Анализ таких таблиц относится к непараметрическому анализу (анализ таблиц сопряженности, см. раздел 14).

При исходе, который связан с количественным параметром, применяются иные подходы, например, анализ трендов, анализ ковариаций, регрессионный и дисперсионный анализ (хотя, по сути, задача остается все той же – определение возрастания или убывания некоторой исследуемой переменной, которая чаще всего связана с риском наступления исхода, при увеличении/уменьшении уровня некоторого фактора. Часто шкалу количественной переменной разбивают на некоторые диапазоны (например, ниже нормы, норма, выше нормы) и анализируют подобно таблицам сопряженности.

Приведенные выше расчеты относительных рисков и отношения шансов – это только краткое введение в оценку рисков. Далее, с помощью статистических оценок и процедур, мы сможем доказать, что фактор действительно ассоциируется с исходом, доказать наличие или отсутствие возрастания неблагоприятного или благоприятного исхода при изменении фактора. Подробнее о различных статистических процедурах анализа будет рассказано в следующих разделах.

Ремарка. Статистическая связь фактора и исхода не подразумевает ни биологическую, ни клиническую, ни иную связь или зависимость.

Основные аспекты

Различия между обсервационными и активными наблюдениями. Базовые типы дизайнов.

Естественная и целевая выборки, которые связаны с понятиями относительного риска и отношения шансов и возможностью экстраполяции результатов на всю популяцию.

Недопустимость подбора групп в дизайне “случай-контроль” по различию в исследуемой переменной, а только в схожести неисследуемых параметров, которые могут служить критериями включения и исключения в исследование.

Исход, как понятие дизайна в эпидемиологических исследованиях. Различие в понятиях “фактор риска” и “фактор прогноза”.

22

3. Переменные исследования и типы данных

3.1.Переменные исследования

Определив и сформулировав основную гипотезу исследований, необходимо определиться, какие данные нужны для ее доказательства (или опровержения). Прежде чем начать сбор и обработку данных, необходимо понять, как данные будут соотноситься между собой в исследовании. Переменные исследования могут быть следующими:

Независимые переменные (Independent Variables)

Переменные, воздействие которых исследуется для демонстрации их влияния на результат, называются независимыми переменными, ковариатами, предикторами,

факторами (independent variable, covariates, predictor, factor) . Так например, курение

– независимая переменная в исследовании заболеваемостью раком легких. Тип лечения также будет независимой переменной.

В обсервационных исследованиях независимой переменной не управляют. За ними пассивно наблюдают. В рандомизированных клинических испытаниях независимой переменной является препарат и дозы, которые контролируются на стадии начала исследования (несмотря на то, что пациенты получают лечение случайным образом – рандомизированно).

Зависимые переменные (Dependent Variables)

Переменные, которые изучаются в исследовании, однако они, как правило, не управляются исследователем. Если воспользоваться предыдущим примером, то наличие или отсутствие рака легких – это зависимая переменная. Их также называют переменной отклика, исходом (response, outcome). Термин “отклик” предполагает наличие причинно-следственной связи, что не всегда имеет место, или не всегда биологические доказуемо.

Скрытые/вмешивающиеся переменные (Confounding Variables)

Переменные, которые влияют одновременно на зависимые и независимые переменные в исследовании. Они не являются предметом изучения, но могут вносить искажения во взаимосвязь между зависимыми и независимыми переменными. Иногда они не включены в план исследования, однако проявляются в искажении результатов. Очень часто скрытыми переменными могут выступать возраст, пол. Их также называют вмешивающимися переменными. Для выявления их влияния может использоваться стратифицированный анализ, ковариационный анализ и др.

3.2.Типы данных в исследованиях

Данные, получаемые в результате наблюдений, бывают трех видов: количественные, порядковые и качественные.

Количественные данные (interval, continuous, cardinal data) – это величины,

которым присущ естественный порядок расположения с равными интервалами между последовательными значениями, независимо от их места на шкале. Например: масса, длина, количество полных лет и т.п. О них мы можем сказать – “в два раза больше”, “на 5 единиц больше”.

Порядковые/ординальные данные (ordinal data) – это величины, которые могут быть расположены в естественном порядке или ранжированы, например, от малого до большого, от хорошего до плохого, однако размер интервала между такими

23

соседними значениями не может быть выражен количественно. Например, малый – средний – выше среднего – большой – огромный. О них мы можем сказать “больше”, “меньше”, “лучше”, “хуже”, но не можем сказать, на сколько единиц больше или во сколько раз лучше. Их можно расположить по выраженности некоторого свойства и присвоить ранги (натуральные числа 1, 2,…). Эти ранги будут отражать порядок нарастания (убывания) некоторого свойства. Типичный пример – это группы риска при лечении некоторого заболевания (standard/intermediate/high risk).

Качественные/категориальные/номинальные данные (nominal data) – это величины, которые нельзя расположить в естественном порядке. Например, предпочтения в еде: рыба, пирожные, картофель, мясо. Или, например, способ лечения: хирургический, радиотерапия, обсервационный. Такие данные называют также категориальными, поскольку их можно отнести к той или иной категории.

Качественные данные, которые могут быть отнесены только к одной из двух категорий (наличие-отсутствие, мужчина-женщина, да-нет), называются

дихотомическими/биноминальными (dichotomous data, binominal data).

Качественные данные, которые могут быть отнесены к одной из нескольких категорий (больше двух) называются иногда мультиноминальными, чтобы подчеркнуть их отличие от биноминальных. Как уже было сказано, сами качественные данные нельзя расположить в естественном порядке, но, тем не менее, можно задать искусственный порядок, связав категории с интервалами некоторой шкалы (порядковой или количественной). В этом случае они называются упорядоченными категориями (ordered multinomanal data) и совпадают с порядковыми данными. Например, есть три группы лечения – плацебо, традиционное и экспериментальное лечение. Лечение – это качественный фактор, однако по некоторым соображениям мы можем говорить о том, что группы лечения могут быть упорядочены определенным образом и проследить, есть ли тренд в эффекте от лечения в группах плацебо (1), традиционного лечения (2) и экспериментального лечения (3).

В любом случае, каждое из наблюдений в выборке может быть отнесено только к одной из категорий.

Мы также можем сравнивать количество объектов, принадлежащих разным категориям (например, количество наблюдений в группе). Для этого используется шкала целых неотрицательных чисел, на которой далее мы можем выполнять такие действия, как сложение, умножение. Однако надо понимать, что сравнивается не два объекта на одной шкале измерения, а две или более группы объектов по их количеству.

Ремарка: от типа данных зависит способ их обработки и анализа. Например, вы не можете складывать предпочтения в еде, среднее для описания выборки в таком исследовании невозможно. Также и методы обработки наблюдаемых данных зависят от их типа.

Несмотря на то, что эти три градации полностью описывают возможные типы данных в исследовании, необходимо заметить, что в статистическом анализе таких данных есть свои нюансы, и выбор статистической процедуры анализа зависит именно от них.

Количественные данные, полученные в исследовании, могут подчиняться закону нормального распределения. Если в процессе анализа выявляется, что это не так, то к таким данным относятся как к порядковым данным (понижение шкалы). Например, у нас есть несколько измерений: 0,5; 2,7; 13,4; 105,1, 578,3. По форме это количественные данные, но размах всего пяти значений от 0,5 до 578,3 не позволит нам анализировать их как данные из нормального распределения. В этом случае

24

более правильным будет выбор процедур анализа, которые интерпретируют эти данные как ранги 1, 2, 3, 4, 5.

Качественные данные могут иметь несколько категорий, которые могут быть упорядочены, например, тяжесть заболевания (I, II, III, IV). В этом случае их также можно отнести к порядковым данным.

Мультиноминальная (в частности, биноминальная) переменная представляет собой данные, в которых в основном, содержатся некоторые события, например: жив-умер, заболел-здоров и пр. Если исследователя интересует количество определенных событий, наступивших в исследовании, то оно подсчитывается на основании биноминальных данных. Для выборки, содержащей более одного наблюдения, мы можем оценить частоту появления некоторого события. Если мы делим количество наблюдений, когда определенные события наблюдаются выборке, на общее число наблюдений в выборке, мы оцениваем пропорцию. Пропорция, рассчитанная на основе естественной выборки – это точечная оценка пропорции в популяции. Интерпретация пропорции выборки – это оценка вероятности событий в популяции (для когортных и одномоментных исследований). И эта вероятность не имеет нормального распределения. Предполагается, что события распределены по биномиальному или Пуассоновскому закону.

Биномиальное распределение используется при расчете вероятностей, когда наблюдения независимы друг от друга, то есть результат одного наблюдения не зависит от другого, а исход измеряется биноминальной переменной (событие наступило/событие не наступило).

Пуассоновское распределение – это частный случай биномиального распределения, которое используется, когда события являются редкими по отношению ко всей выборке, поэтому для расчета используются не пропорция, а

уровень риска, интенсивность, скорость (rate). Понятие "rate" будет подробно рассмотрено в разделе 18.

Вобщем случае и пропорция и интенсивность состоят из числителя и знаменателя. Числитель – это количество событий и для интенсивности и для пропорции. Знаменатель для пропорции – это общее количество наблюдаемых в выборке. Знаменатель для интенсивности – рассчитывается как число человеко-лет (person-year) наблюдения до наступления события или окончания исследования. В открытых когортных исследованиях чаще используется интенсивность (rate), поскольку события редкие и развиваются во времени. В остальных типах дизайна чаще используется пропорция.

Вотечественной литературе (на русском языке) часто эти два понятия смешивают, поскольку термин “rate” имеет несколько переводов и может переводится как “доля”. В дальнейшем по тексту будет говориться или о пропорции или о интенсивности/уровне риска, как об отношении, характеризующим частоту событий в выборке, в зависимости от того, какие исследования нас интересуют.

Также в англоязычной литературе кроме термина пропорция “proportion” используется термин “fraction” – пропорция, часть, доля. Фактически они выражают одну и ту же величину, только пропорция обычно измеряется в процентах, часть измеряется в долях от 1.1

1 В оригинале книги Ланга (2011) ( Lang and Secic, How to Report Statistics in Medicine: Annotated Guidelines for Authors) используются термины “proportion” и “rate”, которые в руском переводе книги звучат как “доля” и “частота” соответственно.

25

Таким образом, для медико-биологических исследований с последующим статистическим анализом можно выделить:

Количественные данные

количественные переменные, распределенные по закону нормального распределения (измеряются для каждого участника исследований);

количественные переменные, не подчиняющиеся закону нормального распределения (измеряются для каждого участника исследований);

Категориальные данные1

мультиноминальные переменные – упорядоченные категории (рассчитывается количество случаев в каждой категории по выборке);

мультиноминальные переменные – неупорядоченные категории (рассчитывается количество случаев в каждой категории по выборке);

биноминальные переменные (рассчитывается пропорция по выборке);

Время до события (time-to-event) и интенсивность событий (rate)

интенсивный показатель (rate) рассчитывается как отношение количества событий ко времени наблюдения;

бинарные переменные (исходы), связанные со временем наблюдения.

Заметим, что есть и многомерные исходы (т.е. исследуется сразу несколько вариантов исхода), связанные со временем наблюдения, но в данном пособии они не рассматриваются.

Основные аспекты

Выбор переменной, описывающий исход, необходимо осуществить до начала исследования.

Зависимая переменная в исследовании чаще всего одна и как правило, интерпретируется как исход.

Независимых переменных может быть несколько, и они разные по своей природе и могут быть связаны между собой.

Скрытые переменные могут исказить результаты ваших доказательств.

Задача статистического анализа в эпидемиологических исследованиях – найти связь, ассоциацию, зависимость между исходом и факторами, предположительно влияющими на исход, доказать, что они действительно связаны в статистическом смысле, если возможно, оценить степень этой связи.

Задача статистического анализа в экспериментальных исследованиях – доказать наличие различий между контрольной и экспериментальной группой (групп в эксперименте может быть несколько) и оценить размер эффекта (т.е. размер различий), если это возможно.

1 Чаще такие переменные в медико-биологических исследованиях выглядят как группы/подгруппы исследования. Тем не менее, по сути группы – это категориальная переменная исследования.

26

4. Гипотеза исследования

Гипотеза формулируется в начале исследования, для того, чтобы понять, какие доказательства нужно собрать для ее подтверждения или опровержения, какой дизайн исследования предпочесть. Формулирование основной гипотезы (primary hypothesis) исследования включает формулирование нулевой гипотезы ( H0 ), которая является “основным состоянием”, которое, как предполагают, верно, в

отсутствии убедительных доказательств, и альтернативной гипотезы ( HA ), которая

будет принята после соответствующих доказательств. Иными словами, основное состояние будет сохраняться, до тех пор, пока не будет доказательств обратного.

4.1.Ошибки I и II рода при проверке гипотез

Втаблице 4–1 приведены возможные отношения гипотезы и истинного состояния проблемы.

Таблица 4–1. Соотношение гипотезы исследования и истинного состояния проблемы Истинное состояние

 

H0 истинна

H0 ложна

Принятие H0

Корректно

Ошибка II рода

 

 

 

 

 

Отклонение H0

Ошибка I рода

Корректно

 

 

 

 

 

Ошибки первого рода (type I errors, errors, false positives) и ошибки второго рода (type II errors, β errors, false negatives) в математической статистике – это

ключевые понятия задач проверки статистических гипотез.

Ошибка I рода обозначается α (альфа-ошибка) и означает, что нулевая гипотеза H0 отвергается, что приводит к ложноположительному заключению о

наличии, как правило, некоторого эффекта между изучаемыми величинами, в то время, когда на самом деле его не существует. Иными словами, отвергается нулевая гипотеза H0 , когда она истинна.

Ложноотрицательное заключение – это принятие нулевой гипотезы H0 , в то время как эффект существует. Иными словами, нулевая гипотеза H0 остается в силе, когда она ложна. Такая ошибка называется ошибкой II рода, обозначается β (бетаошибка).

Мощность теста (вероятность отклонения нулевой гипотезы, когда она ложна) определяется как 1 β . Мощность 80–90% обычно является приемлемым

уровнем в исследованиях.

Заметьте, что мы говорим только о нулевой гипотезе, т.е. мы ее опровергаем, что служит доказательством альтернативной гипотезы, или не опровергаем, что констатирует текущее состояние исследуемого вопроса.

Ремарка: Нулевая гипотеза не доказывается, она остается неопровергнутой в отсутствии других доказательств.

4.2.Понятие уровня значимости

Встатистике результат называют статистически значимым, если мала вероятность чисто случайного его возникновения при нулевой гипотезе H0 . Степень

отклонения от нулевой гипотезы H0 “статистически значима”, если имеются

27

данные, появление которых было бы маловероятно, если бы эта гипотеза была верна.

Уровень значимости критерия (теста) – это традиционное понятие проверки гипотез в статистике. Он определяется, как вероятность принять решение отклонить нулевую гипотезу H0 , если на самом деле она верна. Процесс решения

часто опирается на величину p : если p меньше уровня значимости, то нулевая гипотеза H0 отвергается. Чем меньше величина p , тем более значимой называется тестовая статистика. Чем меньше величина p , тем сильнее основания отвергнуть нулевую гипотезу H0 .

Уровень значимости в исследованиях – это вероятность ( p ), ниже которой нулевая гипотеза H0 может быть отвергнута. Большинство прикладных исследователей в медицине принимают p 0,05 для того, чтобы отклонить нулевую гипотезу H0 .

Хотя статистическая значимость может быть истинной, она может быть также искусственной из-за скрытых/вмешивающихся факторов. Статистическая значимость не доказывает ни причинно-следственную связь, ни клиническую значимость.

Ремарка: Уровень значимости и есть ошибка I рода (ложноположительного результата) – вероятность отклонения нулевой гипотезы, когда она истинна.

4.3.Этапы проверки статистических гипотез

Проверка гипотез исключительно важна в медико-биологических исследованиях, она позволяет исследователям обобщить выводы, которые базируются на исследовательской выборке, на всю популяцию.

Целью проверки гипотез является определение статистической значимости. Проверка гипотезы может подтвердить или отклонить утверждение о том, что наблюдаемые результаты не случайны, а отражают связь между переменными.

Общий подход таков: выдвигается нулевая гипотеза H0 о том, что зависимости между изучаемыми явлениями нет. Альтернативная гипотеза HA заключается в том, что связь есть, и она не случайна.

Таким образом, выдвигаются две противоречащие друг другу гипотезы: нулевая гипотеза H0 о том, что связь (зависимость) случайна, альтернативная HA ей

противоречит. Доказав, что гипотеза H0 несостоятельна, мы докажем, что альтернативная гипотеза верна.

Для проверки гипотезы используют критерии (тесты), позволяющие принять или опровергнуть гипотезу.

Ремарка: Проверяется всегда нулевая гипотеза. Доказывается - альтернативная гипотеза путем опровержения нулевой гипотезы.

1. Формулируется основная гипотеза H0 и альтернативная гипотеза HA .

3. Задается вероятность α , называемая уровнем значимости и отвечающая ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.

2. Задается некоторый статистический критерий (функция от выборки – статистика), для которой в условиях справедливости гипотезы H0 существует

известный закон распределения.

28

Расчет значения статистики критерия, по ее значению можно делать выводы об истинности гипотезы H0 ;

4. Сравнение значений статистики критерия со значениями из известного распределения вероятности (для данной статистики).

Ремарка: Когда исследуется наличие разницы в двух выборках, например по среднему значению, то исследователь может предположить, что например, среднее контрольной группы больше, чем среднее исследуемой группы (A>B). Тогда проверка гипотезы осуществляется по одностороннему критерию. Если исследователь предполагает, что А отличается от В (A>B или A<B) , то это так называемый двусторонний критерий.

5.Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в формулу статистики и по попаданию (или непопаданию)статистики в критическую область выносится решение об отклонении выдвинутой гипотезы H0 .

6.Интерпретация результатов статистической проверки.

Особенность доказательной статистики такова, что вы можете доказать альтернативную гипотезу, путем опровержения нулевой гипотезы, но вы не доказываете нулевую гипотезу. Нулевая гипотеза либо опровергается в пользу альтернативной, либо нет.

7. Расчет эффектов.

Под эффектом понимается некоторая числовая оценка различий, или связи, или зависимости между изучаемыми переменными. Это одна из основных процедур анализа данных, которая дает возможность рассчитать и оценить эффект, который доказан статистически, т.е., например, исследователь доказал, что использование некоторого нового метода послеоперационного ведения пациентов статистически значимо уменьшает срок нахождения пациента в госпитале. Естественный вопрос - на сколько дней в среднем сократится пребывание пациента в госпитале при внедрении нового метода послеоперационного ведения пациентов? Оценка среднего сокращения пребывания в днях (с расчетом доверительного интервала) и есть размер эффекта применения нового метода.

4.4.Мощность исследования и расчет объемов выборок

Анализ мощности – это априорный расчет размера выборки, который достаточен, чтобы ответить на основной вопрос исследования. Как правило, при планировании дизайна исследования размер ресурсов (как правило, финансовых) ограничен. Также ограничения могут быть связаны с редкостью исследуемого заболевания. Чтобы избежать исследований, которые не смогут ответить на их основной вопрос или исследований, которые тратят ресурсы, будучи больше, чем они должны быть, необходимо проводить анализ мощности. Также этот анализ заставит исследователя точнее сформулировать свой основной вопрос, определить основную переменную (primary variable) исследования, а таже продумать, какой размер эффекта будет клинически значим (см. раздел 23). В этом смысле анализ мощности необходим в клинических испытаниях.

Расчет необходимого размера выборки производится при проектировании дизайна исследования.

Для расчета необходимого размера выборки предполагается, что исследователь знает следующие величины:

– мощность (1β ), которая определяется вероятностью ложного принятия нулевой гипотезы H0 . Обычно выбирают мощность, равную 80–90% , т.е.

β 0,1 0,2;

29

уровень значимости α – граничный уровень, ниже которого отвергают нулевую гипотезу H0 . Обычно это 0,05 или 0,01;

вариацию наблюдений, например стандартное отклонение, если с исходом связана числовая переменная;

наименьший интересующий эффект — величина минимального эффекта, который важен в исследовании. Часто это некоторое различие (например, разность в средних или пропорциях). Эффект, например, может быть выражен в том, что снизилось содержание сахара в крови на 10 ммоль/л, или снижение постоперационных осложнений на 20%.

Поскольку вопрос о расчете объема выборки для рандомизируемых клинических испытаний (randomized clinical trials – RCT) часто вызывает трудности у исследователей, ниже приведены некоторые формулы для расчета объемов выборок при различных дизайнах.

Расчет напрямую зависит от гипотезы исследования, которая выдвигается перед началом RCT.

Основными целями RCT бывают1: доказательство различий (статистические различия), доказательство превосходства (Superiority trials), доказательство эквивалентности2 (Equivalence trials), доказательство полноценности (Non-inferiority trials).

Одновыборочный дизайн

В RCT это может быть различие между повторными измерениями одной группы (или согласованных пар – matched pairs), например данные до и после лечения.

Различие в истинных средних между ответами на

изучаемый препарат и

исходным

значением есть ε μ μ0 . Аналогично,

для

бинарной переменной

ε π π0 ,

где π0 - истинная вероятность ответов

бинарной переменной, π -

истинная вероятность ответов после лечения (воздействия). Истинные значения мы никогда не значем, но можем оценить по выборке.

 

 

 

Для количественной переменной

s2 - есть оценка дисперсии (выборочная

дисперсия)

разности

 

 

в

 

 

изучаемом

параметре

до и после воздействия,

 

2

 

1

n

 

 

2

 

 

 

1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

xi x , где x

 

 

xi - оценка среднего (выборочное средние) разности в

 

n 1

 

n

 

 

 

i 1

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

изучаемом параметре;

переменной p 1 p есть

 

 

 

 

Для

бинарной

выборочная дисперсия, p -

наблюдаемая доля/пропорция ответов на лечение. p есть число в промежутке 0;1 . Стоит заметить, что максимальная оценка дисперсии достигается при p 0,5.

Поэтому при отсутствии априорной информации

можно

использовать

p 1 p 0,25.

 

 

Также при клинических испытаниях задают δ

клинически допустимый

запас (величина клинически значимых различий)

по

полноценности/

эквивалентности/ превосходству.

 

 

1Математические выкладки опущены, подробнее можно прочесть в Chow S.C., Wang H., Shao J. Sample Size Calculations in Clinical Research, — Chapman & Hall/CRC Biostatistics Series, — 2008.

2Есть понятие биоэквивалентности (фармакокинетической эквивалентности, bioequivalece). Для таких исследований есть специальные дизайны, вычисления и определение размеров выборок.

30

Соседние файлы в папке ОЗИЗО Общественное здоровье и здравоохранение