Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информатика

.pdf
Скачиваний:
144
Добавлен:
20.05.2015
Размер:
4.62 Mб
Скачать

51

ских исследований становится необходимым, - случайные ошибки измерения клинических показателей. На языке математики величина любого варьирующего признака является переменной случайной величиной, а ее конкретные значения принято называть вариантами.

Важной задачей при проведении статистического анализа клинических данных является определение одного или нескольких признаков, которые в данном клиническом исследовании будут адекватно оценивать сравниваемый эффект. Вообще словом «эффект» независимо от его медицинского смысла мы будем называть любые проявления действия изучаемого препарата (или метода лечения), которые выбраны исследователем для демонстрации его эффективности, безопасности и т.д. Показатели определенного таким образом эффекта обладают межиндивидуальной вариабельностью.

Статистику еще часто определяют как науку принятия разумных решений перед лицом неопределенности. При этом двум категориям задач статистики уделяют особое внимание: статистическое оценивание и проверка статистических гипотез. Первая задача делится на точечное и интервальное оценивание параметров распределения. Вообще статистические задачи появляются тогда, когда необходимо дать наилучшие, в некотором смысле, ответы по ограниченному числу наблюдений. Если бы число наблюдений не было ограниченным, можно было точно определить параметры распределений и сравнить их, при этом никакой статистической задачи не было бы. Если в ходе исследований мы могли бы изучить все объекты интересующей нас совокупности (например, всех больных с определенным заболеванием), то можно было бы сказать, что мы имеем дело со сплошным изучением генеральной совокупности. На самом деле обследовать все объекты совокупности удается редко, обычно приходится изучать лишь выборку, надеясь, что эта выборка достаточно хорошо отражает свойства изучаемой совокупности. При этом также возникают важные статистические задачи: случайный отбор вариант из генеральной совокупности и

представительность выборки, а также определение необходимого объема вы-

борки для формирования статистически значимого заключения по результатам проведенных исследований.

Все статистические методы исходят из предположения, что данные извлечены из совокупности случайно. А это значит, что вероятность оказаться выбранным для всех членов совокупности должна быть одинакова. Случайным должно быть и отнесение пациента к той или иной сравниваемой группе, т.е. каждый пациент должен иметь равный шанс попасть в любую группу в исследовании. Предназначенные для решения этой статистической задачи методы называются методами рандомизации. Рандомизация не только уравнивает вероятность получения пациентом различных сравниваемых воздействий, но и позволяет формировать группы, сходные с точки зрения прогностических факторов. Таким образом, рандомизация обеспечивает подбор больных так, чтобы контрольная группа ни в чем не отличалась от экспериментальной, кроме изучаемого метода лечения. Но и этого оказывается недостаточно. Тесно связана с проблемой рандомизации и так называемая проблема слепоты исследования. Для того чтобы ни врач, ни исследователь, ни пациент не могли каким-либо об-

52

разом влиять на получаемые результаты, используется такое понятие, как слепота исследования. Например, если позволяют клинические особенности данного исследования, часто применяется так называемый двойной слепой метод, когда ни врач, ни пациент не знают, какой из методов лечения был применен.

Важным вопросом является и вопрос представительности (или репрезентативности) выборки по отношению ко всей популяции, из которой она отбиралась. Обычно, если выборка извлечена из совокупности случайным образом и имеет достаточно большой объем, средние характеристики пациентов в выборке практически такие же, как в соответствующей популяции. На практике большинство групп пациентов, включенных в различные клинические исследования, представляют собой смещенные выборки. Это связано с особенностями включения пациентов в исследование: часто пациенты включаются потому, что находятся на лечении в центре, проводящем исследование, или потому, что, с точки зрения исследователя, представляют собой интересный клинический случай. В принципе такое отсутствие репрезентативности не приводит к какимто неправильным выводам. Однако исследователь должен четко понимать, на какую популяцию реально могут быть распространены результаты, полученные

втаком исследовании.

Влюбом исследовании получаются некоторые данные, которые в определенной степени отражают изучаемые свойства. Для дальнейшего корректного применения статистических методов необходимо понимать, в какой шкале представлены клинические данные.

Типы клинических данных:

1. Шкала классификаций (наименований).

Величины, которые в произвольном порядке обозначают классы или категории данных. Нумерация (или их наименования) служит только для идентификации показателей, не подразумевая их количественную взаимосвязь. Такие величины невозможно расположить на шкале в их естественном порядке.

Пример: пол, расовая принадлежность. 2. Порядковая шкала.

Величины, которые (по своей природе) могут быть выстроены в логическую последовательность. Эти данные могут быть расположены на шкале в их естественном порядке, или упорядочены по величине. При этом, абсолютные значения интервалов между категориями данных измерять невозможно.

Пример: тяжесть состояния, величина отеков. 3. Числовая (непрерывная) шкала.

Имеет непрерывную шкалу измерения, значения которой могут дробными. Бывает двух видов: шкала интервалов или шкала отношений.

3.1. Interval scale Шкала интервалов. Непрерывная числовая шкала не имеющая естественного начала. Переменным присущ естественный порядок расположения с равными интервалами между последовательными значениями, независимо от их места на шкале. Значения данных на шкале интервалов бессмысленно складывать.

Пример: температура, время.

53

3.2. Ratio scale Шкала отношений. Числовая шкала количественных переменных, для значения которых осмыслена операция вычитания и которые имеют естественный ноль.

Пример: вес, длина.

Планирование медицинских экспериментов. При планировании иссле-

дований очень важно сформулировать его цель. Если целью проводимого исследования является установление различий (или преимущества) методов лечения, математически данный вопрос решается обычно с помощью проверки

статистического критерия (или теста). Применяемые для этого процедуры связаны с формулированием статистических гипотез. Иногда для решения этой задачи применяют и метод доверительных интервалов.

Особенностью планирования клинических исследований является то, что исследователь никогда не имеет в своем распоряжении всей популяции (генеральной совокупности) для проведения исследования и обычно имеет дело только с выборкой из этой совокупности. При этом особую важность приобретают задачи планирования, например, определение объема выборки, которого оказалось бы достаточно для формирования статистически значимого заключения о различиях (или отсутствии таких различий) в эффекте по результатам проведенного исследования. На практике часто на этапе планирования исследования эта задача не решается строго, а планируемый объем назначается на основе прошлого опыта проведения аналогичных исследований. При этом в процессе статистического анализа может оказаться, что полученных данных или недостаточно для статистически достоверного ответа на вопросы, ради которых проводилось исследование, или их структура не соответствует цели исследования. Исследователям надо иметь в виду, что неэтичными являются исследования, имеющие чрезмерно большую численность включенных пациентов, так и исследования слишком малого объема.

Чтобы ответить на вопросы, поставленные перед клиническим исследованием, с помощью различных критериев приходится проверять нулевую гипотезу об отсутствии эффекта, сравнивая при этом выборочные средние, доли, кривые выживаемости и т.д. Вывод об отсутствии таких различий тесно связан с понятием чувствительности критерия.

Чувствительностью критерия называют его способность обнаружить различия. Чтобы оценить чувствительность критерия, нужно задать величину различий, которые он должен выявлять. Если в результате проверки гипотезы о существовании различий был сделан вывод об их отсутствии, необходимо проверить, была ли чувствительность критерия достаточной для обнаружения таких различий. Чувствительность зависит не только от величины различий, но и от разброса данных и объема выборки. Если посмотреть на объем выборки, чем он больше, тем меньшие различия окажутся статистически значимыми. Таким образом, появляется возможность заранее оценивать численность выборок, необходимых для выявления эффекта.

Важнейшие понятия в любом клиническом исследовании – это чувствительность и специфичность, в частности, если речь идет о диагностическом исследовании. Чувствительный тест часто дает положительный результат при

54

наличии заболевания (обнаруживает его). Однако, особенно информативен он, когда дает отрицательный результат, т.к. редко пропускает пациентов с заболеванием. Специфичный тест редко дает положительный результат при отсутствии заболевания. Особенно информативен при положительном результате, подтверждая (предположенный) диагноз.

Подводя итог краткому введению в основные понятия доказательной медицины, следует отметить, что, несмотря на значительное распространение принципов доказательной медицины в странах Западной Европы и США, в Украине ее развитие существенно сдерживается, что объясняется следующими причинами:

низкой степенью мотивации специалистов, ответственных за принятие решений;

активным влиянием на этих специалистов представителей фармацевтической индустрии, пытающихся превратить доказательную медицину в инструмент поиска конкурентных преимуществ;

отсутствием системы подготовки специалистов здравоохранения по доказательной медицине.

Названные факторы усугубляются несистематическим использованием врачами книжных, электронных баз данных и государственных справочных изданий из-за физической недоступности.

Контрольные вопросы

1.Приведите классификации научных клинических исследований.

2.Какова роль статистического метода анализа в доказательной медицине?

3.Приведите шкалы оценки доказательств.

4.В чем отличие рандомизированных от нерандомизированных исследований?

5.Какими бывают исследования по степени открытости данных?

6.Что такое «дизайн исследования»?

7.Перечислите и охарактеризуйте фазы клинических испытаний.

8.Что означает «исследование случай-контроль»?

9.В чем отличия проспективного от ретроспективного исследования?

10.Что такое «параллельное исследование»?

11.Что понимают под «эффектом» при проведении статистического анализа клинических данных?

12.Каковы основные особенности планирования медицинских экспериментов, которые необходимо учитывать?

13.Что такое чувствительность критерия?

14.Что такое чувствительность и специфичность применительно к диагностическому тесту?

15.Какие Вам известны источники научно обоснованной информации?

16.В чем причины затруднений распространения доказательной медицины в Украине?

55

Список литературы

1.Власов В.В. Введение в доказательную медицину. – М: Медиасфера,

2001. – 392 с.

2.Гринхальх Т. Основы доказательной медицины. – М.: ГЭОТАР-МЕД,

2009. – 288 с.

3.Клюшин Д. А., Петунин Ю. И. Доказательная медицина. Применение статистических методов. – М.: «Диалектика», 2007. – 320 с.

4.Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ Statistica. – М: Медиасфера, 2006. – 312 с.

5.Страус Ш.Е., Ричардсон В.С. Медицина, основанная на доказательствах.

– М.: ГЭОТАР-МЕД, 2010. – 320 с.

6.Флетчер Р., Флетчер С., Вагнер Э. Клиническая эпидемиология. Основы доказательной медицины. – М: Медиасфера, 1998. – 352 с.

7.Кокрановское сотрудничество. – Режим доступа: www.Cochrane.org.

8.Международный журнал медицинской практики. – Режим доступа: www.mediasphera.ru.

9.Основы клинической эпидемиологии и доказательной медицины. – Ре-

жим доступа: http://ebm.org.ua

10.Страница Российского отделения Кокрановского Сотрудничества. – Ре-

жим доступа: http://www.cochrane.ru/

56

ТЕМА 5 ВВЕДЕНИЕ В БИОМЕДИЦИНСКУЮ СТАТИСТИКУ

Вмедицине проведение клинических исследований напрямую связано с всесторонним анализом полученных данных. Поэтому изучение прикладной статистики является неотъемлемой частью обучения персонала, принимающего участие не только в статистическом анализе результатов, но и в процессе сбора клинических данных. Этические и экономические соображения диктуют необходимость внимательного отношения к планированию клинических исследований. Кроме того, владение методиками обработки информации позволяет персоналу более эффективно организовать процедуру сбора исходных данных.

Вздравоохранении и клинической медицине часто используются, сознательно или неосознанно, различные статистические концепции при принятии решений по таким вопросам, как клинический диагноз, прогнозирование возможных результатов осуществления тех или иных программ в данной группе населения, прогнозирование течения заболевания у отдельного больного, выбор лечения для конкретного больного, и т.п. Статистика находит повседневное применение в лабораторной практике. Знание статистики стало важным для понимания и критической оценки сообщений в медицинских журналах. Таким образом, знание принципов статистики абсолютно необходимо для планирования, проведения и анализа исследований, посвященных оценке различных ситуаций

итенденций в здравоохранении, а также для выполнения научных исследований в области медицинской биологии, клиники и здравоохранения.

Применение статистики в здравоохранении необходимо как на уровне сообщества, так и на уровне отдельных пациентов. Медицина имеет дело с индивидуумами, которые отличаются друг от друга по множеству характеристик, таких, как масса тела, возраст, рост, артериальное давление, уровень холестерина, иммуноглобулинов и т.д. Значения показателей, на основании которых человека можно считать здоровым, варьируются от одного индивидуума к другому. Нет двух совершенно одинаковых пациентов или двух групп индивидуумов, однако решения, касающиеся отдельных больных или групп населения, приходится принимать, исходя из опыта, накопленного в отношении других больных или популяционных групп со сходными биологическими и социальными характеристиками. Ввиду существующих различий эти решения не могут быть абсолютно точными – они всегда сопряжены с некоторой неопределенностью. В этом и заключается вероятностная природа медицины.

Вариация признака (или фактора, или результатов измерения) возникает, если их значения меняются от индивидуума к индивидууму или для одного индивидуума во времени. Едва ли не всем характеристикам организма человека, будь то физиологические, биохимические или иммунологические, свойственна вариабельность. Кроме того, возникает проблема обработки результатов очень большого числа измерений. Например, если бы можно было изучить всех больных туберкулезом в мире, то такая группа больных составила бы генеральную совокупность.

57

Генеральная совокупность состоит из всех единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования. Естественно, практически это невозможно, поэтому при изучении здоровья населения генеральная совокупность рассматривается в пределах конкретных границ, очерченных территориальным или производственным признаком, и поэтому включает в себя определенное число наблюдений.

Выборочная совокупность (выборка) – часть генеральной совокупности, по свойствам которой судят о генеральной совокупности. На основе анализа выборочной совокупности можно получить достаточно полное представление о закономерностях, присущих всей генеральной совокупности. Выборочная совокупность должна быть репрезентативной, т.е. в отобранной части должны быть представлены все элементы в том соотношении, как и в генеральной совокупности. Выборочная совокупность должна отражать свойства генеральной совокупности, т.е. правильно ее представлять.

Сложности возникают при попытках обобщить характеристики в группе больных или популяционной группе; решить, какое значение той или иной характеристики будет идеальным, нормальным, средним и т.п.; сопоставить две группы больных или две популяционных группы по конкретной характеристике.

Поскольку обычно имеется совокупность наблюдений (десятки, сотни, а иногда – тысячи результатов измерений индивидуальных характеристик), то возникает задача компактного описания имеющихся данных. Для этого используют методы описательной статистики – описания результатов с помощью различных показателей и графиков.

Все изучаемые показатели варьируются, но не все они поддаются непосредственному измерению. Так возникает деление на количественные и качественные показатели. Классификация типов данных (рис. 5.1) приведена согласно [7]. В зависимости от типа данных используются те или иные описательные статистики.

Для результатов измерений в шкале отношений показатели описательной статистики можно разбить на несколько групп:

-показатели (меры) положения описывают положение экспериментальных данных на числовой оси. Примеры таких данных – максимальный и минималь-

ный элементы выборки, среднее значение, медиана, мода и др.;

-показатели (меры) рассеяния описывают степень разброса данных относительно своего центра (среднего значения). К ним относятся: выборочная дис-

персия, разность между минимальным и максимальным элементами (размах,

интервал выборки) и др.

-показатели асимметрии: положение медианы относительно среднего и др.

-графическое представление распределения данных, например, в виде гисто-

граммы, эмпирической функции распределения и др.

Данные показатели используются для наглядного представления и первичного («визуального») анализа результатов измерений характеристик экспериментальной и контрольной группы.

58

ТИПЫ ДАННЫХ

 

 

 

 

 

 

 

 

КОЛИЧЕСТВЕННЫЕ

 

 

 

КАЧЕСТВЕННЫЕ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ПОРЯДКОВЫЕ

непрерывные

-масса тела;

-температура;

-уровень сахара в крови и т.д.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дискретные

 

 

 

дихотоми-

 

 

 

 

 

 

 

 

 

 

ческие

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-число рецидивов за

 

 

могут быть отнесе-

 

 

период;

 

 

ны к двум противо-

 

 

 

 

положным катего-

 

 

- количество пере-

 

 

 

 

 

 

риям ДА-НЕТ

 

 

несенных операций

 

 

 

 

 

 

 

 

 

 

и т.д.

 

 

 

 

 

 

 

 

 

можно упорядочить как количественные данные,

но нельзя производить арифметические действия

категоризированные

число градаций больше двух, представляются в виде частот наблюдений, попавших в некоторые категории или классы

Рис. 5.1. Типы медико-биологических данных, используемых в статистическом анализе.

Меры положения это общее понятие для числового выражения локализации данных (на числовой оси) как типичного результата измерения. Самыми распространенными из них являются среднее и медиана.

Среднее арифметическое, которое очень часто называют просто «среднее», получают путем сложения всех значений и деления этой суммы на число значений в наборе. Это можно показать с помощью алгебраической формулы.

Набор n наблюдений переменной x можно изобразить как {x1; x2 ;...; xn } . В таком случае формула для определения среднего арифметического наблюдений имеет вид (5.1):

 

 

 

n

 

 

x1 x2 ... xn

 

xi

 

 

 

i 1

(5.1).

n

n

 

 

 

Например, измерив артериальное давление у десяти пациентов с целью исследовать систолическое давление, т.е. только одно число, получим: серия наблюдений (статистическая совокупность) артериального систолического давления в 11-ти наблюдениях имеет следующий вид:

 

 

 

 

 

 

 

 

 

 

Таблица 5.1

1

2

3

4

5

6

7

8

9

10

11

 

120

115

120

125

120

115

120

115

120

120

125

 

59

Среднее арифметическое значение в данном

ряду будет равно

120 115 120 125 120 115 120 115 120 120 125

119,5 .

Таким образом, мы

11

 

 

можем получить характеристику, которая одним числом описывает ряд значений.

Средняя арифметическая величина обладает тремя свойствами:

1.Средняя занимает серединное положение в проранжированном (выстроенном по возрастанию или убыванию) ряду. В строго симметричном ряду среднее совпадает с модой и медианой.

2.Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных. Она отражает то типичное, что характерно для всей совокупности.

3.Сумма отклонений всех вариант от средней равна нулю: (xi ) 0 .

i 1n

Медиана. Если упорядочить данные по величине, начиная с самой маленькой величины и заканчивая самой большой, то медиана также будет характеристикой усреднения в упорядоченном наборе данных. Медиана делит ряд упорядоченных значений пополам с равным числом этих значений как выше, так и ниже ее (левее и правее медианы на числовой оси).

Вычислить медиану легко, если число наблюдений n нечетное. Это будет

наблюдение номер n 1 . Если n четное, то, строго говоря, медианы нет. Одна-

2

ко обычно можно вычислять ее как среднее арифметическое двух соседних средних наблюдений в упорядоченном наборе данных (т. е. наблюдений номер n n

2и 2 1 ).

Врассмотренном выше примере медиана равна 120.

Мода – это значение, которое встречается наиболее часто в наборе данных; если данные непрерывные, то их обычно группируют и вычисляют модальную группу. Некоторые наборы данных не имеют моды, потому что каждое значение встречается только 1 раз. Иногда бывает более одной моды; это происходит тогда, когда 2 значения или больше встречаются одинаковое число раз и встречаемость каждого из этих значений больше, чем любого другого значения. В этом случае мода совпадает с минимальным модальным значением.

Для данных из таблицы 1 мода, очевидно, равна 120.

Заметим важную особенность моды и медианы: на их величины не оказывают влияние числовые значения крайних вариант.

Меры рассеяния это статистические показатели, характеризующие степень вариации, разброса значений признака относительно среднего значения (для признаков, имеющих количественный характер) и равномерного распределения (для признаков качественного типа). В зависимости от типа признаков существуют различные меры рассеяния.

Размах (интервал изменения) – это разность между максимальным и минимальным значениями переменной в наборе данных.

60

Расположим данные, полученные в таблице 5.1, упорядоченно:

 

 

 

 

 

 

 

 

 

 

Таблица 5.2

1

2

3

4

5

6

7

8

9

10

11

 

115

115

115

120

120

120

120

120

120

125

125

 

размах 115 125 10 .

Размах, полученный из процентилей. Предположим, что данные распо-

ложены упорядоченно от самой маленькой величины и до самой большой величины. Величина X, до которой расположен 1% наблюдений (и выше которой расположены 99% наблюдений), называется первым процентилем. Величина X, до которой находится 2% наблюдений, называется 2-м процентилем, и т.д. Величины X, которые делят упорядоченный набор значений на 10 равных групп, т. е. 10-й, 20-й, 30-й,..., 90 и процентили, называются децилями. Величины X, которые делят упорядоченный набор значений на 4 равные группы, т.е. 25-й, 50-й и 75-й процентили, называются квартилями. 50-й процентиль – это медиана.

Ряд из таблицы 5.2 можно охарактеризовать так: I квартиль (25 процентиль)=115, II квартиль (50 процентиль, медиана) = 120, III квартиль (75 про-

центиль)=120 (Рис. 5.2).

Рис. 5.2. Квартили и медиана в ряду измерений.

Дисперсия. Величина одного и того же признака неодинакова у всех членов совокупности. Например, в группе студентов рост каждого учащегося отличается от роста сверстников. В этом проявляется разнообразие изучаемого параметра.

Один из способов измерения рассеяния данных заключается в том, чтобы определить степень отклонения каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений. Однако невозможно использовать среднее этих отклонений как меру рассеяния, потому что положительные отклонения компенсируют отрицательные отклонения (их сумма равна нулю). Чтобы решить эту проблему, можно возвести в квадрат каждое отклонение и найти среднее возведенных в квадрат отклонений; эта величина называется

дисперсией. Если имеется n наблюдений {x1; x2 ;...; xn } , среднее арифметическое, то дисперсия рассчитывается по формуле (5.2):

n

(xi )2

2

 

i 1

 

(5.2)

 

n 1

 

 

 

 

Единицы измерения (размерность) дисперсии – это квадрат единиц измерения первоначальных наблюдений. Например, если измерения

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]