Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

тема 5_биостат

.doc
Скачиваний:
18
Добавлен:
20.05.2015
Размер:
283.14 Кб
Скачать

При проведении медицинских исследований часто приходится использовать методы статистического анализа данных, представленных в полуколичественном, полукачественном и качественном виде.

Совокупность статистических методов, которые позволяют оценить их результаты как в количественном (числовом), так и в полуколичественном и качественном виде объединяют в группу непараметрических критериев оценивания.

Использование непараметрических критериев не нуждается в расчете параметров вариационного ряда. Здесь имеет значение порядок расположения вариант в совокупности.

Непараметрические критерии могут быть использованы для оценивания достоверности медико-биологических результатов одной совокупности, разницы|разности|, двух и больше выборочных|избирательной| совокупностей.

Выбор метода оценивания достоверности в пользу непараметрического решается в случаях, когда:

  • сомнения в нормальности распределения чисел;

  • не достает данных;

— анализируется качественный признак.

Одним из факторов, ограничивающих применения критериев, основанных на предположении нормальности, является объем выборки.

До тех пор пока выборка достаточно большая (например, 100 или больше наблюдений), можно считать, что выборочное распределение нормально, даже если вы не уверены, что распределение переменной в популяции является нормальным. Тем не менее, если выборка мала, эти критерии следует использовать только при наличии уверенности, что переменная действительно имеет нормальное распределение. Однако нет способа проверить это предположение на малой выборке.

Использование критериев, основанных на предположении нормальности, кроме того, ограничено шкалой измерений. Такие статистические методы, как t-критерий, регрессия и т. д. предполагают, что исходные данные непрерывны. Однако имеются ситуации, когда данные, скорее, просто ранжированы (измерены в порядковой шкале), чем измерены точно.

Для анализа малых выборок и для данных, измеренных в бедных шкалах, применяют непараметрические методы.

По существу, для каждого параметрического критерия имеется, по крайне мере, одна непараметрическая альтернатива.

В общем, эти процедуры попадают в одну из следующих категорий:

  • критерии различия для независимых выборок;

  • критерии различия для зависимых выборок;

  • оценка степени зависимости между переменными.

Если нужно сравнить значения двух переменных, то вы используете t-критерий.

Однако следует помнить, что он основан на предположении нормальности и равенстве дисперсий в каждой группе. Освобождение от этих предположений приводит к непараметрическим тестам, которые особенно полезны для малых выборок.

Далее имеются две ситуации, связанные с исходными данными: зависимые и независимые выборки, в которых применяется t-критерий для зависимых и независимых выборок соответственно.

Развитие t-критерия приводит к дисперсионному анализу, который используется, когда число сравниваемых групп больше двух. Соответствующее развитие непараметрических процедур приводит к непараметрическому дисперсионному анализу, правда, существенно более бедному, чем классический дисперсионный анализ.

Для оценки зависимости, или, выражаясь несколько высокопарно, степени тесноты связи, вычисляют коэффициент корреляции Пирсона. Строго говоря, его применение имеет ограничения, связанные, например, с типом шкалы, в которой измерены данные, и нелинейностью зависимости, поэтому в качестве альтернативы используются также непараметрические, или так называемые ранговые, коэффициенты корреляции, применяемые, например, для ранжированных данных. Если данные измерены в номинальной шкале, то их естественно представлять в таблицах сопряженности, в которых используется критерий хи-квадрат Пирсона с различными вариациями и поправками на точность.

Непараметрические методы наиболее приемлемы, когда объем выборок мал. Если данных много (например, n >100), часто не имеет смысла использовать непараметрическую статистику.

Различия между зависимыми группами. Если вы хотите сравнить две переменные, относящиеся к одной и той же выборке, например, медицинские показатели одних и тех же пациентов до и после приема лекарства, то обычно используется t-критерий для зависимых выборок.

Альтернативными непараметрическими тестами являются критерий знаков и критерий Вилкоксона.

Критерий знаков и критерий Вилкоксона используют для оценки достоверности разницы между двумя взаимосвязанными совокупностями.

Критерий знаков позволяет включать в анализ до 100 пар наблюдений и базируется на подсчете числа однонаправленных результатов при их парном сравнении.

Основные этапы расчета:

1.Определение направленности разницы|разности| в сравниваемых группах результатов. Динамика обозначается знаками: +, —, =. Из|с| дальнейшего| расчета исключают|выключают| результаты без динамики (=).

2.Подсчет|вычисление| числа наблюдений с позитивными|положительными| и негативными результатами.

3. Подсчет|вычисление| числа знаков, которые|какие| реже встречаются.

4. Сравнение меньшего числа знаков (критерий Z) с табличными критическими значениями для соответствующего числа наблюдений.

Т-критерий Вилкоксона предусматривает возможность попарного сравнения от 6 до 25 пар наблюдений. Его целесообразно использовать в случаях, когда выявляются неоднозначные количественные изменения исследуемого параметра (снижение и повышение). При этом учитывают не только направленность разницы, но и ее величину.

Методика анализа по Т-критерию| Вилкоксона:

  1. Определяют разницу|разность| в парах|паре| наблюдения между конечным|концевым| и начальным|первоначальным| уровнями показателя.

  2. Ранжирование полученных результатов по величине разницы|разности| между показателями без учета направленности изменений|смены|. Результаты без динамики исключают из|с| последующего оценивания. Если два резуль­тата| имеют одинаковые абсолютные значения изменений|смены|, их ранги определяют как полгрусти порядковых|построчных| номеров.

  3. Подсчет|вычисление| суммы однозначных рангов (позитивных|положительных| и негативных).

  4. Оценивание по меньшей сумме рангов путем сравнения определенного Т-критерия| с табличным значением при соответствующем числе пар|пары| наблюдений.

Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть, способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.

Критерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10-15% от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно отличаются между собой, и принимают какие-то конечные значения, например. +1, -1 и 0, формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.

Суть метода состоит в том, что мы сопоставляем абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Ограничения критерия Объем выборки — от 5 до 50 элементов

Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)

Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.

Есть также урезанный вариант для сравнения одной выборки с известным значением медианы.

Алгоритм

  1. Составить список испытуемых в любом порядке, например, алфавитном.

  2. Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.

  3. Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчетной.

  4. Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.

  5. Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. – сдвиг в «типичную» сторону достоверно преобладает.

Фактически оцениваются знаки значений, полученных вычитанием ряда значений одного измерения из другого. Если в результате количество снизившихся значений примерно равно количеству увеличившихся, то гипотеза о нулевой медиане подтверждается.

Различия между независимыми группами. Если имеются две выборки (например, мужчины и женщины), которые нужно сравнить относительно некоторого среднего значения, например, среднего давления или количества лейкоцитов в крови, то можно использовать t-тест для независимых выборок.

Непараметрической альтернативой этому тесту является двухвыборочный критерий Колмогорова— Смирнова.

Критерий согласия Колмогорова-Смирнова(λ2) и критерий согласия Пирсона (χ2) применяют в случае сравнения независимых друг от друга совокупностей (сравнение опытной и контрольной групп больных, результатов двух групп наблюдений с разными заболеваниями или степенями тяжести патологии).

Методика расчета критерия Колмогорова – Смирнова (λ2):

  1. Числовые значения двух вариационных рядов объединяют в один вариационный ряд, варианты какого упорядочивают в порядке роста.

  2. Определяют частоты вариант для обеих групп наблюдений|.

  1. Определяют накопленные частоты для обеих групп.

  1. Определяют накопленные частицы|долю|, для чего накопленные частоты делятся|делящийся| на число наблюдений для каждой группы.

  2. Рассчитывается разница|разность| накопленных частиц|доли| групп X и У без учета знаков.

  1. Определяют максимальную разницу|разность|

  2. Определяют критерий

  1. Сравнивают полученный результат с предельным значением критерия

Колмогорова-Смирнова|.

Если больше предельного значения, разница между сравниваемыми группами является существенной.

При проведении статистического анализа иногда необходимо оценить достоверность разницы более двух показателей клинико-статистических групп.

В указанных ситуациях наиболее целесообразным является использование критерия согласия χ2 (критерий Пирсона): χ2=

где p - истинные частоты

p1 - теоретические частоты

Практическое значение критерия соответствия χ2:

  • оценивание достоверности разницы|разности| между несколькими сравниваемыми группами при нескольких возможных результатах с разной|различной| степенью вероятности (например, три или четыре группы больных с разными|различными| методами лечения и их последствиями — разной|различной| час­тотою| осложнений|усложнения|);

  • определение наличия связи между двумя факторами (зависимость результатов лечения от возраста|века| больных, тяжести заболевания, связь между тяжестью патологии новорожденных и состоянием|станом| их физического развития);

• оценивание идентичности распределения|деления| частот в двух и более совокупностях (аналогичность распределения|деления| больных по уровню клинических параметров при разных|различных| степенях тяжести патологии).

Основой метода является определение существенности разницы (отклонений) фактических данных от теоретических (ожидаемых). Расчет теоретических данных базируется на предположении, что между сравниваемыми группами по исследуемым факторам разницы нет. Данное предположение определяется как «нулевая» гипотеза.

На основе «нулевой» гипотезы определяют «ожидаемые|» результаты и сравнивают их с фактическими данными. Если разницы|разности| нет, можно сделать|совершить| вывод, что «нулевая» гипотеза подтвердилась. При наличии отличий фактических данных от теоретического расчета | определяют существенность разницы|разности| между сравниваемыми| группами.

Оценивание результатов (χ2) проводится по специальной таблице. Существенной считается разница в том случае, когда величина рассчитанного коэффициента превышает табличное значение при достоверности не ниже 95% (вероятность погрешности менее 5%-р<0,05).

Методика расчета коэффициента согласия χ2:

  1. Приведем фактические результаты по трём метода­м| лечения

Методика лечения

Всего

больных

Результаты лечения – Р (фактические данные)

хорошо

удовлетворительно

неудовлетворительно

I

50

36

11

3

II

80

48

17

15

III

70

25

25

20

Всего

200 (100%)

109

53

38

  1. Рассчитываем «ожидаемые» результаты согласно «нулевой» гипотезе, основой|основанием| которой|какой| является доказательство, что разницы|разности| между результатами лечения по отдельным методикам нет. В этом случае за основу|основание| берем общее деление|разделение| больных, вылеченных всеми методами. Числовая характеристика «нулевой» гипотезы составляет: хорошие результаты в целом имели 54,5 %, удовлетворительные — 26,5 % | и неудовлетворительные — 19 % больных. В соответствии с|соответственно| указанным делением|разделением| определяем «ожидаемые» данные результатов лечения по отдельным методикам (значение определяем в целых числах)

    Методика лечения

    Всего

    больных

    Результаты лечения – Р1 (ожидаемые данные)

    хорошо

    удовлетворительно

    неудовлетворительно

    I

    50

    27

    13

    10

    II

    80

    44

    21

    15

    III

    70

    38

    19

    13

    Всего

    200(100%)

    109 (54,5%)

    53 (26,5%)

    38 (19%)

  2. Сопоставляем фактические и теоретические данные (их разницу|) с расчетом величины отклонения и учетом| его направления (знака)

Методика лечения

( Р - Р1 )

хорошо

удовлетворительно

неудовлетворительно

I

9 (36-27)

-2 (11-13)

-7 (3-10)

II

4 (48-44)

-4 (17-21)

0 (15-15)

III

-13 (25-38)

6 (25-19)

7 (20-13)

Всего

0

0

0

  1. Рассчитываем квадрат отклонения теоретических данных от фактических и средний квадрат отклонения на одну «ожидаемую» группу. Данный этап расчета имеет такой вид в связи с тем, что на основе фактических отклонений невозможно определить его суммарную величину, поскольку она равняется нулю. При возведении отклонений в квадрат определяем их параметры для каждой группы (р — р1)2. Учитывая разное число больных в исследуемых группах величина отклонений может быть разной, потому квадрат их делим на число соответствующих наблюдений каждой группы — (р — р1)2 / р1. Проведя расчеты, определяем (р — р1)2 и (р — р1)2 / р1.

Методика лечения

( Р - Р1 ) 2

( Р - Р1 ) 2 / Р1

хорошо

удовлетворительно

неудовлетворительно

хорошо

удовлетворительно

неудовлетворительно

I

81

4

49

3

0,3

4,9

II

16

16

0

0,4

0,8

0

III

169

36

49

4,4

1,9

3,8

Σ=19,5

  1. Определяем χ2— итог результатов последнего этапа расчетов. В нашем случае χ2= 19,5. Сравниваем его с табличным значением, учитывая число степеней свободы (n1), которые определяют по формуле: n1= (S-| 1) (г-| 1),

где S — число групп больных (для нашего примера |приклада| - три).

г — число результативных групп (три).

|Число степеней свободы n1= (3 - 1) (3 - 1) = 4.

Полученный результат превышает табличное значение χ2для n1 = 4 по всем уровням достоверности. Следовательно, мы можем сделать вывод о существенности (достоверности) разницы между показателями при разных методах лечения — «нулевая» гипотеза не подтвердилась.

Анализ взаимосвязи между параметрами статистической совокупности

Функциональная зависимость: при изменении одного параметра на определенную величину всегда происходит изменение другого также на определенную фиксированную величину.

Корреляционная связь: определенному значению одного параметра может отвечать несколько значений другого.

В медико-биологических исследованиях зависимость между отдельными параметрами не является функциональной связью. При изменении одного признака невозможно абсолютно точно спрогнозировать величину, на которую изменяются другие.

Определение характера связи между определенными параметрами проводят путем расчета коэффициента корреляции.

Направленность связи – определяется по знаку коэффициента корреляции.

Прямая связь – динамика параметров однонаправленная – увеличение одного параметра обуславливает увеличение другого.

Обратная – динамика параметров разнонаправлена – увеличение одного параметра обуславливает уменьшение другого.

Сила связи

Слабая

r=0.01-0.29

Средняя

r=0.30-0.69

Сильная

r=0.70-0.99

Коэффициент парной корреляции отображает характер связи 2 признаков.

Он дает характеристику обобщенной «неочищенной» связи между параметрами. Он может быть рассчитан при сопоставлении двух рядов в виде

  • рангового коэффициента корреляции (ρ) и

  • линейного коэффициента корреляции (r).

Корреляционная зависимость различается по направлению, силе и форме связи.

По направлению корреляционная связь может быть положительной ("прямой") и отрицательной ("обратной"). Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции. Сила связи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции.Максимальное возможное абсолютное значение коэффициента корреляции r = 1,00; минимальное r = 0,00.

Коэффициент ранговой корреляции (Спирмена) - непараметрический метод, который используется с целью статистического изучения связи между явлениями.

Особенность коэффициента Спирмена – простота вычисления при недостаточной точности позволяет его использовать для ориентировочного анализа с проведением быстрых расчетов, при определении данных в получисленном описательном виде.

Этапы расчета:

1) Определить ранги значения каждой величины рядов X и Y.

Ранжирование обоих рядов должно быть однонаправленным.

2) Определить отклонение значений одного ряда от другого (dxy).

Их сумма с учетом знаков должна равняться 0.

3) Возвести полученные результаты в квадрат, и определить их сумму

(

4) Подставляем полученные результаты в формулу:

ρ =1-

где - сумма квадратов разностей рангов, а - число парных наблюдений.

Для оценки достоверности коэффициент корреляции должен превышать свою погрешность не меньше, чем в 2,5 – 3 раза при достаточном числе наблюдений.

При большом числе наблюдений (n˃100) средняя ошибка рангового коэффициента корреляции вычисляется по формуле:

√n

Оценка достоверности коэффициента корелляции проводится по тем же принципам, что используются для других показателей с определением числа наблюдений (числа степеней свободы вариационных рядов n'=n-2. Полученные результаты сравнивают с табличными значениями для соответствующих ступеней вероятности ошибки первого типа.

Линейный коэффициент корелляции Пирсона:

r=Ʃdx х dy

√Ʃdx2 x Ʃdy2

где X и Y – варианты сравниваемых вариационных рядов

dx и dy – отклонения каждой варианты от своей средней арифметической

Расчет линейного коэффициента корреляции:

  1. Определяют средние значения для каждого ряда (Хх, Ху).

  2. Определяют отклонение каждого из значений ряда от средней

величины (dх, dу).

  1. Возводят определенные отклонения в квадрат и определяют их

суммы:

Достоверность полученного результата определим по соотношению

t = r / mr, где mr при малом числе наблюдений (n < 30) равняется:

mr=

При большом числе наблюдений (n > 100):