- •1 СТАТИСТИЧЕСКАЯ ОБРАБОТКА БИОМЕДИЦИНСКОЙ ИНФОРМАЦИИ
- •1.1 Биомедицинская информация и способы ее получения
- •1.2 Организация медико-статистических исследований
- •1.3 Относительные величины
- •1.4 Статистическая обработка вариационного ряда
- •1.4.1 Основные понятия и определения
- •1.4.2 Методика составления вариационного ряда
- •1.4.3 Методика статистической обработки вариационного ряда при нормальном законе распределения вариант
- •1.4.4 Расчет статистических характеристик при малом числе наблюдений
- •1.5 Выборочный метод исследований
- •1.5.1 Формирование выборочной совокупности
- •1.5.2 Определение объема выборочной совокупности
- •1.5.3 Сравнение средних арифметических величин двух выборок из совокупности с нормальным распределением вариант
- •1.6 Основы дисперсионного анализа
- •1.6.1 Общие положения
- •1.6.2 Методика однофакторного дисперсионного анализа
- •1.6.3 Методика двухфакторного дисперсионного анализа
- •1.6.4 Методика однофакторного дисперсионного анализа альтернативных признаков
- •1.7 Определение соответствия эмпирических и теоретических данных
- •1.7.1 Общие положения
- •1.7..2 Определение соответствия признаков альтернативных явлений
- •1.7.3 Определение критерия χ2 по данным, представленным в сложных таблицах
- •1.7.4 Проверка соответствия фактических частот вариационного ряда теоретическому распределению
- •1.8 Корреляционный анализ
- •1.8.1 Способы выявления корреляционной связи
- •1.8.2 Виды и теснота корреляционной связи
- •1.8.2 Определение коэффициент корреляции при малом числе наблюдений
- •1.8.3 Определение коэффициент корреляции при большом числе наблюдений
- •1.8.4 Средняя ошибка коэффициента корреляции
- •1.8.5 Определение тесноты связи между качественными признаками
- •1.8.6 Множественная корреляция
- •1.8.7 Понятие о корреляционном отношении
- •1.9 Основы регрессионного анализа
- •1.10 Непараметрические критерии в медицинских исследованиях
- •1.10.1 Критерии для характеристики одной совокупности
- •1.10.2 Критерии различия для двух сопряженных совокупностей
- •1.10.3 Критерии различия для двух несопряженных совокупностей
- •1.10.3 Непараметрические методы изучения связи
- •1.11 Современное программное обеспечение для статистической обработки биомедицинских исследований
- •2 ПРИНЦИПЫ ПОСТРОЕНИЯ БАНКОВ ДАННЫХ
- •2.1 Общие сведения о банках данных
- •2.2 Типы баз данных
- •2.2.1 Автономные базы данных
- •2.2.2 Файл-серверные базы данных
- •2.2.3 Многоярусные базы данных
- •2.2.4 Базы данных клиент/сервер
- •2.3 Реляционный подход к построению БД
- •2.3.1 Реляционная модель данных
- •2.3.1.1 Целостность данных
- •2.3.2 Реляционная алгебра
- •2.3.3 Реляционное исчисление
- •2.4 Иерархический и сетевой подходы
- •2.4.1 Иерархический подход.
- •2.4.2 Сетевой подход.
- •2.5 Инвертированные базы данных
- •2.6 Принципы построения реляционных баз данных
- •2.6.1 Процедура индексирования
- •2.6.2 Организация связи с базами данных прикладных программ
разностью из расчета изъято) критическое значение критерия равно Т0,5=3. Поскольку Т>T0,5, то принимается нулевая гипотеза: различия в опыте не существенны.
Таблица 1.50 - Применение критерия Вилкоксона для оценки различий в содержании гемоглобина у больных с хронической уремией до и после лечения
Больной |
Гемоглобин в % |
Разность |
Ранговый но- |
|
|
|
|
|
мер разности |
|
до лечения |
после лечения |
|
|
|
|
|
||
А |
60 |
59 |
1 |
1 |
Б |
74 |
68 |
6 |
5,5 |
В |
78 |
70 |
8 |
7 |
Г |
47 |
49 |
–2 |
3 |
Д |
40 |
40 |
0 |
– |
К |
74 |
80 |
–6 |
5,5 |
И |
62 |
60 |
2 |
3 |
П |
65 |
67 |
–2 |
3 |
|
|
|
|
|
1.10.3 Критерии различия для двух несопряженных совокупностей
Критерий Уайта. Критерий применяется для ориентировочной оценки различий двух независимых рядов наблюдений. (например, опытная группа сравнивается с контрольной).Для расчета критерия необходимо сопоставляемые ряды расположить в один ранжированный ряд в порядке возрастания либо убывания полученных величин. Каждому значению объединенного ряда присваивается порядковый номер. Далее подсчитываются суммы номеров для каждого из сопоставляемых рядов. Меньшая из полученных сумм (К) сравнивается с критическими значениями сумм, приведённых. Нулевая гипотеза принимается при К≥К05 и отвергается при К<K05 или К<К01.
Пример. Требуется установить, существенны ли различия в содержании свободного сульфаниламида у кроликов контрольной группы и кроликов, которым водился кортизон. Для получения сравнимых результатов вычислялось отношение содержания свободного сульфаниламида в экссудате к содержанию его в плазме.
Данные контрольной группы (х): 0,63 0,60 0,67 0,94 0,62 1,09 0,88 0,96 1,12 1,00 1,03 1,00 0,64 0,81 0,76; пх =15.
Данные опытной группы (у): 1,96 1,64 0,90 1,61 0,44 1,24 1,23 1, 20 2,00 1,56 :1,67 1,76 1,23 1,46 1,50 ny =15.
Составляем общий ранжированный ряд, располагая в отдельных строках данные групп х и у, и присваиваем каждому значению порядковый номер.
83
Значения |
x |
0,6 |
0,62 |
0,63 |
064 |
0,67 |
0,76 |
0,81 |
0,88 |
0,94 |
0,96 |
1 |
1 |
1,03 |
|||
|
y |
|
|
|
|
|
|
|
|
|
0,9 |
|
|
|
|
|
|
Ранги |
x |
1 |
2 |
3 |
|
4 |
5 |
6 |
7 |
8 |
|
10 |
|
11 |
12 |
13 |
14 |
|
y |
|
|
|
|
|
|
|
|
|
9 |
|
|
|
|
|
|
Значения |
x |
1,09 1,12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
15 |
16 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ранги |
x |
|
|
1,2 |
1,23 1,23 1,25 1,44 1,46 1,5 |
1,56 1,61 1,64 1,67 1,76 1,96 2,0 |
|||||||||||
|
y |
|
|
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
Подсчитываем сумму рангов (К) значений х и у: Кх=127 и Kу ==338. Меньшая сумма К=Кх= 127. При nx=15 и ny=15 критические значения критерия равны К05=185 и К01=171. Поскольку полученное K<K01, в содержании свободного сульфаниламида у кроликов сравниваемых групп выявлены существенные раз-
личая (Р<0,01).
Если число наблюдений nх или nу выходит за пределы, указанные в таблице критических значений критерия, т. е. больше 15 или 28, то для оценки различий можно использовать величину W
W = nx (nx + ny +1) −2K |
(1.62) |
nx ny (nx + ny +1) |
|
тде —сумма рангов. Критические значения W: W05 = 1,13 и W01 = 1,49. Нулевая гипотеза отвергается при W > W05 или W > W01.
Критерий U (Вилкоксона—Манна—Уитни). Для расчета критерия U не-
обходимо расположить данные первой (х) и второй группы (y) в один ряд по их величине, но так, чтобы было видно, к какой группе принадлежит каждая величина. Затем подсчитывается число инверсий, т. е. число величин второй группы (у), предшествующих каждой величине первой группы (х). Полученное число инверсий сравниваем с их критическими значениями. Если полученное число инверсий U >U05, то нулевая гипотеза принимается и различия между группами признаются не значимыми. Если U < U05 или U01 то различия считаются существенными с сoответствующими уровнями значимости.
Например, требуется установить, существенна ли разница в содержании ацетилированного сульфаниламида у кроликов, которым вводился физиологический раствор, и теми животными, которым вводился кортизон (табл. 1.51). Из таблицы видно, что величинам группы х: 8,8 и 9,6 предшествует одна величина группы у-7,1, т.е. они имеют по одной инверсии. Величинам 14,3 и 14,7 предшествуют по две величины другой группы (7,1 и 13,4). Полученное число инверсий суммируем и находим U=114. По таблице критических значений критерия находим, что при nx =ny=15 U05 =72. Следовательно, U > U05, и различия между группами не существенны.
84
Серийный критерий S (В а л ь д а— В о л ь ф о в и ц а). В основе крите-
рия лежит подсчет числа серий, т. е. чередований вариант двух сравниваемых групп наблюдений в общем ранжированном ряду. Например, в ряду, составлен-
ном из вариант групп х и у: |
xxx |
|
yy |
|
xxxx |
|
y |
|
xxx |
имеется пять серий. Полученное |
|
2 |
3 |
4 |
5 |
||||||
1 |
|
число серий сравнивается с критическим числом серий, при котором уже принимается нулевая гипотеза (предположение о принадлежности сравниваемых групп к одной генеральной совокупности). При меньшем числе серий (S<S05) нулевая гипотеза должна быть отвергнута. Значение S01 приблизительно соответствует значению S05 – 2.
Таблица 1.51 - Применение критерия U для оценки различий в содержании ацетилированного сульфаниламида у двух групп кроликов
Ранжированные данные: % ацетилирован- |
Последовательность |
Число |
ного сульфаниламида у кроликов, которым |
величин |
инверсий |
вводился |
|
|
физиологический раствор (x) кортизон (y) |
y |
|
7,1 |
|
|
8,8 |
x |
1 |
9,6 |
x |
1 |
13,4 |
y |
|
14,3 |
x |
2 |
14,7 |
x |
2 |
16,3 |
y |
|
20,4 |
x |
3 |
20,4 |
y |
|
25,4 |
y |
|
25,6 |
x |
5 |
26 |
y |
|
32,8 |
y |
|
33,3 |
x |
7 |
35 |
x |
7 |
36,7 |
y |
|
37,5 |
x |
8 |
40 |
y |
|
43,6 |
x |
9 |
46,9 |
y |
|
48,3 |
y |
|
50 |
y |
|
50 |
y |
|
52,3 |
x |
13 |
52,9 |
y |
|
55,3 |
x |
14 |
85
57,9 |
|
x |
14 |
64,6 |
|
x |
14 |
64,8 |
|
x |
14 |
|
65,2 |
y |
|
nx=15 |
ny=15 |
|
U=114 |
Если число наблюдений в одной или обеих группах >20, то число серий S оценивается с помощью случайной переменной величины Us по формуле:
|
|
|
|
|
|
|
|
−S −0,5 |
|
||
|
|
|
|
|
Us = |
S |
(1.63) |
||||
|
|
|
|
|
|
|
σx |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|||
|
|
= |
a |
+1 , |
σs = |
|
a2(a −b) |
, a = 2nx ny , |
b = nx +ny |
||
S |
|
||||||||||
|
b |
|
|||||||||
|
|
|
|
|
|
b (b −1) |
|
|
|
Нулевая гипотеза принимается при Us≤ 1,96 и отвергается при Us > 1,96 (р< 0,05) или Us > 2,58 (р<.0.01).
Следует подчеркнуть, что серийный критерий обнаруживает различия не только по центральной тенденции, но и по рассеянию вариант. Рассмотрим вычисление ero на примере оценки различий в уровне механической резистентности эритроцитов (в %) у больных шизофренией (х) и больных, не страдающих данным заболеванием (у)
Х – 3,8 0,5 1,7 1,0 5,4 4,9 3,1 4,5 nx=8
Y – 10,5 13,8 9,2 6,2 7,6 3,0 5,3 8,2 3,9 7,0 3,5 5,0 2,2 6,2 ny=14
Построим ранжированный ряд, сохраняя варианты х и у в отдельных строках и подсчитаем число серий:
Величина |
x |
0,5 1,0 1,7 |
|
3,1 |
|
3,8 |
|
4,5 4,9 |
|
5,4 |
|
|
Число |
1 |
|
3 |
|
5 |
|
7 |
|
9 |
|
|
серий |
|
|
|
|
|
|
|
|
|
|
Величина |
y |
|
2,2 3,0 |
|
3,5 |
|
3,9 |
|
5,0 5,3 |
|
6,2 6,2 7,0 7,6 |
|
Число |
|
2 |
|
4 |
|
6 |
|
8 |
|
10 |
|
серий |
|
|
|
|
|
|
|
|
|
|
В полученном ряду содержится 10 серий (S=10). По таблице находим, что при nx=8 и ny=14 критическое значение S05=7. Так как S> S05, то различия между группами больных по уровню механической резистентности эритроцитов признать существенными нельзя (р>0.05).
Критерий Колмагорова-Смирнова. Этот критерий является более мощным чем серийный критерий, особенно при большом числе наблюдений. Он основан на сравнении рядов накопленных частот. Схему вычисления критерия рассмотрим на примере определения значимости различий в росте однослой-
86
ных культур фибробластов под влиянием кортизон-ацетата (х) и в контроле (типичная среда без стероидов —у) (табл. 1.52).
Методика расчета критерия Колмогорова — Смирнова будет следующая:
1.Располагаем варианты обеих групп в один возрастающий ряд (графа 1);
2.В графах 2 и 3, записываем раздельно частоты вариант каждой группы
(fx и fy);
3.Последовательно, суммируем частоты fx и fy составляя ряды накопленных частот Sx и Sy, которые записываем в графах 4 и 5;
4.Путем деления накопленных частот на число наблюдений в каждой группе получаем ряды накопленных частостей (графы 6 и 7);
Таблица 1.52 - Применение критерия Колмогорова — Смирнова для оценки различий в росте двух культур фибробластов
Варианты |
Частоты |
Накопленные |
Накопленные |
Разности |
|||
обоих рядов в |
вариант по |
частоты по |
частости по |
sx/nx-sy/ny |
|||
возрастающем |
группам |
группам |
группам |
(без учета |
|||
порядке |
fx |
fy |
Sx |
Sy |
Sx/nx |
Sy/ny |
знаков) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
198 |
0 |
1 |
0 |
1 |
0 |
0,091 |
0,091 |
242 |
0 |
1 |
0 |
2 |
0 |
0,182 |
0,182 |
253 |
0 |
1 |
0 |
3 |
0 |
0,273 |
0,273 |
264 |
0 |
1 |
0 |
4 |
0 |
0,364 |
0,364 |
286 |
0 |
1 |
0 |
5 |
0 |
0,455 |
0,455 |
297 |
0 |
1 |
0 |
6 |
0 |
0,545 |
0,545 |
319 |
1 |
2 |
1 |
8 |
0,091 |
0,727 |
0,636 |
341 |
0 |
1 |
1 |
9 |
0,091 |
0,818 |
0,727 |
352 |
0 |
1 |
1 |
10 |
0,091 |
0,909 |
0,818 |
385 |
1 |
0 |
2 |
10 |
0,182 |
0,909 |
0,827 |
429 |
1 |
1 |
3 |
11 |
0,273 |
1 |
0,717 |
440 |
1 |
0 |
4 |
11 |
0,364 |
1 |
0,636 |
473 |
2 |
0 |
6 |
11 |
0,515 |
1 |
0,455 |
517 |
1 |
0 |
7 |
11 |
0,636 |
1 |
0,364 |
539 |
1 |
0 |
8 |
11 |
0,727 |
1 |
0,273 |
594 |
1 |
0 |
9 |
11 |
0,818 |
1 |
0,182 |
638 |
1 |
0 |
10 |
11 |
0,909 |
1 |
0,091 |
660 |
1 |
0 |
11 |
11 |
1 |
1 |
0 |
5.Определяем разности между накопленными частностями (без учета их алгебраических знаков) и находим максимальную разность D (в нашем приме-
ре 0,818).
6.Вычисляем критерий Колмогорова.—Смирнова λ2 по формуле:
87