- •1 СТАТИСТИЧЕСКАЯ ОБРАБОТКА БИОМЕДИЦИНСКОЙ ИНФОРМАЦИИ
- •1.1 Биомедицинская информация и способы ее получения
- •1.2 Организация медико-статистических исследований
- •1.3 Относительные величины
- •1.4 Статистическая обработка вариационного ряда
- •1.4.1 Основные понятия и определения
- •1.4.2 Методика составления вариационного ряда
- •1.4.3 Методика статистической обработки вариационного ряда при нормальном законе распределения вариант
- •1.4.4 Расчет статистических характеристик при малом числе наблюдений
- •1.5 Выборочный метод исследований
- •1.5.1 Формирование выборочной совокупности
- •1.5.2 Определение объема выборочной совокупности
- •1.5.3 Сравнение средних арифметических величин двух выборок из совокупности с нормальным распределением вариант
- •1.6 Основы дисперсионного анализа
- •1.6.1 Общие положения
- •1.6.2 Методика однофакторного дисперсионного анализа
- •1.6.3 Методика двухфакторного дисперсионного анализа
- •1.6.4 Методика однофакторного дисперсионного анализа альтернативных признаков
- •1.7 Определение соответствия эмпирических и теоретических данных
- •1.7.1 Общие положения
- •1.7..2 Определение соответствия признаков альтернативных явлений
- •1.7.3 Определение критерия χ2 по данным, представленным в сложных таблицах
- •1.7.4 Проверка соответствия фактических частот вариационного ряда теоретическому распределению
- •1.8 Корреляционный анализ
- •1.8.1 Способы выявления корреляционной связи
- •1.8.2 Виды и теснота корреляционной связи
- •1.8.2 Определение коэффициент корреляции при малом числе наблюдений
- •1.8.3 Определение коэффициент корреляции при большом числе наблюдений
- •1.8.4 Средняя ошибка коэффициента корреляции
- •1.8.5 Определение тесноты связи между качественными признаками
- •1.8.6 Множественная корреляция
- •1.8.7 Понятие о корреляционном отношении
- •1.9 Основы регрессионного анализа
- •1.10 Непараметрические критерии в медицинских исследованиях
- •1.10.1 Критерии для характеристики одной совокупности
- •1.10.2 Критерии различия для двух сопряженных совокупностей
- •1.10.3 Критерии различия для двух несопряженных совокупностей
- •1.10.3 Непараметрические методы изучения связи
- •1.11 Современное программное обеспечение для статистической обработки биомедицинских исследований
- •2 ПРИНЦИПЫ ПОСТРОЕНИЯ БАНКОВ ДАННЫХ
- •2.1 Общие сведения о банках данных
- •2.2 Типы баз данных
- •2.2.1 Автономные базы данных
- •2.2.2 Файл-серверные базы данных
- •2.2.3 Многоярусные базы данных
- •2.2.4 Базы данных клиент/сервер
- •2.3 Реляционный подход к построению БД
- •2.3.1 Реляционная модель данных
- •2.3.1.1 Целостность данных
- •2.3.2 Реляционная алгебра
- •2.3.3 Реляционное исчисление
- •2.4 Иерархический и сетевой подходы
- •2.4.1 Иерархический подход.
- •2.4.2 Сетевой подход.
- •2.5 Инвертированные базы данных
- •2.6 Принципы построения реляционных баз данных
- •2.6.1 Процедура индексирования
- •2.6.2 Организация связи с базами данных прикладных программ
1.8.6 Множественная корреляция
Приведенные выше коэффициенты корреляции характеризуют связь между двумя признаками. В медицинской практике часто наблюдаются процессы, в которых взаимно связаны не два, а большее число варьирующих признаков. В ряде случаев необходимо установить тесноту связи между двумя признаками при условии, что третий признак не меняется, т. е. при исключении влияния третьего признака. Такая связь оценивается с помощью парциальных (частичных) коэффициентов корреляции при условном допущении постоянства одного из трех коррелируемых признаков по следующим формулам:
r c |
= |
rab −rac rbc |
, |
(1.46) |
||
ab |
|
(1 |
−r 2 |
) (1−r 2 ) |
|
|
|
|
|
||||
|
|
|
ac |
|
bc |
|
r a |
= |
rbc −rab rac |
, |
(1.47) |
||
bc |
|
(1 |
−r 2 |
) (1−r 2 ) |
|
|
|
|
|
||||
|
|
|
ab |
|
ac |
|
rb |
= |
rac −rab rbc |
|
(1.48) |
||
ac |
|
(1 |
−r 2 |
) (1−r 2 ) |
|
|
|
|
|
||||
|
|
|
ab |
|
bc |
|
где rabc - коэффициент корреляции между признаками a и b, при исключении влияния признака с;
racb - коэффициент корреляции между признаками a и с, при исключении влияния признака b;
rbca - коэффициент корреляции между признаками b и с, при исключении
влияния признака a.
Условное обозначение признака, влияние которого элиминируется, выставлено в виде верхнего индекса.
Например, известно, что между возрастом (а), ростом (b) и весом (с) детей существует сильная корреляционная связь. Парные коэффициенты корреляции равны:
rab= + 0,73, rbс = + 0,82 и rас = +0,87
Вычислим парциальные коэффициенты корреляции для определения тесноты связи между возрастом и весом при устранении влияния роста:
r b |
= |
rac − rab rbc |
= 0,87 − (0,73 0,82) |
= 0,27 = 0,48. |
ac |
|
(1 − rab2 ) (1 − rac2 ) |
(1 − 0,732 ) (1 − 0,822 ) |
0,31 |
|
|
Парциальный коэффициент корреляции между ростом и весом при элиминировании влияния возраста:
r a |
= |
rbc −rab rac |
= |
0,82 −0,73 0,87 |
= 0,59. |
|
bc |
|
(1−r 2 |
) (1−r 2 |
) |
(1−0,732 ) (1−0,872 ) |
|
|
|
|
||||
|
|
ab |
ac |
|
|
|
71
Вычисленные парциальные коэффициенты корреляции оказались меньше обычных. Проведенный анализ позволил полнее выявить влияние каждого отдельного признака.
1.8.7Понятие о корреляционном отношении
Вслучаях нелинейной (криволинейной) корреляции для измерения тесноты связи применяется корреляционное отношение (η), которое более точно дает сведения о степени зависимости признаков, причем следует помнить, что при нелинейной связи коэффициент корреляции и корреляционное отношение численно не совпадают друг с другом, при линейной связи они примерно равны между собой. Поэтому нередко, если вид связи не определяется достаточно четко, наряду с коэффициентом корреляции, вычисляют и корреляционное отношение.
Втабл. 1.41 представлены результаты одновременного определения содержания сиаловой кислоты и 17-кетостероидов в суточной моче больных. Коэффициент корреляции, вычисленный по этим данным, равен -0,46. Однако характер расположения данных в корреляционной таблице позволяет усомниться
вналичии линейной связи между признаками, так как частоты Рху расположены преимущественно в левом верхнем углу таблицы. В этом случае следует вычислить корреляционное отношение.
Таблица 1.41 - Содержание сиаловой кислоты и 17-кетостероидов в суточной моче больных
Содержание |
Середина интервалов |
Уровень сиаловой кислоты (x) |
|
_ |
|||||
17-кетосте- |
|
|
|
|
|
|
Py |
x y |
|
|
101─140 |
141─180 |
181─199 |
200─210 |
211─250 |
||||
роидов в |
90─100 |
|
|
||||||
суточной |
|
|
|||||||
моче в мг |
|
|
|||||||
(у) |
|
|
|||||||
|
95 |
120,5 |
160,5 |
190 |
205 |
230,5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2,00─5,00 |
3,5 |
─ |
1 |
─ |
─ |
─ |
1 |
2 |
175,5 |
5,01─9,99 |
7,5 |
1 |
2 |
2 |
1 |
7 |
3 |
16 |
185,5 |
10,00─15,00 |
12,5 |
3 |
11 |
6 |
2 |
─ |
─ |
22 |
134,2 |
15,01─20,00 |
17,5 |
2 |
8 |
4 |
─ |
─ |
─ |
14 |
128,3 |
20,01─25,99 |
23,0 |
2 |
─ |
1 |
─ |
─ |
─ |
3 |
116,8 |
26,00─31,99 |
29,0 |
1 |
1 |
1 |
─ |
─ |
─ |
3 |
125,3 |
Px |
|
9 |
23 |
14 |
3 |
7 |
4 |
60 |
146,7 |
_ |
|
17,2 |
14,1 |
15,1 |
10,8 |
7,5 |
6,5 |
13,3 |
|
y x |
|
|
72
Корреляционное отношение у на х определяется по формуле:
|
σ |
2 |
|
|
ηyx = |
y x |
|||
|
||||
σ 2 |
||||
|
||||
|
|
y |
_
y x — частная средняя каждой группы;
σy2x —межгрупповая дисперсия;
σy2 — общая дисперсия у;
Px, Py — частота значений каждой группы. Межгрупповая дисперсия и общая дисперсия
дующим формулам:
|
|
|
∑( |
|
x − |
|
)2 Px |
|||
σ |
2 |
= |
y |
y |
||||||
|
|
|
|
n |
|
|||||
уч |
|
|
|
|||||||
|
|
|
|
|
||||||
|
|
|
|
|
|
|
||||
|
|
|
∑( y − |
|
)2 |
Py |
||||
σ |
2 |
= |
y |
|||||||
y |
|
|
n |
|
||||||
|
|
|
|
|
||||||
|
|
|
|
|
|
|
(1.49)
у рассчитываются по сле-
(1.50)
Расчеты указанных дисперсий представлены в таблицах 1.42 и 1.43. Ввиду
_ _
неодинаковых группировочных интервалов средние величины x и y вычислялись по формулам:
|
|
∑(Px |
xi ) |
|
|
|
∑(Py |
yi ) |
(1.51) |
|
x = |
, |
y = |
||||||||
n |
|
n |
|
|||||||
|
|
|
|
|
|
|
|
где хi, уi — середины интервалов, соответствующие частотам Рx и Рy. На-
пример, ΣPxxi=9·95+23·120,5 + 14·160,5 + 3·190 +7·205 + 4·230,5 = 8801,5.
Таблица 1.42Расчет общей дисперсии признака у
Таблица 1.43 - Расчет межгрупповой дисперсии признака у
73
Корреляционное отношение в этом случае будет равно
Корреляционное отношение у на х не совпадает с корреляционным отношением х на у.
Поэтому следует вычислить и корреляционное отношение x на y:
(1.52)
_
где xy - частная средняя каждой группы; σ 2_ -межгрупповая дисперсия;
xy
σx2 - общая дисперсия признака x.
Межгрупповая дисперсия и общая дисперсия x рассчитываются по следующим формулам:
|
|
|
∑( |
|
y − |
|
)2 |
Py |
|||
σ |
2 |
= |
x |
x |
|||||||
_ |
|
|
n |
|
|
||||||
|
xy |
|
|
|
|
(1.53) |
|||||
|
|
|
|
|
|
|
|
|
|
||
σ |
2 |
= |
∑(x − x)2 |
Px |
|||||||
|
|||||||||||
x |
|
|
n |
|
|
||||||
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
Расчеты указанных дисперсий представлены в таблицах 1.44 и 1.45. Корреляционное отношение ηxy в этом случае будет равно
Полученные корреляционные отношения (ηух = 0,60, а ηху = 0,69) не совпадают друг с другом и отличаются от r = -0,46, что указывает на нелинейность связи. Вместе с тем величина корреляционного отношения свидетельствует о выраженной связи между изучаемыми признаками.
74
Таблица 1.44 - Расчет обшей дисперсии признака х
Таблица 1.45 - Расчет межгрупповой дисперсии признака х
Средняя ошибка выборочного коэффициента корреляционного отношения определяется по формуле:
(1.54)
Оценка этой ошибки производится так же, как и коэффициента корреля-
ции.
75