Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

5 курс / Пульмонология и фтизиатрия / Внебольничная_пневмония_и_дизадаптационный_синдром

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
6.99 Mб
Скачать

РАЗДЕЛ II

же не быть идентичными (т. е. профили не проходят через одни и те же точки). Таким образом, высокая корреляция между профилями будет наблюдаться, когда измерения одного из профилей будут ли­ нейно зависеть от измерений другого.

Коэффициент, благодаря указанным его свойствам, в отличие от других мер сходства широко используется в различных приложе­ ниях кластерного анализа. При правильном применении кластерного метода коэффициент корреляции превосходит другие коэффициенты сходства (меры, расстояния, коэффициенты ассоциативности, веро­ ятностные коэффициенты сходства), так как позволяет уменьшить число неверных классификаций.

Для кластерного анализа данных применяют какой-либо метод из ряда разработанных кластерных. Наиболее часто в приложениях употребляются иерархические агломеративные методы.

Это объяснятся тем, что все эти методы просматривают матри­ цу сходства размерностью N х N (где N - число объектов) и после­ довательно объединяют наиболее сложные объекты. Именно поэто­ му они называются агломеративными.

Второй важный момент состоит в том, что последовательность объединений кластеров можно представить визуально в виде древо­ видной диаграммы. Третьим важным моментом является то, что для полной кластеризации этими методами на основе матрицы сходства размерностью N х N требуется ровно N-1 шагов.

На первом шаге события (объекты) рассматриваются как само­ стоятельные кластеры. На последнем шаге все события объединяют­ ся в одну большую группу. По определению, в результате работы этих кластерных методов получаются неперекрывающиеся класте­ ры, которые, однако, являются вложенными в том смысле, что каж­ дый кластер может рассматриваться как элемент другого, более ши­ рокого кластера на более высоком уровне сходства. Самым распро­ страненным способом представления результатов этих кластерных методов, как уже говорилось выше, является дендрограмма (древо­ видная диаграмма), которая графически изображает иерархическую структуру, порожденную матрицей сходства и правилом объедине­ ния объектов в кластеры. Агломеративные методы различаются главным образом по правилам построения кластеров. Существует много различных правил группировки, каждое из которых порожда­ ет специфический иерархический метод. Известно по крайней мере двенадцать различных методов группировки.

162

___________ОБОСНОВАНИЕ МЕТОДОВ И ОБЪЕМА ПРОФИЛАКТИКИ__________

Анализ данных проводился с помощью метода Уорда.

Выбор метода был обусловлен его особенностями, позволяю­ щими получить хорошую отделимость кластеров при минимизации их количества.

Данный метод построен таким образом, чтобы оптимизировать минимальную дисперсию внутри кластеров. Эта целевая функция известна как внутригрупповая сумма квадратов, или сумма квадра­ тов отклонений (СКО).

Формула суммы квадратов отклонений имеет вид

СКО = Х^.^- 1 / n ( L X,.)',

где X - значение признака j -го объекта. На первом шаге, когда каж­ дый кластер состоит из одного объекта, СКО равна 0. По методу Уорда объединяются те группы или объекты, для которых СКО по­ лучает минимальное приращение. Метод имеет тенденцию к нахож­ дению (или созданию) кластеров приблизительно равных размеров и имеющих гиперсферическую форму. Метод Уорда минимизирует дисперсионный разброс.

Структура исходной информации, цели исследования (прогноз­ ная диагностика на основании проводимого обследования) опреде­ лили дальнейшую последовательность проведения статистического анализа.

Указанные математические действия позволили разделить ис­ ходную выборку (группу обследованных) на две категории: здоро­ вых и пациентов, для которых необходимо дополнительное обсле­ дование.

«Дискриминантный анализ» - это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. В кон­ кретных ситуациях необязательно использовать все эти процедуры. Их можно разделить на методы интерпретации межгрупповых раз­ личий и методы классификации наблюдений по группам.

Объекты должны принадлежать одному из выделяемых классов (групп). Объекты являются основными элементами анализа.

Проблема интерпретации возникает при рассмотрении разли­ чий между классами. При интерпретации ставятся задачи:

а) отличие классов при заданном наборе характеристик;

163

РАЗДЕЛ II

б) насколько хорошо эти характеристики позволяют провести различение, и какие из них наиболее информативны.

Данный метод, относящийся к классификации, связан с получе­ нием одной или нескольких функций, обеспечивающих возмож­ ность отнести данный объект к одной из групп. Эти функции, назы­ ваемые дискриминантными, зависят от характеристик таким обра­ зом, что появляется возможность отнести данный объект к одной из групп. Характеристики, применяемые для того, чтобы отличать один класс от другого, называются дискриминантными переменными. Эти переменные должны измеряться либо по интервальной шкале, либо по шкале отношений. Таким образом, становится возможным вычисление математических ожиданий, дисперсий и правомерно использование дискриминантных переменных в математических уравнениях.

В общем случае число дискриминантных переменных неограничено, но в сумме число объектов должно превышать число пере­ менных по крайней мере на два.

Кроме этого существуют определенные ограничения, касающи­ еся статистических свойств дискриминантных переменных:

а) ни одна переменная не может быть линейной комбинацией других (недопустимы переменные, коэффициент корреляции кото­ рых равен 1);

б) ковариационные матрицы для генеральных совокупностей (генеральные ковариационные матрицы) равны между собой для различных классов;

в) закон для каждого класса является многомерным нормаль­ ным, т. е. каждая переменная имеет нормальное распределение при фиксированных остальных переменных. Данное предположение позволяет получить точные значения вероятности принадлежности к данному классу и критерия значимости.

Упомянутые допущения для дискриминантного анализа фунда­ ментальны. Если экспериментальные данные для конкретной задачи не удовлетворяют этим предположениям, то статистические выводы не будут точным отражением реальности.

Из всего сказанного должно быть ясно, что дискриминантный анализ используется для изучения различий между несколькими группами по определенному набору дискриминантных переменных.

Просуммируем математические допущения, которые принима­ ются в дискриминантном анализе. Введем следующие обозначения:

164

___________ОБОСНОВАНИЕ МЕТОДОВ И ОБЪЕМА ПРОФИЛАКТИКИ__________

g - число классов;

p - число дискриминантных переменных; ni - число объектов (наблюдений) класса i; n - общее число объектов всех классов.

Вмодели дискриминантного анализа должно быть:

1)два или более классов g > 2;

2)по крайней мере два объекта в каждом классе;

3)любое число дискриминантных переменных при условии,

что оно не превосходит общее число объектов за вычетом двух; 0 <p < (n - 2);

4)измерение дискриминантных переменных по интервальной

шкале;

5)линейная независимость;

6)приблизительное равенство между ковариационными матри­ цами для каждого класса (если не используются специальные фор­ мулы);

7)многомерная нормальность закона распределения дискрими­ нантных переменных для каждого класса.

Данные требования являются достаточными для получения корректных результатов применения дискриминантного анализа.

Общий вид дискриминантной функции:

i=n

/

X ib - X is

2

^ =

 

2

Z

V

аi

a'

i—1

J

7 -1

 

 

 

где n - число свойств, составляющих совокупность; ^ ^ - обозна­

чения i-го свойства (пункта анкеты), соответственно, для обоих объ­

ектов b и s;

- среднее

квадратичное отклонение по всей исследу­

емой выборке значений;

- «вес» (коэффициент важности) i-го

свойства среди других свойств.

По исходной выборке можно определить ^ ^ , а и а .

Далее, для части показателей, вошедших в число дискрими­ нантных переменных, строились уравнения многомерных регрессий.

При этом, очевидно, что при всей общности предлагаемого подхода решения проблемы полученные конкретные результаты (численные значения коэффициентов) являются все же условно уни­

165

РАЗДЕЛ II

версальными, так как построенные в работе зависимости являются не функциональными, а эмпирическими. Статистические величины, полученные во всех расчетах, оценивались с помощью соответству­ ющих критериев с пороговым уровнем достоверности не ниже 95 % (р = 0,05).

Разработанная модель состоит из трех основных частей (вычис­ лительных комплексов):

1.Комплекс дискриминантных функций, позволяющих произ­ водить интегральную оценку состояния сердечно-сосудистой систе­ мы (А1), общих адаптационных реакций (А2), интенсивность основ­ ного обмена (А3), трофологический статус (А4) на втором и третьем месяце пребывания призывников в «новых» условиях на основании данных первичного обследования.

2.По результатам, полученным на первом этапе, производится

распределение обследованных на группы риска по заболеваемости респираторной патологией.

3. Создание комплекса регрессионных уравнений, позволяю­ щих производить расчёт биохимических показателей, выступающих в качестве переменных, на 1-м, 2-м этапах на основании клиниче­ ских данных призывников.

Проведенные построения, в соответствии с требованиями к ис­ ходным переменным, позволили благодаря парным корреляциям между показателями в исходной выборке данных и выполнению требований к ковариационным матрицам исходных данных постро­ ить комплексы дискриминантных функций, включающих 19 суще­ ственных величин, рассчитать интегральные коэффициенты для этих величин, а также определить уровни детерминации (R). Инте­ гральные коэффициенты получены для 2-го и 6-го месяцев пребыва­ ния призывников в «новых» условиях (А/2; А/3).

Алгоритм прогноза изменений состояния сердечно-сосудистой системы через два месяца пребывания призывников в «новых» усло­ виях

А1/2 = 0,009 р1 - 0,431бм1 + 0,109 рег - 0,008 выд1 - 0,768 (R = 96 %),

где, р1 - рост, бм1 - белок в моче, рег. - регион постоянного прожи­ вания (1 - регионы европейской территории России; 2 - регионы

166

___________ОБОСНОВАНИЕ МЕТОДОВ И ОБЪЕМА ПРОФИЛАКТИКИ__________

Сибири и Дальнего Востока), выд 1 - объем грудной клетки на выдо­ хе. Все показатели получены при первом обследовании.

Алгоритм прогноза развития общих адаптационных реакций через два месяца пребывания призывников в «новых»условиях

А2/2 = 0,019тт1 + 0,176жел1 + 0,023ноквв1 - 1,383 (R = 98 %),

где тт1 - температура тела, жел1 - ЖЕЛ, ноквв1 - NО КВВ. Все по­ казатели получены при первом обследовании.

Алгоритм прогноза изменений интенсивности основного обме­ на через два месяца пребывания призывников в «новых» условиях

А3/2 = 0,139жел1 + 0,0269 ноквв1-0,277бм1-0,011выд1 + 0,02р1 - 0,231 (R = 92 %),

где жел1 - ЖЕЛ, ноквв1 - NО КВВ, бм1 - белок в моче, выд1 - объ­ ем грудной клетки на выдохе, р1 - рост. Все показатели получены при первом обследовании.

Алгоритм прогноза динамики трофологического статуса через два месяца пребывания призывников в «новых» условиях

А4/2 = 0,049тт1 - 0,015вд1 + 0,003па1 - 0,072жел1 - 0,184 (R = 90 %),

где тт1 - температура тела, вд1 - объем грудной клетки на вдохе, па1 - ПА, жел1 - ЖЕЛ. Все показатели получены при первом обсле­ довании.

Алгоритм прогноза изменений состояния сердечно-сосудистой системы через шесть месяцев пребывания призывников в «новых» условиях

А1/3 = 0,020тт1-0,412бм1-0,038опа1+0,117жел1-0,768 (R = 96 %),

где тт1 - температура тела, бм1 - белок в моче, опа1 - общая протеолитическая активность, жел1 - ЖЕЛ. Все показатели получены при первом обследовании.

Алгоритм прогноза развития общих адаптационных реакций через шесть месяцев пребывания призывников в «новых» условиях

А2/3 = 0,024тт1+0,197мод1-0,106жел1-1,383 (R = 99 %),

167

РАЗДЕЛ II

где тт1 - температура тела, мод1 - МОД, жел1 - ЖЕЛ. Все показате­ ли получены при первом обследовании.

Алгоритм прогноза изменений интенсивности основного обмена через шесть месяцев пребывания призывников в «новых» условиях

А3/3 = 0,003рег1+0,009наг1-0,008ка1+0,031мод1-0,231 (R = 96 %),

где, рег. - регион постоянного проживания (1 - регионы европей­ ской территории России; 2 - регионы Сибири и Дальнего Востока), наг1 - N-ацeтил-P-D-глюкозаминидаза мочи, КА1 - коллагеназная активность, мод1 - МОД. Все показатели получены при первом об­ следовании.

Алгоритм прогноза динамики трофологического статуса через шесть месяцев пребывания призывников в «новых» условиях

А4/3 = 0,006САД1+0,013пкт1-0,017тт1+0,035жел1-0,184 (R = 95 %),

где, САД1 - систолическое артериальное давление, пкт1 - показа­ тель крепости телосложения, тт1 - температура тела, жел1 - ЖЕЛ. Все показатели получены при первом обследовании.

Важно отметить, что некоторые из показателей, используемых в представленных выше алгоритмах прогноза, можно получить рас­ чётным путём. При первичном обследовании призывников для рас­ чёта дискриминантных функций необходим ряд биохимических (бм, ноквв, па) и функциональных (жел) показателей. С применением уравнения многомерной регрессии на основе части дискриминант­ ных переменных построены дискриминантные функции, рассчитаны коэффициенты и уровни детерминации (R) этих показателей.

Алгоритм расчёта количества белка мочи по физиологическим показателям

бм1 = 0,00272дад1 - 0,01348чд1 + 0,00203р1 (R = 89 %),

где дад1 - ДАД; чд1 - частота дыхания; р1 - рост. Все показатели получены при первом обследовании.

Алгоритм расчёта показателей ЖЕЛ по физиологическим пара­ метрам

168

ОБОСНОВАНИЕ МЕТОДОВ И ОБЪЕМА ПРОФИЛАКТИКИ

жел1 = 0,02612в1 + 0,01808дад1 (R = 98 %),

где в1 - вес; дад1 - ДАД. Все показатели получены при первом об­ следовании.

Алгоритм расчёта уровня NO КВВ по физиологическим показа­ телям

ноквв1 = 0,58643выд1 - 0,41774вд1 - 0,09617в1 (R = 91 %),

где выд1 - объем грудной клетки на выдохе, вд1 - объем грудной клетки на вдохе, в1 - вес. Все показатели получены при первом об­ следовании.

Алгоритм расчёта показателя поверхностной активности КВВ по физиологическим показателям

па1 = 0,36974р1 - 0,26891п1 - 0,73248чд1 (R = 93 %),

где р1 - рост п1 - пульс, чд1 - частота дыхания. Все показатели по­ лучены при первом обследовании.

На основании восьми полученных прогностических алгоритмов построено два дискриминантных уравнения, характеризующие эта­ пы мониторинга адаптационного процесса, для формирования групп риска по респираторной заболеваемости на 2-м (Р2 ) и 6-м (Р3 ) меся­ цах пребывания призывников в «новых» условиях.

? 2 = 0,287А1/2 + 0,171А2/2 + 0,376А3/2 + 0,167А4/2 (R = 97 %),

где А1/2 - показатель интегральной оценки состояния сердечно­ сосудистой системы через 2 мес пребывания призывников в «но­ вых» условиях, А2/2 - показатель интегральной оценки общих адап­ тационных реакций через 2 мес пребывания призывников в «новых» условиях, А3/2 - показатель интегральной оценки интенсивности основного обмена через 2 мес пребывания призывников в «новых» условиях, А4/2 - показатель интегральной оценки трофологического статуса через 2 мес пребывания призывников в «новых» условиях

Р3 = 0,321А1/3 + 0,208А2/3 + 0,221А3/3 + 0,249А4/3 (R = 98 %),

где А1/3 - показатель интегральной оценки состояния сердечно­ сосудистой системы через 6 мес пребывания призывников в «но­ вых» условиях, А2/3 - показатель интегральной оценки общих адап­

169

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»