Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5 курс / Госпитальная педиатрия / Функциональное_состояние_сердечно_сосудистой_системы_организма_детей.doc
Скачиваний:
0
Добавлен:
24.03.2024
Размер:
854.53 Кб
Скачать

2.5. Биометрические методы

В связи с большим набором исследуемых признаков, в ходе работы была создана объединенная база данных, составившая основу для обработки методами многомерной статистики. Использовались биометрические методы: корреляционный анализ, главных компонент, кластерный анализ и метод канонических корреляций.

2.5.1. Корреляционный анализ

При изучении связей между двумя количественными признаками использовался стандартный коэффициент корреляции. Неслучайность его отличий от 0 (неслучайность существования связи) проверялась нами по стандартным таблицам критических величин коэффициента корреляции (Мюллер П. и др., 1982). При превышении критических значении, использовались обозначения:

* - связь неслучайна при вероятности Р<0,05;

** - связь неслучайна при вероятности Р<0,01;

*** - связь неслучайна при вероятности Р<0,001.

2. 5. 2. Метод главных компонент

В связи с большим количеством изучаемых признаков у обследованных детей, была создана база данных, составившая основу для проведения статистической обработки биометрическими методами. Метод главных компонент - это классический метод снижения размерности данных путем определения незначительного числа линейных комбинаций исходных признаков, объединяющих большую часть изменчивости данных в целом, дающий однозначное решение.

Метод главных компонент был предложен К. Пирсоном в 1901 году и затем вновь открыт и детально разработан Хоттелингом в 1933 году (Дюк В., 1997; Григорьев С.Г. и соавт., 1992; Morrison D.F., 1990).

Этот метод осуществляет переход к новой системе координат у1, ур в исходном пространстве признаков х1, хр, которая является системой ортонормированных линейных комбинаций. Линейные комбинации представляют собой собственные (характеристические) векторы корреляционной матрицы. Первая главная компонента - это линейная комбинация, обладающая наибольшей дисперсией. Геометрически выглядит как новая ось у1, ориентированная вдоль направления наибольшей вытянутости эллипсоида рассеивания объектов выборки в исходном пространстве. Вторая главная компонента имеет наибольшую дисперсию среди всех оставшихся линейных преобразований, некоррелированных с первой главной компонентой. Она интерпретируется как направление наибольшей вытянутости эллипсоида рассеивания, перпендикулярное первой главной компоненте и т.п.

Ценную информацию о структуре данных дают главные компоненты, полученные раздельно для различных классов объектов. В этом случае, интересен анализ главных компонент с высоким порядком, близким к р, на какие главные компоненты приходится минимальный процент дисперсии распределения объектов. Они выражают устойчивые, стабильные свойства классов, инвариантные к изменчивости внутри классов.

2.5.3. Кластерный анализ

Термин кластерный анализ впервые ввел Tryon (1939). Фактически кластерный анализ является не столько обычным статистическим методом, сколько "набором" различных алгоритмов "распределения объектов по кластерам". Следует понимать, что кластерный анализ определяет "наиболее возможно значимое решение", поэтому проверка статистической значимости в действительности здесь неприменима. Техника кластеризации применяется в самых разнообразных областях.

В данной работе нами была использована древовидная кластеризация. Назначение этого метода состоит в объединении объектов в достаточно большие кластеры, используя некоторую меру сходства или расстояние между объектами. Типичным результатом такой кластеризации является иерархическое дерево. Оно начинается с каждого объекта в классе. Затем порог, относящийся к решению об объединении двух или более объектов в один кластер, понижается. В результате, связывается вместе все большее и большее число объектов, и агрегируется (объединяется) все больше и больше кластеров, состоящих из все сильнее различающихся элементов. Окончательно, на последнем шаге все объекты объединяются вместе.

На диаграммах, отражающих иерархическое дерево, горизонтальные оси представляют расстояние объединения (в вертикальных древовидных диаграммах вертикальные оси представляют расстояние объединения). Так, для каждого узла в графе (там, где формируется новый кластер) находится величина расстояния, для которого соответствующие элементы связываются в новый единственный кластер (рис. 1).

Объединение или метод древовидной кластеризации, используется при формировании кластеров несходства или расстояния между объектами. Эти расстояния могут определяться в одномерном или многомерном пространстве. Наиболее прямой путь вычисления расстояний между объектами в многомерном пространстве состоит в вычислении евклидова расстояния. Евклидово расстояние - это наиболее общий тип расстояния. Оно попросту является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом: расстояние (x,y) = { \ (ХІ - yi)2 }1/2

Канонические переменные pi и qi получаются таким образом, чтобы первая их пара p1 и q1 была бы скоррелирована так сильно, насколько это только возможно. Коэффициент корреляции p1 и q1 называется первой канонической корреляцией R1. Он описывает наиболее важную многомерную связь двух наборов признаков. Аналогичным образом вторая пара канонических переменных p2 и q2 обнаруживает вторую по степени важности многомерную связь, численно выражаемую каноническим коэффициентом корреляции R2 и т.д.

По результатам канонического анализа приводили:

- коэффициенты канонической корреляции и их квадраты;

- результаты проверки их на достоверность отличия от нуля с применением критерия Хи-квадрат (числа степеней свободы - df, и вероятность ошибки Р);

- наборы коэффициентов aij и by для двух наборов признаков;

- наборы коэффициентов корреляции между исходными признаками и каноническими переменными - нагрузки.

Обработка материала осуществлялась на кафедре анатомии, физиологии и гигиены человека Ставропольского государственного университета с использованием компьютерной программы STATISTICA 99 Edition, STATGRAPHICS Plus 5.0 и Microcoft Excel.

Соседние файлы в папке Госпитальная педиатрия