35!. Виды алгоритмов в кластерном анализе.

Иерархические алгоритмы.

рассмотрение каждого объекта как отдельного кластера.

объединяются два ближайших объекта, которые образуют новый класс. Определяется расстояние от этого класса до всех остальных объектов.

далее на каждом шаге повторяется та же процедура, пока все объекты не объединяться в один класс. Если сразу несколько объектов имеют минимальное расстояние, то возможны 2 стратегии: выбор одной случайно пары (восходящая иерархическая классификация) или сразу всех пар (метод ближайших соседей). Ориентировочным критерием для деления совокупности на кластеры может быть резкое увеличение на очередном шаге расстояния между кластерами, что говорит о значительной разнородности объектов.

Упорядочение матрицы расстояний и последовательного формирования кластеров.

Все расстояния условно разбиваются на малые, средние и большие. Вручную осуществляется такая перестановка строк и столбцов, чтобы у диагонали собирались малые и средние расстояния. Выделение кластеров производится визуально.

Процедуры эталонного типа.

Выбираются случайным образом N-точек, объявляемых центрами классов. Стоятся окружности таким образом, чтобы не осталось свободных, неохваченных точек. Затем интерпретируются свойства объектов, объединенных в одной окружности.

Алгоритмы типа разрезанного графа.

Из полносвязанного графа размерность N на N, внутри которого расположены все изучаемые объекты, удаляются последовательно дуги с самыми большими расстояниями, пока граф не распадется на несколько несвязанных подграфов.

36 Пат-анализ – это способ статистического анализа, которым можно оценить точность таких моделей путем эмпирической оценки прямых и непрямых воздействий одной переменной на другую.

Пат-анализ начинается с построения концептуальной модели, которая выделяет причинные связи.

X₁ = р_1uR_u; Х₂ = p₂₁X₁ +p_2vR_v; Х₃ = p₃₂X₂ + p₃₁X_1b+p_3wR_w.

p в этих уравнениях представляет пат-коэффициенты, которые подытоживают размер или силу воздействия, оказываемого одной переменной на другую при постоянных воздействиях других переменных. Общепринятый способ написания пат-коэффициента – p_ij, что обозначает направление от переменной j к переменной i. Таким образом, набор данных уравнений говорит о том, что величина X₁ целиком обусловлена факторами, лежащими за пределами модели, величина X₂ обусловлена X₁ и факторами вне модели, и величина X₃ обусловлена X₁, X₂ и факторами вне модели. Такие переменные, как X₂ и X₃, которые хотя бы частично определены другими переменными данной модели, называются зависимыми, а переменные, полностью обусловленные внешними по отношению к модели факторами, называются независимыми.

Модели подразделяются на рекурсивные и нерекурсивные. Модель рекурсивна тогда, когда все задействованные в ней переменные могут быть расположены так, что первая будет определяться только внешними факторами, вторая – только внешними факторами и первой переменной, третья – только внешними факторами и первой и второй переменными и т.д. Короче говоря, все это означает, что все причинные влияния должны осуществляться в одном направлении без “обратной связи”. Если между любыми переменными модели существует обратная связь (взаимная причинность), то она считается нерекурсивной.

Проверка. Если значение любого из пат- коэффициентов (коэффициентов стандартизованной регрессии), полученных при этих расчетах, приближается к 0 или является статистически незначимым, то это свидетельствует о том, что мы неверно построили модель, предположив в ней взаимосвязь, которой на самом деле в данных нет. Кроме этого, можно проверить верность наших предположений относительно отсутствия взаимодействия путем вычисления регрессии между эндогенными переменными и теми, с которыми они, по нашему мнению, не связаны. Если полученные пат- коэффициенты существенно отличны от 0 (>=0,2, например) и статистически значимы, нам придется заключить, что модель (и наша теория о тех явлениях, которые ею представлены) нуждается в пересмотре. Пат-анализ такого типа позволит судить не только о том, связаны ли переменные в нашей модели именно так, как мы предполагали, но и о том, каково относительное влияние каждой переменной на другие переменные в данной модели. Суммарное воздействие одной переменной на другую равно значению или силе прямой связи между ними плюс значение или сила непрямых связей, существующих между ними. Сила непрямой связи измеряется произведением тех прямых связей, из которых она состоит.

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 1718 / 3118 19 20 21 22 23 24 25 26 27 28 29 30 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.11.2019194.56 Кб25полезность на ВМО 20.10.doc
#
17.11.20182.4 Mб74Полимеры в медицине и биологии.doc
#
03.12.2018173.57 Кб1Полина колонтитул справлен.doc
#
18.09.201956.22 Кб0Полит. система Австралии.docx
#
15.04.2015538.11 Кб3Полит.гео.doc
#
22.12.2018678.91 Кб14политанал.doc
#
21.03.201621.61 Mб14Политическая георафия 2014.pdf
#
18.11.2019130.05 Кб2ПОЛИТИЧЕСКАЯ КАРТА МИРА.doc
#
23.09.201941.23 Кб0ПОЛИТИЧЕСКАЯ КУЛЬТУРА И ДЕМОКРАТИЯ.docx
#
18.09.201922.28 Кб0Политическая система Бразилии.docx
#
20.09.201964.14 Кб2Политическая система Великобритании.docx