Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
экзамен по исследованиям.doc
Скачиваний:
16
Добавлен:
10.09.2019
Размер:
738.3 Кб
Скачать

50. Иерархическая и неиерархическая кластеризация в маркетинговых исследованиях.

Иерархические методы бывают агломеративная (объединяющая) кластеризация начинается с каждого объекта в отдельном кластере. Кластеры объединяют, группируя объекты каждый раз во всё более и более крупные кластеры. Этот процесс продолжается до тех пор, пока все объекты не станут членами одного кластера.

дивизивная кластеризация начинается со всех объектов, сгруппированных в единственном кластере. Кластеры делят до тех пор, пока каждый объект не окажется в отдельном кластере.

Обычно в МИ используются агломеративные методы, например, методы связи, дисперсионные и центроидные данные.

Методы связи:

- «метод ближайшего соседа» (одиночная связь) - первыми объединяют два объекта, расстояние между которыми минимально. Далее определяют следующее по величине самое короткое расстояние, и в кластер с двумя первыми объектами вводят третий объект. Расстояние между кластерами – расстояние между их ближайшими точками.

- «далёкого соседа» (полная связь) – расстояния между кластерами вычисляют как расстояния между их самыми удалёнными точками. - «среднего расстояния» - расстояние между кластерами определяют как среднее значение всех расстояний между объектами двух кластеров.

Неиерархические методы:

Последовательный пороговый метод – выбирают центр кластера и все объекты, находящиеся в пределах заданного от центра порогового значения, группируют вместе. Затем выбирают новый кластерный центр, и процесс повторяют для несгруппированных точек.

Параллельный пороговый метод работает аналогично, выбирают несколько кластерных центров и объекты в пределах порогового уровня группируют с ближайшим центром.

Недостатки неиерархических методов:

*число кластеров определяется заранее и выбор кластерных кластерных центров происходит независимо

*многие неиерархические методы выбирают К-случаев (К-количество кластеров) и зависят от порядка наблюдений.