Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Уч_пособие за 2009.doc
Скачиваний:
3
Добавлен:
16.09.2019
Размер:
2.76 Mб
Скачать

2.4. Кластерный анализ

Кластерный анализ предназначен для разбиения совокупности объектов на однородные группы (кластеры или классы). По сути это задача многомерной классификации данных.

Сфера применения кластерного анализа достаточно широка – от медицины и социологии – до маркетинга и менеджмента. В процессе разработки стратегии часто возникает необходимость кластеризации, когда компания разрабатывает стратегию привлечения или удержания клиентов, разрабатывает механизмы наиболее эффективной работы с поставщиками, в процессе разработки стратегии развития персонала возникает необходимость разбиения персонала на различные по уровню мотивации группы и т.д.

Существует около 100 разных алгоритмов кластеризации, однако наиболее часто используемые: иерархический кластерный анализ и кластеризация методов k-средних.

Прежде чем проводить кластерный анализ, необходимо задать четкие критерии, на основании которых будет классифицироваться массив данных. Так, например, для определения типа поставщика необходимо отнести соответствующие вопросы анкеты к одной из описываемых ими переменных (стратегическая важность закупки и сложность управления закупочной ситуацией) и уже в пространстве этих параметров классифицировать отношения с поставщиками. Для решения этой задачи необходимо провести факторный анализ.

С помощью кластерного анализа проверяют весь набор взаимозависимых связей. В кластерном анализе не проводят различия между зависимыми и независимыми переменными. Цель кластерного анализа— классификация объектов на относительно однородные (гомогенные) группы, исходя из рассматриваемого набора переменных. Если данные понимать как точки в пространстве некоторых признаков, задача кластерного анализа формулируется как выделение «сгущений точек», разбиение совокупности на однородные подмножества объектов.

На рис. 12 показана идеальная ситуация кластеризации, когда кластеры четко отделены друг от друга на основании различий двух переменных3.

Рис. 12. Идеальная ситуация кластеризации

Однако на практике обычно встречается ситуация, как на рис. 134:

Рис.13. Реальная ситуация кластеризации

Кластерный анализ используют в маркетинге для различных целей.

Сегментация рынка. Например, потребителей можно разбить на кластеры на основе выгод, которые они ожидают получить от покупки данного товара. Каждый кластер может состоять из потребителей, которые ищут схожие выгоды. Этот метод называют сегментацией преимуществ (benefit segmentation).

Понимание поведения покупателей. Кластерный анализ используется для идентификации однородных групп покупателей. Затем поведение каждой группы при покупке товара изучается отдельно.

Определение возможностей нового товара. Кластеризацией торговых марок и товаров можно определить конкурентоспособные наборы в пределах данного рынка. Торговые марки в одном и том же кластере конкурируют более жестко между собой, чем с марками других кластеров. Фирма может изучить свои текущие предложения в сравнении с предложениями своих конкурентов, чтобы определить потенциальные возможности новых товаров.

Выбор тестовых рынков. Группировкой городов в однородные кластеры можно подобрать сравнимые города для проверки различных маркетинговых стратегий.

Сокращение размерности данных. Кластерный анализ можно использовать как основной инструмент сокращения размерности данных при создании кластеров или подгрупп данных, более удобных для анализа, чем отдельные наблюдения. Последующий анализ выполняют над кластерами, а не над отдельными наблюдениями.

Кластерный анализ выполняется в несколько этапов5:

  1. формулировка проблемы:

  2. выбор меры расстояния;

  3. выбор метода кластеризации;

  4. принятие решения о количестве кластеров;

  5. интерпретация и профилирование кластеров;

  6. оценка достоверности кластеризации.

Первый этап — формулировка проблемы кластеризации путем определения переменных, на базе которых она будет проводиться. В данном исследовании процедура кластерного анализа, как уже говорилось, будет применяться трижды, соответственно, необходимо три набора переменных6:

  1. пара переменных «Стратегическая важность закупки – сложность управления закупочной ситуацией» - для классификации поставщиков;

  2. параметр для оценки эффективности отношений, называющийся, соответственно, «Эффективность»;

  3. переменные для анализа организационных способностей – «Способности по координации и конфигурации процессов», «Способности в области коммуникаций», «Способности в области управления и контроля за взаимоотношениями», «Ориентация на развитие взаимоотношений», «Способности к обучению в отношениях».

После определения переменных выбирается соответствующий способ измерения расстояния. Мера расстояния показывает, насколько объекты, подвергнутые кластеризации, схожи или не схожи между собой. Наиболее распространенный метод заключается в том, чтобы в качестве такой меры использовать расстояния между двумя объектами. Объекты с меньшими расстояниями между собой больше похожи, чем объекты с большими расстояниями.

Разработано несколько методов кластеризации, и исследователю необходимо выбрать наиболее подходящий для решения данной проблемы. В пакете SPSS можно воспользоваться процедурой иерархического кластерного анализа или методом k-средних.

Суть иерархического кластерного анализа заключается в следующем7. Перед началом кластеризации все объекты считаются отдельными кластерами, которые в ходе алгоритма объединяются. Вначале берется N объектов и между ними попарно вычисляются расстояния. Далее выбирается пара объектов, которые расположены наиболее близко друг от друга, и эти объекты объединяются в один кластер. В результате количество кластеров становится N-1. Процедура повторяется, пока все объекты не объединятся в кластеры. На любом этапе объединение можно прервать, получив нужное количество кластеров.

Процедура иерархического кластерного анализа эффективна для малого числа объектов, но не пригодна для массивов большого объема. В такой ситуации наиболее приемлем алгоритм, носящий название метода «k-средних». Алгоритм заключается в следующем: выбирается заданное число k точек и на первом шаге эти точки рассматриваются как «центры» кластеров. Каждому кластеру соответствует один центр. Объекты распределяются по кластерам по принципу: каждый объект относится к кластеру с ближайшим к этому объекту центром. Таким образом, все объекты распределяются по k кластерам.

Решение о числе кластеров также принимает исследователь. В нашем исследовании это будет 4 кластера при сегментировании поставщиков. Для определения эффективности было решено также построить четыре кластера, отражающих разную степень эффективности, чтобы посмотреть отличие в создаваемой ценности в отношениях с различными типами поставщиков. При анализе организационных способностей. Для определения реализуемых организационных способностей также предлагаем задать в качестве условия создание четырех кластеров, которые будут показывать степень реализации компетенций. Анализ проведенной кластеризации позволит оценить адекватность такого числа кластеров и скорректировать их количество в случае необходимости.

Сформированные кластеры нужно анализировать с точки зрения переменных, использованных для их получения. Для отнесения кластера к заранее предусмотренной категории (например, типу поставщика, как в нашем исследовании), необходимо смотреть кластерные центроиды – средние значения переменной (фактора), на основании которой проводилась кластеризация.

И, наконец, исследователь должен оценить достоверность (качество) процесса кластеризации. Адекватную проверку качества кластерного анализа обеспечат следующие процедуры.

1. Выполняйте кластерный анализ на основании одних и тех же данных, но с использованием различных способов измерения расстояния. Сравните результаты, полученные на основе разных мер расстояния, чтобы определить, насколько совпадают полученные результаты.

2. Используйте разные методы кластерного анализа и сравните полученные результаты.

3. Разбейте данные на две равные части случайным образом. Выполните кластерный анализ отдельно для каждой половины. Сравните кластерные центроиды двух подвыборок.

4. Случайным образом удалите некоторые переменные. Выполните кластерный анализ по сокращенному набору переменных. Сравните результаты с полученными на основе полного набора переменных.