Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
политанал.doc
Скачиваний:
15
Добавлен:
22.12.2018
Размер:
678.91 Кб
Скачать

32!. Кластерный анализ.

Cluster – пучок, группа. Процедура, позволяющая классифицировать различные объекты. Можно разбить респондентов на группы, сходные по ряду признаков. На дендрограмме дерева признаков признаки соединяются линиями, образуя отдельные пучки. Чем короче линия, связывающая переменные, тем ближе они находятся в пространстве признаков. Перед началом анализа переменные должны быть преобразованы в биноминальные, принимающие значение 1 при наличии признака и 0 при отсутствии признака. Из анализа исключаются «затрудняюсь ответить», «другое» и т.д.

Важную роль играют меры сходства. Кластеры:

- плотность. Близость отдельных точке скопления

- дисперсия – степень рассеяния точек в пространстве относительно центра кластера

Термин кластерный анализ (впервые ввел Tryon, 1939).

Методы кластерного анализа позволяют решать следующие задачи:  • проведение классификации объектов с учетом признаков, отражающих сущность, природу объектов. Решение такой задачи, как правило, приводит к углублению знаний о совокупности классифицируемых объектов;  • проверка выдвигаемых предположений о наличии некоторой структуры в изучаемой совокупности объектов, т.е. поиск существующей структуры;  • построение новых классификаций для слабоизученных явлений, когда необходимо установить наличие связей внутри совокупности и попытаться привнести в нее структуру. Методы кластерного анализа: одиночной, полной, средней связи; метод Уорда. Метод Уорда позволяет создавать кластеры приблизительно равных размеров. Он сначала объединяет самые близкие объекты, затем уже к образованным кластерам присоединяются сходные с ними объекты. Мера сходства – коэффициент корреляции Пирсона.

Кластерный анализ – способ группировки многомерных объектов, основанных на представлении результатов отдельных наблюдений точками с последующими выделением групп как сгустка этих точек.

Цель: выделение в исходных многомерных данных таких подмножеств, чтобы объекты внутри группы были похожи друг на друга.

Задача: выделить в пространстве и визуализировать эти естественные скопления.

2 вида исходных данных: матрица близости и объекты, представленные как точки.

Как научное направление кластерный анализ заявил о себе в середине 60-ых годов.

33!. Критерии выделения типов алгоритмов кластерного анализа.

Основания для кластерных алгоритмов:

характер отношения, который отыскивается как результат классификации

разбиение с непересекающимися классами (отношение эквивалентности). Все объекты внутри класса считаются тождественными, а объекты разных классов нет

Разбиение с пересекающимися классами.

Иерархическое дерево.

Отношение произвольной структуры

степень участия человека в процедуре выделения кластеров машинный способ. Программист задает параметры классификации

чел участвует в процессе разбиения. Программа выдает не классификацию, а информацию. характер априорных сведений для работы алгоритма сведений нет

задано число искомых классов

могут быть заданы пороговые значения величины близости объектов

заданы комбинированные сведения

характер работы алгоритма классификации. В зависимости от порядка просмотра точек

зависящие от порядка просмотра

независящие