Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ДИПЛОМ.docx
Скачиваний:
32
Добавлен:
01.06.2015
Размер:
805.67 Кб
Скачать

3.4 Описание результатов и их анализ

Благодаря системе самоорганизующихся карт Кохонена можно решить задачу поиска похожих объектов и их группировки. Самоорганизующиеся карты Кохонена обладают и другими возможностями. Они позволяют также представить полученную информацию в простой и наглядной форме путем нанесения раскраски.

В результате применения самоорганизующихся карт многомерное пространство входных факторов было представлено в двухмерном виде, в котором его достаточно удобно анализировать.

Банки были классифицированы на 18 групп, для каждой из которых возможно определение конкретных характеристик, исходя из раскраски соответствующих показателей.

Но нужно еще добавить, что после проведенного кластерного анализа, нет оснований считать, что полученное решение является адекватным. Результаты кластерного анализа обязательно требуют проверки с помощью формальных и неформальных методов.

Неформальная проверка результатов кластерного анализа включает в себя такие процедуры как

1. анализ результатов кластеризации, полученных на определенных выборках набора данных;

2. кросс-проверка;

3. проведение кластеризации при изменении порядка наблюдений в наборе данных;

4. проведение кластеризации при удалении некоторых наблюдений;

5. проведение кластеризации на небольших выборках;

Один из вариантов проверки качества кластеризации - использование нескольких методов и сравнение полученных результатов. Отсутствие подобия не будет означать некорректность результатов, но присутствие похожих групп считается признаком качественной кластеризации.

В этой главе мы рассмотрели такую парадигму нейронных сетей как карты Кохонена. Основное отличие этих сетей от других моделей состоит в наглядности и удобстве использования. Эти сети позволяют упростить многомерную структуру, их можно считать одним из методов проецирования многомерного пространства в пространство с более низкой размерностью. Интенсивность цвета в определенной точке карты определяется данными, которые туда попали: ячейки с минимальными значениями изображаются темно-синим цветом, ячейки с максимальными значениями - красным.

Другое принципиальное отличие карт Кохонена от других моделей нейронных сетей - иной подход к обучению, а именно - неуправляемое или неконтролируемое обучение. Этот тип обучения позволяет данным обучающей выборки содержать значения только входных переменных. Сеть Кохонена учится понимать саму структуру данных и решает задачи кластеризации.

Заключение

Наступивший XXI век стал этапным для проникновения новых информационных технологий и создаваемых на их основе высокопроизводительных компьютерных систем во все сферы человеческой деятельности - управление, производство, науку, образование и т.д.

Кластерный анализ параллельно развивался в нескольких направлениях, таких как биология, психология, др., поэтому у большинства методов существует по два и более названий. Это существенно затрудняет работу при использовании кластерного анализа. Кластеризация служит для объединения больших объемов данных в группы (кластеры), которые характеризуются тем, что элементы внутри каждой группы имеют больше «сходства» между собой, чем между элементами соседних кластеров. В целом, все методы кластеризации можно подразделить на иерархические и неиерархические. Последние чаще всего используются при анализе больших объемов данных, т.к. они обладают большей скоростью.

Кластерный анализ не накладывает ограничения на представление исследуемых объектов, позволяет анализировать показатели различных типов данных (интервальным данным, частотам, бинарным данным). При этом нужно помнить, что переменные должны измеряться в сравнимых шкалах.

В ходе дипломной работы мною были рассмотрены методы кластерного анализа, их виды, подробно был рассмотрен метод кластерного анализа-самоорганизующиеся карты Кохонена.

Итогом проделанной работы стали следующие выводы и практические результаты:

  • Задача кластеризации состоит в разделении исследуемого множества объектов на группы похожих объектов, называемых кластерами;

  • Для определения «похожести» объектов вводится мера близости, называемая расстоянием;

  • Результаты кластеризации могут быть представлены разными способами;

  • Базовые методы кластеризации делятся на иерархические и неиерархические;

Кластерный анализ – один из наиболее интересных и действенных способов обработки информации.