Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ml3_ibragimova

.docx
Скачиваний:
1
Добавлен:
24.02.2024
Размер:
330.08 Кб
Скачать

ГУАП

КАФЕДРА № 41

ОТЧЕТ ЗАЩИЩЕН С ОЦЕНКОЙ

ПРЕПОДАВАТЕЛЬ

Ассистент

Боженко В. В.

должность, уч. степень, звание

подпись, дата

инициалы, фамилия

ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №3

СЕТЬ КОХОНЕНА

по курсу: МАШИННОЕ ОБУЧЕНИЕ

РАБОТУ ВЫПОЛНИЛ

СТУДЕНТ ГР. №

4018k

Р.М. Ибрагимова

подпись, дата

инициалы, фамилия

Санкт-Петербург 2023

Цель работы:

Выполнить кластеризацию с помощью сети Кохонена.

Ход работы

Для начала необходимо импортировать все необходимые библиотеки.

Рисунок 1 - Импорт библиотек

Далее был прочитан файл, с которым в дальнейшем будет осуществляться работа. Так же получена информация по его столбцам, а именно, какой тип данных они имеют.

Рисунок 2 – Чтение файла

Было осуществлено форматирование имеющегося набора данных для дальнейшей работы с ним. Затем удалены дубликаты и целевой столбец «Класс», и содержимое файла, а именно первые 20 записей, выведено на экран.

Рисунок 3 – Форматирование набора данных

Рисунок 4 – Часть таблицы

Осуществлена нормализация данных с помощью MinMaxScaler, так как он дает большее значение метрики силуэта, чем стандартный скалер.

Рисунок 5 - Нормализация

Создан класс самоорганизующейся карты Кохонена для работы с сетью, работа которого заключается в произведении перерасчета весов и выдаче предположительного результата.

Рисунок 6 - Класс

Производится обучение сети и получение кластеров. Параметры количество нейронов, радиус, коэффициент обучения и количество эпох - определенны в ходе неоднократного ручного запуска.

Рисунок 7 - Обучение модели

После выведены средние значения для каждого кластера и распределение относительно их. А далее – рассчитана метрика силуэта.

Рисунок 8 - Кластеры

Рисунок 9 - Метрика силуэта

В прошлом семестре методом k-средних для двух кластеров метрика силуэта была равна: 0.522, что больше получившейся с помощью сети Кохонена. Это может указывать, на то, что кластеры сильнее с друг другом пересекаются, но это различие не существенно.

Вывод

В процессе выполнения работы была изучено, что такое самоорганизующаяся карта Кохонена, для чего она используется, принцип ее работы и обучения. Реализована сеть Кохонена с помощью Python, обработан набор данных для тренировки и обучения сети и проверена работоспособность сети. По результатам было выделено 4 кластера в данных.

Ссылка на google.colab https://colab.research.google.com/drive/1lYFAMX3gyC3316IoT_aE9E-xShvnPNp6?usp=sharing

Соседние файлы в предмете Машинное обучение