МИНОБРНАУКИ РОССИИ
Санкт-Петербургский государственный
электротехнический университет
«ЛЭТИ» им. В.И. Ульянова (Ленина)
Кафедра БТС
отчет
по индивидуальному домашнему заданию
по дисциплине «Технологии и системы принятия решений»
Тема: Классификация особо опасных сердечных аритмий
Вариант №9
Студент гр. 7503 |
|
Исаков А.О. |
Преподаватель |
|
Манило Л.А. |
Санкт-Петербург
2022
ЗАДАНИЕ
на ИНДИВИДУАЛЬНОЕ ДОМАШНЕЕ ЗАДАНИЕ
Студент: Исаков Артём Олегович |
||
Группа: 7503 |
||
Тема индивидуального домашнего задания: Классификация особо опасных сердечных аритмий |
||
Исходные данные: Отсчёты спектральной плотности мощности коротких НР фрагментов ЭКГ сигнала. Длительность каждого НР фрагмента 2 с, частота дискретизации 360 Гц. Спектр сигнала 0 – 15 Гц, а отсчёты СПМ задаются с шагом 1.05 Гц. Выборка данных включает несколько классов ЭКГ (НР, ЖТ, ФЖ). Требуется для заданных классов сигналов выполнить следующее: 1) провести классификацию данных методом k ближайших соседей; первые 15 объектов использовать как обучающую выборку, вторые 15 объектов использовать для тестирования; 2) построить решающие правила для распознавания трёх классов объектов, используя методы классификации: а) случай независимых признаков (по минимуму расстояния); б) по критерию Фишера (двухклассовая задача); в) по критерию Фишера (многоклассовая задача). 3) для методов п. 2, а и 2, б определить направление W (ориентирует положение разделяющей гиперплоскости); для метода п. 2, в – плоскость собственных векторов W1, W2. 4) записать уравнения разделяющих гиперплоскостей; 5) отобразить распределение объектов заданных классов в направлении W; 6) вычислив для каждого класса среднее и дисперсию проекций объектов на направление W, получить функции плотности вероятности (использовать нормальный закон распределения); 7) построить ROC кривые; провести сравнение эффективности алгоритмов классификации; 8) записать решающие правила и оценить ошибки классификации (точность распознавания). Для объектов трех классов свести задачу к поэтапному решению двухклассовых задач. |
||
Предполагаемый объем индивидуального домашнего задания: Не менее 10 страниц (обязательны разделы «Содержание», «Метод k ближайших соседей», «Метод главных компонент», «Метод классификации по минимуму расстояний», «Метод классификации по критерию Фишера, «Приложения»).
|
||
Дата выдачи задания: 28.10.2022 |
||
Дата сдачи реферата: 28.10.2022 |
||
Дата защиты реферата: 22.11.2022 |
||
|
||
Студент |
|
Исаков А.О. |
Преподаватель |
|
Манило Л.А. |
Содержание
1 |
Метод k ближайших соседей |
5 |
2 |
Метод главных компонент |
10 |
3 |
Метод классификации по минимуму расстояний |
11 |
4 |
Метод классификации по критерию Фишера |
16 |
4.1 |
Двухклассовая задача |
16 |
4.2 |
Многоклассовая задача |
20 |
5 |
Сравнение методов |
24 |
|
Заключение |
26 |
|
Приложение А. Программный код (MATLAB) |
27 |
1 Метод k ближайших соседей
В работе используется два варианта метода k ближайших соседей. Обучение модели состоит в том, чтобы сохранить в памяти некоторую базу данных признаков и присущих им меток класса. Классификация подразумевает сличение нового объекта с полученной в предыдущем шаге базой записей. Есть два варианта классификации – первый подразумевает поиск k ближайших соседей к классифицируемому объекту безотносительно их удаленности от него, т.е. веса близлежащих и наиболее удаленных соседей будут равны, в альтернативном методе мы присваиваем каждому из соседей веса обратно пропорциональные квадрату расстояния между соседом и классифицируемым объектом.
Для каждого варианта строится зависимость точности от числа ближайших соседей. Точность – это доля правильно распознанных классов. Показывает возможность алгоритма правильно распознавать классы. Расчет точности производится по формуле (1). Количество соседей изменяется от 3 до 9. По заданию необходимо было сформировать тестовую и обучающую выборки согласно следующему правилу: отобрать первые 15 объектов каждого класса в обучающую выбору, а вторые 15 объектов – в тестовую.
Оценка точности классификации:
|
(1) |
где – число объектов i-го класса, отнесенных к классу j; – число верно распознанных объектов i-го класса; – число объектов класса i.
В таблице 1 представлен желаемый результат классификации.
Таблица 1 – Матрица результатов классификации
Истинный класс, i |
Число объектов |
Результат распознавания (класс), j |
||
1 |
2 |
3 |
||
1 |
|
|
|
|
2 |
|
|
|
|
3 |
|
|
|
|
В таблице 1 представлены результаты методом k ближайших соседей для количества соседей от 3 до 9 соответственно при равных весах дистанции.
Таблица 1 – Результаты классификации методом k-ближайших при равных весах соседей
k |
Истинный класс |
Число объектов |
Результат распознавания (класс) |
Точность |
||
1 |
2 |
3 |
||||
3 |
НР |
15 |
15 |
0 |
0 |
0,89 |
ЖТ |
15 |
4 |
11 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
4 |
НР |
15 |
15 |
0 |
0 |
0,80 |
ЖТ |
15 |
8 |
7 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
5 |
НР |
15 |
15 |
0 |
0 |
0,87 |
ЖТ |
15 |
6 |
9 |
0 |
||
ФЖ |
15 |
0 |
0 |
15 |
||
6 |
НР |
15 |
15 |
0 |
0 |
0,80 |
ЖТ |
15 |
8 |
7 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
7 |
НР |
15 |
15 |
0 |
0 |
0,87 |
ЖТ |
15 |
6 |
9 |
0 |
||
ФЖ |
15 |
0 |
0 |
15 |
||
8 |
НР |
15 |
15 |
0 |
0 |
0,82 |
ЖТ |
15 |
7 |
8 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
9 |
НР |
15 |
15 |
0 |
0 |
0,93 |
ЖТ |
15 |
2 |
13 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
|
|
|
|
|
|
|
В таблице 2 представлены результаты взвешенным методом k ближайших соседей для количества соседей от 3 до 9 соответственно.
Таблица 2 – Результаты классификации методом взвешенных k-ближайших соседей
k |
Истинный класс |
Число объектов |
Результат распознавания (класс) |
Точность |
||
1 |
2 |
3 |
||||
3 |
НР |
15 |
15 |
0 |
0 |
0,87 |
ЖТ |
15 |
5 |
10 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
4 |
НР |
15 |
15 |
0 |
0 |
0,87 |
ЖТ |
15 |
5 |
10 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
5 |
НР |
15 |
15 |
0 |
0 |
0,87 |
ЖТ |
15 |
6 |
9 |
0 |
||
ФЖ |
15 |
0 |
0 |
15 |
||
6 |
НР |
15 |
15 |
0 |
0 |
0,87 |
ЖТ |
15 |
5 |
10 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
7 |
НР |
15 |
15 |
0 |
0 |
0,89 |
ЖТ |
15 |
5 |
10 |
0 |
||
ФЖ |
15 |
0 |
0 |
15 |
||
8 |
НР |
15 |
15 |
0 |
0 |
0,84 |
ЖТ |
15 |
6 |
9 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
9 |
НР |
15 |
15 |
0 |
0 |
0,84 |
ЖТ |
15 |
6 |
9 |
0 |
||
ФЖ |
15 |
0 |
1 |
14 |
||
|
|
|
|
|
|
|
На рисунке 1 и 2 представлены графики зависимости общей точности от количества ближайших соседей для обоих вариантов метода.
Рисунок 1 – График зависимости точности от числа соседей для равных весов дистанций
Рисунок 2 – График зависимости точности от числа соседей для взвешенного метода
Вывод: наибольшую точность классификации показал метод k ближайших соседей с равными весами дистанции, . Однако, его график зависимости точности от числа соседей весьма хаотичен. При использовании взвешенного метода k ближайших соседей наибольшая точность достигнута при k = 7, . Можно заметить, что при разных значения k взвешенный вариант дает более стабильные показатели точности, впрочем, максимальная точность оказалась ниже.