Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИДЗ_Лебедь.docx
Скачиваний:
3
Добавлен:
04.09.2023
Размер:
225.78 Кб
Скачать

Классификация по критерию Фишера

Так же, как и для метода по минимуму расстояния, для первого этапа были выбраны классы 'ЖТ+ФЖ' и 'НР', для второго – 'ЖТ' и 'ФЖ'. Сначала были найдены весовые вектора для первых двух этапов:

W1 = [0.17; 0.64; 0.74; 0.02; 0.11; -0.07; -0.02]

W2 = [0.24; -0.09; -0.93; 0.07; -0.04; 0.21; 0.13]

А как вы нашли два весовых вектора?

Были найдены проекции наблюдений двух классов тренировочной выборки и построены гистограммы этих проекций на весовой вектор (рисунок 4).

Как найдены проекции?

Рис.4. – Гистограммы проекций наблюдений на весовые вектора для метода по критерию Фишера

По этим гистограммам были найдены их дисперсии и мат. ожидания (таблица 20).

Таблица 20 – Характеристики нормального распределения по гистограмме проекций для метода по критерию Фишера

Этап

Класс

Мат. ожидание

Дисперсия

1

ЖТ+ФЖ

0.17

0.03

НР

0.03

0.02

2

ЖТ

-0.04

0.01

ФЖ

-0.08

0.01

По значениям были построены нормальные распределения. На рисунке 5 построены эти распределения и также указаны пороги класификации, найденные по точке пересечения гауссиан (0.08 для этапа 1 и -0.06 для этапа 2).

Рис.5. – Нормальные распределения, построенные по гистограммам проекций наблюдений на весовые вектора для метода по критерию Фишера

По ответам модели были рассчитаны точнось, чувствительность и специфичность модели, приведенные в таблице 21.

Как вы их вычисляли? (На первом этапе у вас не одинаковые по размеру выборки двух классов).

Таблица 21 – Характеристики классификатора по критерию Фишера при пороге, найденном по пересечению гауссиан

Этап

Точность, %

Чувствительность, %

Специфичность, %

1

100.00

100.00

100.00

2

96.67

100.00

93.75

Как видно из таблиц, характеристики модели??? по критерию Фишера выше, чем у модели по минимуму расстояния, это показывает метод по критерию Фишера более адекватной моделью.

В результате получены две разделяющие плоскости??? для каждого из этапов:

1) 0.39 * x0 + 0.54 * x1 + 0.32 * x2 - 0.18 * x3 - 0.09 * x4 - 0.56 * x5 + 0.32 * x6 - -0.08 = 0.

2) 0.03 * x0 - 0.13 * x1 - 0.22 * x2 - 0.56 * x3 + 0.08 * x4 + 0.76 * x5 + 0.19 * x6 - -0.08 = 0.

В итоге было сформулировано решающее правило для метода классификации по критерию Фишера:

1) Вычислить значение D1 как разность скалярного произведения вектора наблюдения X и (0.17; 0.64; 0.74; 0.02; 0.11; -0.07; -0.02) и значения порога 0.08.

2) Если D1 меньше 0, то наблюдение принадлежит классу 'НР', иначе перейти к следующему шагу.

3) Вычислить значение D2 как разность скалярного произведения векторов X и (0.24; -0.09; -0.93; 0.07; -0.04; 0.21; 0.13) и значения порога -0.06.

4) Если D2 больше 0, то наблюдение принадлежит классу 'ЖТ', иначе – к классу 'ФЖ'.

Код программы для классификатора по критерию Фишера приведен в приложении Г.

ROC-кривые

По классификаторам по минимуму расстояния и критерию Фишера были построены ROC-кривые, изображенные на рисунке 6.

Рис.6. – ROC-кривые этапов 1 и 2 для методов по минимуму расстояния и по критерию Фишера

В таблице 22 приведены значения площади под кривыми.

Таблица 22 – Значения площади под ROC-кривой

Этап

Метод по минимуму расстояния

Метод по критерию Фишера

1

1.00

1.00

2

0.81

0.99

По значениям площади видно, что классификатор по минимуму расстояния подходит чуть меньше, чем классификатор по критерию Фишера, что объясняется полученными ранее значениями точности, чувствительности и специфичности.

Код программы для построения ROC-кривых приведен в приложении Д.

Вывод

В результате проделанной работы получено, что метод k ближайших соседей взвешенной и обычной версий хорошо выделяет нормальный ритм и патологию в виде фибрилляции желудочков (и там и там 100%), а предвестник этой патологии (желудочковая тахикардия) выделяется чуть хуже (80%). Следовательно, такой классификатор будет либо точно срабатывать на норму и на опасную ситуацию, но хуже давать возможность предсказывать эту опасную ситуацию, что делает его менее адекватным, чем остальные классификаторы.

Метод классификации по минимуму расстояния хорошо отличает норму от предвестника опасной патологии (желудочковой тахикардии) и самой опасной патологии (фибрилляции желудочков), при этом плохо отличает желудочковую тахикардию от фибрилляции желудочков. Слудовательно, данный классификатор может адекватен для работы на начальном этапе распознавания патологии.

Метод классификации по критерию Фишера показывает самые высокие значения точности, чувствительности и специфичности (около 100%) касательно определения каждого из классов на обоих этапах. Следовательно, данный классификатор является наиболее адекватным как для отличия нормы от патологии, так и для определения степени самой патологии.

Соседние файлы в предмете Технологии и системы принятия решений