Обработка данных в среде MATLAB
.pdfдачу можно решить с помощью следующей программы (использовано значение коэффициента коррекции 0.1).
clear c=0.1
A=load ('class_1.txt')
B=load('class_2.txt')
n=size(A) %оператор возвращает вектор, 1-я компонента
%которого – число строк, а 2-я – число столбцов nRows=n(1) % определение числа строк nColomns=n(2) % определение числа столбцов
for i=1:nRows % присоединение к матрицам А и В единичных
%столбцов
A(i, nColomns+1)=1
B(i, nColomns+1)=1
end |
|
|
|
|
BB=B*(-1) |
% умножение матрицы В на -1 |
|||
y=[A;BB] % |
объединение матриц в одну общую матрицу данных |
|||
w=[1 1 1 1] |
% начальное значение весового вектора |
|||
cont=1 % начальное значение |
счетчика |
|||
while cont |
% |
пока cont не |
станет равным нулю |
|
for i=1:2*nRows |
|
|
||
proekc(i)=y(i,:)*w' |
% |
вычисление проекций матрицы |
||
% данных на |
весовой вектор |
|
|
|
|
if |
proekc(i)<0 |
|
|
|
|
w=w+c*y(i,:) |
% |
изменение весового вектора |
end
end
for i=1:2*nRows
proekc(i)=y(i,:)*w' % вычисление проекций матрицы
%данных на полученный w end
if min(proekc)>=0 % если все проекции положительны cont=0 % значение счетчика, при котором прекращается
%выполнение цикла while
end end
Задание
1.Провести анализ данных с помощью непараметрического метода классификации по алгоритму обучения с постоянным коэффициентом коррекции ошибок.
2.Найти допустимый весовой вектор, при котором ошибки классификации отсутствуют.
3.Сформулировать алгоритм классификации и оценить получаемые ошибки.
32
Порядок выполнения работы
1.Для двух массивов g1 и g2 c помощью метода главных компонент найти две первые главные компоненты объединенной матрицы данных. Создав переменную группировки g в пространстве полученных компонент построить диаграмму рассеяния gscatter. Сделать вывод относительно линейной разделимости классов.
2.Использовать процедуру последовательного обучения с коррекцией ошибок (алгоритм с постоянным коэффициентом С = 1). В качестве первого приближения весового вектора использовать нормализованный вектор разности средних значений двух классов.
3.По результатам обучения на полученный весовой вектор спроектировать оба класса и построить их гистограммы. Составить алгоритм распознавания заболеваний. Проверить значения ошибок классификации.
Содержание отчета
1.Название, цель и задачи работы.
2.Тексты программ и изображения графических окон, которые требовалось сохранять в ходе выполнения работы.
3.Объяснение полученных результатов и выводы.
g1 |
|
|
g2 |
|
|
0.7 |
0.3 |
1.2; |
0.4 |
0.2 |
0.8; |
0.5 |
0.7 |
1.0; |
0.2 |
0.2 |
0.7; |
0.4 |
1.0 |
0.4; |
0.9 |
0.3 |
0.5; |
0.7 |
0.7 |
1.0; |
0.8 |
0.3 |
0.6; |
0.6 |
0.6 |
1.5; |
0.5 |
0.6 |
0.4; |
0.6 |
0.6 |
1.2; |
0.6 |
0.5 |
0.7; |
0.6 |
0.5 |
1.0; |
0.4 |
0.4 |
1.2; |
0.4 |
0.9 |
0.6; |
0.6 |
0.3 |
1.0; |
0.5 |
0.6 |
1.1; |
0.3 |
0.2 |
0.6; |
0.8 |
0.3 |
1.2 |
0.5 |
0.5 |
0.8 |
32
Список рекомендуемой литературы
Айвазян С. А., Бежаева З. И., Староверов О. В. Классификация многомерных наблюдений. М.: Статистика, 1974.
Ануфриев И. Е. Самоучитель MATLAB 5.3/6.x. СПб.: БХВ-Петербург,
2004.
Дуда Р., Харт П. Распознавание образов и анализ сцен / Пер. с англ. М.:
Мир, 1976.
Дьяконов В. П. MATLAB 6: Учеб. курс. СПб.: Питер, 2001.
Дюк В., Эмануэль В. Информационные технологии в медико-биоло- гических исследованиях. СПб.: Питер, 2003.
Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Ин-та математики, 1999.
Компьютерные технологии в медико-биологических исследованиях: Методические указания к лабораторным работам / Сост.: А. Н. Калиниченко. СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 2006.
Нильсон Н. Обучающиеся машины / Пер. с англ. М.: Мир, 1967.
Рангайян Р. М. Анализ биомедицинских сигналов. Практический подход / Пер. с англ. А. Н. Калиниченко под ред. А. П. Немирко. М.: Физматлит, 2007.
Ту Дж., Гонсалес Р. Принципы распознавания образов / Пер. с англ. под ред. Ю. И. Журавлева. М.: Мир, 1978.
33
|
Содержание |
|
1. |
Представление данных ....................................................................................... |
3 |
2. |
Сравнение одномерных данных ........................................................................ |
8 |
3. |
Сравнение двумерных данных......................................................................... |
13 |
4. |
Метод главных компонент (приведение данных к двумерному виду)........ |
15 |
5. |
Метод линейной дискриминантной функции Фишера (приведение |
|
|
данных к одномерному виду)........................................................................... |
21 |
6. |
Автоматическая классификация ...................................................................... |
24 |
7. |
Непараметрические методы классификации.................................................. |
29 |
Список рекомендуемой литературы.................................................................... |
33 |
34
Редактор Н. В. Лукина
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Подписано в печать 05.06.13. Формат 60×84 1/16. Бумага офсетная. Печать офсетная. Печ. л. 2,25.
Гарнитура «Times New Roman». Тираж 65 экз. Заказ .
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Издательство СПбГЭТУ «ЛЭТИ» 197376, С.-Петербург, ул. Проф. Попова, 5
35