- •4.1. Синтез байесовских решающих функций
- •4.2. Непараметрические оценки решающих функций
- •4.3. Непараметрические алгоритмы распознавания образов коллективного типа
- •4.4. Синтез и анализ непараметрического решающего правила, основанного на оценках плотностей вероятности
- •4.5. Частотные алгоритмы распознавания образов в пространстве дискретных признаков
- •4.6. Непараметрический алгоритм классификации, основанный на частотном методе распознавания образов
- •4.7. Многоуровневые системы распознавания образов
- •4.8. Непараметрические алгоритмы распознавания образов с учётом взаимосвязи между признаками
- •4.9. Нелинейные непараметрические коллективы решающих правил в задачах распознавания образов
- •4.11. Непараметрические алгоритмы распознавания образов, основанные на рандомизированном методе их идентификации
- •4.12. Непараметрические алгоритмы классификации множеств случайных величин
- •Литература
- •Дополнительная литература
- •Контрольные вопросы
- •Контрольные упражнения
Контрольные упражнения
Упражнение 4.1. (к разделам 4.1 - 4.4., 4.8) Разработать программное обеспечение и исследовать методом статистического моделирования свойства непараметрических алгоритмов распознавания образов отражённых в параграфах 4.1. – 4.4.
При использовании в решающих правилах оценок разделяющих поверхностей (4.4), (4.9), (4.10) для решения многоальтернативных задач , необходимо пользоваться методом дихотомии.
Пусть имеется выборка статистически независимых наблюдений случайной величины , распределённых с неизвестными плотностями вероятности в классах , где – «указания учителя» о принадлежности ситуации к тому либо иному классу .
При решении двухальтернативной задачи распознавания образов в - мерном пространстве признаков законы распределения признаков в области первого класса можно формировать в соответствии с датчиками случайных величин
,
, ,
где параметры распределений , , ; среднеквадратическое отклонение ; - случайная величина с равномерным законом распределения; - множество нечётных чисел меньших .
Признаки второго класса можно генерировать с нормальным законом
, ,
при , , .
При решении многальтернативной задачи можно использовать модификации выше приведённых датчиков случайных величин.
Объём исходной обучающей выборки , где – количество наблюдений объектов соответствующего класса.
Начальные условия для генерации выборки и обработки данных задаёт пользователь:
-
объёмы выборок для каждого -го класса ();
-
среднеквадратические отклонения для каждого класса ();
-
параметр распределений (общий для всех классов );
-
выбор вида ядерных функций (ступенька, парабола, треугольник).
Результатом выполнения контрольного упражнения является:
-
график исходной обучающей выборки до применения алгоритмов распознавания образов;
-
график зависимости ошибки аппроксимации от коэффициента размытости;
-
результаты применения алгоритмов распознавания образов для контрольных выборок.
Распределение вариантов задания. Студенты разбиваются на группы в соответствии с количеством классов (2, 3, 4, 5, 6) и количеством признаков (2, 3, 4, 5, 6). Математические ожидания классов подбираются студентом самостоятельно по согласованию с преподавателем.
Упражнение 4.2. (к разделам 4.5 - 4.6.). Используя датчики случайных величин, представленных в упражнении 4.1, сформировать обучающую выборку (например, рис. 4.14). Для получения наблюдений с дискретными признаками, округлить полученные значения признаков до целых. В результате получим выборку, представленную на рис. 4.15. Необходимо, используя алгоритмы классификации дискретных признаков (разделы 4.5, 4.6), разработать программное обеспечение для исследования зависимости их показателей эффективности от объёма обучающей выборки , количества признаков и классов . Методика распределения вариантов между студентами аналогична упражнению 4.1.
Рис. 4.14. Выборка непрерывных наблюдений |
|
Рис. 4.15. Выборка дискретных наблюдений |
Упражнение 4.3. (к разделам 4.7, 4.9). В условиях упражнения 4.1 исследовать методом статистического моделирования свойства многоуровневых систем (4.24) и нелинейных непараметрических коллективов решающих правил (4.29) в задачах распознавания образов. Сравнить их показатели эффективности с традиционным непараметрическим классификатором, основанном на оценке плотности вероятности типа Розенблатта-Парзена.
Задание 4.3.1. Разработать программное обеспечение для исследования зависимости показателей эффективности многоуровневых систем распознавания образов от объема обучающей выборки , размерности признаков классифицируемых объектов и количества уровней структуры .
Задание 4.3.2. Выполнить требования задания 4.3.1 для =(4, 6, 8, 10), = (50, 100, 200, 300, 500) и количества уровней структуры . На каждом уровне структуры используются непараметрическое решающее правило классификации в пространстве признаков .
Задание 4.3.3. Выполнить требования задания 4.3.1 для =20, = 1000 и количества уровней структуры (2, 4, 5, 10).
Задание 4.3.4. Разработать программное обеспечение для исследования зависимости показателей эффективности нелинейных непараметрических коллективов решающих правил от объема обучающей выборки , размерности признаков классифицируемых объектов и количества частных решающих правил .
Задание 4.3.5. Выполнить требования задания 4.3.4 для =(4, 6, 8, 10), = (50, 100, 200, 300, 500) и количество частных решающих правил . Каждое частное решающее правило строится в пространстве признаков .
Задание 4.3.6. Выполнить требования задания 4.3.4 для =20, = 1000 и количество частных решающих правил (2, 4, 5, 10).