Дискриминантный анализ

Дискриминантный анализ является разделом многомерного статистического анализа, который включает в себя методы классификации многомерных наблюдений по принципу максимального сходства при наличии обучающих признаков.

Напомним, что в кластерном анализе рассматриваются методы многомерной классификации без обучения. В дискриминантном анализе новые кластеры не образуются, а формулируется правило, по которому объекты подмножества подлежащего классификации относятся к одному из уже существующих (обучающих) подмножеств (классов), на основе сравнения величины дискриминантной функции классифицируемого объекта, рассчитанной по дискриминантным переменным, с некоторой константой дискриминации.

Предположим, что существуют две или более совокупности (группы) и что мы располагаем множеством выборочных наблюдений над ними. Основная задача дискриминантного анализа состоит в построении с помощью этих выборочных наблюдений правила, позволяющего отнести новое наблюдение к одной из совокупностей.

Постановка задачи дискриминантного анализа

Пусть имеется множество M единиц N объектов наблюдения, каждая i–я единица которого описывается совокупностью p значений дискриминантных переменных (признаков) x_ij,(i=1,2,..., N; j = 1,2,..., р). Причем все множество M объектов включает q обучающих подмножеств (q2) M_kразмеромп_k каждое и подмножество M₀объектов подлежащих дискриминации (под дискриминацией понимается различие). Здесь k - номер подмножества (класса), (k = 1,2,..., q).

Требуется установить правило (линейную или нелинейную дискриминантную функцию f(Х)) распределения m-объектов подмножества M₀ по подмножествам M_k.

Наиболее часто используется линейная форма дискриминантной функции, которая представляется в виде скалярного произведения векторов A=(a₁,a₂,…,a_p) дискриминантных множителей и вектора X_i=(x_i_,1,x_i_,2,…,x_i_,_p) дискриминантных переменных: , (6.1)

или .

Здесь _i - транспонированный вектор дискриминантных переменных x_ij - значений j -ых признаков у i –го объекта наблюдения.

Дискриминантный анализ проводится в условиях следующих основных предположений:

множество M объектов разбито на два или более (q 2) подмножеств M_k (класса), которые отличаются от других групп переменными x_ij;
в каждом подмножестве M_k находится, по крайней мере, два объекта (n_k 2), причем все объекты наблюдения множества M должны принадлежать какому либо из подмножеств (классов);

число N объектов наблюдения должно превышать число р дискриминантных переменных (0< р< N-2) не менее чем на две единицы;
линейная независимость между признаками (j), т.е. ни один из признаков не должен быть линейной комбинацией других признаков, в противном случае он не несет новой информации;
нормальный закон распределения дискриминантных переменных x_ij (по признакам).

Если приведенные предположения не удовлетворяются, то ставится вопрос о целесообразности использования дискриминантного анализа для классификации новых наблюдений.

Основными проблемами дискриминантного анализа являются отбор дискриминантных переменных и выбор вида дискриминантной функции. Для получения наилучших различий обучающих подмножеств могут использоваться критерии последовательного отбора переменных [6] или пошаговый дискриминантный анализ. После определения набора дискриминантных переменных решается вопрос о выборе вида дискриминантной функции (линейной или нелинейной).

В качестве дискриминантных переменных могут выступать не только исходные (наблюдаемые) признаки, но и главные компоненты или главные факторы, выделенные в факторном анализе.

Дискриминантный анализ может использоваться и для прогнозирования поведения наблюдаемых единиц статистической совокупности путем сопоставления их с поведением аналогичных объектов обучающих подмножеств.

<<< < Предыдущая 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 1819 / 2719 20 21 22 23 24 25 26 27 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
03.05.2015899.61 Кб13m1244.pdf
#
03.05.20151.08 Mб9m678.pdf
#
03.05.2015354.7 Кб11m840.pdf
#
21.08.201936.85 Кб6maket.docx
#
01.09.2019549.21 Кб11MATH CAD Лабораторные.docx
#
05.12.20182.43 Mб89Met1.doc
#
11.03.2016151.89 Кб16Metodicheskie_ukazania_k_KP_FP (10).docx
#
03.05.20153.73 Mб162Metodichka_po_inzhenernoy_grafike_chast1.doc
#
01.09.201996.26 Кб6Metodichka_po_kursovoy.doc
#
11.03.2016744.96 Кб272metodichka_po_tablichnomu_protsessoru_dlya_magistrov.doc
#
11.03.2016564.06 Кб14Metodol_sots_issl.pdf