- •8.1. Факторный анализ
- •8.1.1. Сущность методов факторного анализа
- •8.1.2. Фундаментальная теорема факторного анализа Тэрстоуна
- •8.1.3. Общий алгоритм и теоретические
- •8.1.4. Метод главных компонент
- •8.1.4.1. Общая математическая модель метода
- •8.1.4.2. Вычислительные процедуры метода главных
- •8.1.4.3. Оценка уровня информативности
- •8.1.4.4. Использование метода главных компонент
- •8.2. Кластерный анализ
- •8.2.1. Общая характеристика методов
- •8.2.2. Меры сходства
- •8.2.3. Иерархический кластерный анализ
- •8.2.4. Метод к-средних
- •8.2.5. Критерии качества классификации
- •8.3. Дискриминантный анализ
- •8.3.1. Основные положения дискриминантного
- •8.3.2. Дискриминантные функции
- •8.3.3. Расчет коэффициентов дискриминантной функции
- •8.3.4. Классификация при наличии двух обучающих выборок
8.1.2. Фундаментальная теорема факторного анализа Тэрстоуна
Изучение факторных воздействий предполагает выявление взаимосвязей характерных признаков. Для многомерных объектов показателями связи являются оценки дисперсии и коэффициенты ковариации, которые обобщаются в матрице ковариаций S (по выборочным данным – матрица X). Когда исходные значения признаков нормированы, т.е. имеем zij = (xij –)/σj, матрица ковариаций, как известно, переходит в матрицу парных корреляций: S = R = 1/n Z'Z.
Симметрическая матрица R имеет собственную систему координат в пространстве Rm, где т – число анализируемых признаков. Допуская преобразования координатной системы в систему пространства латентных факторов, можно записать Zij в виде линейной комбинации новых координат:
Zij=aj1f1i+aj2f2i+... +ajrfri,
или в матричной форме: Z = AF.
Воспользуемся возможностью подстановки в уравнение для R вместо Z произведения матриц AF и получим
R =1/nAF(AF)' =1/nAFF'A'.
Изменив место расположения скаляра 1/n, выделим произведение 1/nFF', результат произведения интерпретируется как матрица корреляций С, определяемая для латентных факторов Fr. После замены 1/nFF’ на С запишем: R = АСА'.
В предположении, что факторы Fr некоррелированы, т.е. С = Е, где Е – единичная матрица, приходим к равенству R = АА'.
Л.Л. Тэрстоуном равенства типа R = АСА' и R = АА' названы фундаментальной факторной теоремой, здесь А – матрица факторного отображения, а ее элементы ajr – величины факторных нагрузок. Суть теоремы – в возможности воспроизведения исходной корреляционной матрицы R через матрицу факторного отображения А. При С = Е связь матричных элементов r и а записывается в виде уравнения rij = аi1aj1 + аi2аj2 + ... + air ajr.
Другими словами, корреляция пары характерных признаков rij опосредуется корреляцией каждого из признаков с некоторыми латентными факторами Fr. Латентные факторы определяют само существование связи i-го и j-го коррелирующих признаков. Если С = Е, латентные факторы неортогональны и матрица корреляций R отображается в А с учетом их взаимодействия:
|
R |
= |
A |
|
C |
|
A' |
|
---|---|---|---|---|---|---|---|---|
. |
Равенства Тэрстоуна допускаются гипотетически. Реально АА' и АСА' будут далеко не всегда в точности воспроизводить R. Это объясняется двумя причинами. Во-первых, в факторном анализе, позволяющем эффективно объяснять общую дисперсию данных, r – число латентных (обобщенных) признаков, как правило, значительно меньшее числа исходных признаков т. И, во-вторых, в матрице А объединяются теоретические оценки факторных нагрузок aij. С учетом различий математических методов и специфичности вычислительных процедур следует допустить, что аij не абсолютно истинны.
Таким образом, можно ожидать, что воспроизведенная из АА' или АСА' матрица корреляций R+ будет отлична от R. Как следствие, на главной диагонали R+ располагаются величины, обычно не равные, а меньшие 1. На практике значения r+ij принимают за общности, т.е. характеристики части дисперсии, поддавшейся объяснению через латентные факторы Fr, а 1–τ+ij – специфичность, т.е. необъясненная часть дисперсии. По степени расхождения R+ и R судят о достаточности числа выделенных латентных факторов и адекватности аналитических выводов.