Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
221
Добавлен:
07.03.2015
Размер:
2.69 Mб
Скачать

8.1.4.3. Оценка уровня информативности

и поиск названий для главных компонент

Алгебраическими преобразованиями матрицы исходных данных X выделяют главные компоненты F и устанавливают их пространственное местоположение. Задачи распознавания главных компонент, определения для них названий решают затем субъективно на основе весовых коэффициентов ajr из матрицы отображения А.

Для каждой главной компоненты F множество значений ajr условно разбивается на четыре подмножества с нечеткими границами:

W1 подмножество незначимых весовых коэффициентов;

W2 подмножество значимых весовых коэффициентов;

W3 подмножество значимых весовых коэффициентов, не участвующих в формировании названия главной компоненты;

W2 W3подмножество значимых весовых коэффициентов, участвующих в формировании названия.

Дополнительное выделение подмножества W3 объясняется стремлением к более простой структуре главной компоненты, всегда легче поддающейся интерпретации. На своих границах подмножество W3 имеет критические значения: акр.1максимальное число признаков, объясняющих главную компоненту, aкр.2 минимальное число объясняющих признаков. При тщательном анализе критические границы W3 могут устанавливаться по статистическому критерию t-Стьюдента, как в случае обычной проверки значимости коэффициентов корреляции.

Общий состав множества весовых коэффициентов представлен на рис. 8.10.

Рис. 8.10. Состав множества весовых коэффициентов дляr-й главной компоненты

Подтверждение значимости признаков (Xj или Zj), участвующих в формировании названия главной компоненты, можно получить расчетным путем при определении коэффициента информативности:

.

(8.4)

Набор объясняющих признаков считается удовлетворительным, если значения Ки лежат в пределах 0,750,95. Рассмотрим пример гипотетических данных (табл.8.1).

Таблица 8.1. Значения коэффициентов отображения

Исходные элементарные признаки

Главные компоненты

Xj

F1

F2

X1 – уровень выработки на одного среднегодового работника

a11=0,9

a12=0,1

X2 – уровень фондоотдачи

a21=0,8

a22=0,4

X3 – размер оборотных производственных средств

a31=0,1

a32=0,8

X4 – размер затрат на выпуск единицы товарной продукции

a41=0,8

a42=0,3

X5 – численность промышленно-производственного персонала

a51=0,3

a52=0,7

X6 – рентабельность продукции

a61=0,7

a62=0,2

X7 – уровень энерговооруженности труда

a71=0,2

a72=0,6

Выделим для первой главной компоненты F1 подмножества

весовых коэффициентов на основе простой визуальной оценки аналитических результатов:

; ;

; .

Пограничные значения для подмножества W 3 будут: акр1 = 0,2 и aкр.2 = 0,7. В решающее подмножество W2 W 3 вошли элементарные признаки: Х1, Х2, Х4, Х6. Все они представляют характеристики эффективности производственной деятельности. Назовем эффективность производства F1. Значение коэффициента информативности дает основания утверждать, что состав подмножества W2 W3 для главной компоненты F1 достаточно надежен:

,

т.е. значениями признаков Х1, Х2, Х4, Х6 состав главной компоненты F1 определяется более чем на 94 %.

Для второй главной компоненты F2:

; ;

; и .

Название главной компоненты F2 определяется наличием в ее структуре значимых признаков Х3, Х5, Х7, т.е. F2это размер производственных ресурсов. Коэффициент информативности подтверждает существенный состав и этой главной компоненты:

.

Отбор значащих элементарных признаков при определении названия главной компоненты производится, прежде всего, по абсолютной величине весового коэффициента ajr , знак коэффициента приобретает значение в последующем при логическом объяснении состава и установлении его непротиворечивости названию главной компоненты.

Обратимся к примеру 8.1. В составе первой главной компоненты все исходные признаки значимы, наиболее существенно влияние признака Х2 (рентабельность производства), корректное название для F1 – «эффективность производства». Во второй главной компоненте значением весового коэффициента выделяется признак Х3 (уровень фондоотдачи), он на 93% определяет состав F2, назовем компоненту так: «эффективность использования основных производственных средств». Третья главная компонента в анализе может не рассматриваться. Если первые две главные компоненты объясняют 78,5 % общей вариации Х1, Х2, Х3, то F3только 10,9 %.

Таким образом, для выводов при минимальной потере информативности остаются:

и .

Главные компоненты, в свою очередь, определяют значения элементарных признаков исходной совокупности данных. Вариация признака Х1 в большей мере определяется вариацией F1, т.е. эффективность использования живого труда обусловливается общей эффективностью производства, или общей эффективной организацией производства. То же касается и рентабельности производства Х2, которая также в основном определяется колебаниями F1. Значения третьего признака Х3 находятся под влиянием F1 и F2. В общем правомерна аналитическая запись:

Z1 =0,776F1; Z2 = 0,904F2; Z3 =0,616F1 + 0,902F2.

Приведенный условный пример демонстрирует вычислительные процедуры метода главных компонент и построен на матрице исходных данных малой размерности. Дефицит информации вызывает необходимость определенных допущений при интерпретации аналитических результатов. Однако общий ход рассуждений соответствует действительности и остается для исследователя показательным.

Обратим внимание на знаки весовых коэффициентов ajr,они могут серьезно затруднять выводы. Так, видно, что вариация признака Х3 находится под положительным влиянием главных компонент F1, F2 и отрицательным F3. При условии существенной значимости F3 следовало бы объяснить наличие отрицательной связи и подтвердить соответствие структуры названию главной компоненты. Одновременно решается вопрос соответствия результатов алгебраических преобразований логике экономических выводов.

Нелогичность знаков весовых коэффициентов, как и нечеткая структура главных компонент, когда все весовые коэффициенты имеют близкие по величине значения, становится причиной слабой интерпретируемости или даже неинтерпретируемости главных компонент. Классически эта проблема решается удалением из анализа малозначащих главных компонент, объясняющих незначительную долю вариации исходных признаков (т.е. имеющих малое λr, часто λr<1), или вращением пространства главных компонент.

Соседние файлы в папке Тер вер и мат стат