- •Оглавление
- •Постановка задачи
- •Глава 1. «Компонентный анализ»
- •§1. «Проверка гипотезы: сколько факторов следует выделять?»
- •§2. «Интерпретация факторов (главных компонент)»
- •§3. «Построение диаграммы рассеивания»
- •§4. «Построение уравнения регрессии на главных компонентах»
- •Глава 2. «Кластерный анализ»
- •§1. «Построение и анализ дендрограмм»
- •§2. «Использование метода k-средних для классификации объектов»
- •§3. «Создание таблицы «состав кластеров»
- •§4. «Описание кластеров с помощью графических средств»
- •Глава3. «Дискриминантный анализ»
- •§1. «Уточнение результатов классификации»
- •§2. «Построение дискриминантной функции с помощью включения всех переменных»
- •2.1. Исследование качества классификации
- •2.2. Построение дискриминантной функции
- •2.3. Графический анализ результатов классификации
- •§3. «Построение дискриминантной функции с помощью пошагового алгоритма»
- •Заключение
- •Список литературы
- •Приложения
§4. «Построение уравнения регрессии на главных компонентах»
Это уравнение строится по данным вектора значений результативного показателя yi и матрицы значений нормированных главных компонент. Матрица нормированных значений главных компонент определяется по формуле: , где X* – матрица нормированных значений исходных показателей размерности 44×5, а А – матрица факторных нагрузок размерности 5×5, воспользовавшись пакетом Excel и командой Описательные из блока команд Описательные статистики пакета SPSS, с помощью которой можно провести Z-стандартизацию для отобранных переменных. Результаты представим в Таблице 3.
Таблица 3 «Нормированные значения главных компонент Zi и
результирующих переменныхYi»
Y1 |
Y2 |
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
27240 |
35007 |
-0,748 |
0,316 |
-0,528 |
0,560 |
1,122 |
47888 |
530587 |
-0,302 |
-0,051 |
-0,589 |
-0,755 |
0,248 |
85651 |
196285 |
0,246 |
-0,171 |
-0,567 |
-1,552 |
-0,784 |
58857 |
1132825 |
0,037 |
0,169 |
-0,161 |
-2,813 |
1,488 |
11114 |
38375 |
-1,027 |
0,318 |
-0,379 |
0,192 |
0,147 |
83633 |
331093 |
-0,943 |
0,099 |
-1,020 |
0,234 |
0,364 |
19929 |
3458 |
-0,919 |
-0,039 |
-0,333 |
0,241 |
0,694 |
38247 |
90163 |
-0,771 |
-0,575 |
-0,436 |
-0,374 |
-1,733 |
35991 |
254169 |
-0,533 |
-0,424 |
-0,446 |
0,382 |
0,983 |
67514 |
220309 |
-0,198 |
0,279 |
-0,307 |
-0,535 |
-0,291 |
61814 |
488633 |
-0,450 |
0,421 |
-0,218 |
0,043 |
-0,689 |
108360 |
904021 |
-0,651 |
-1,484 |
0,421 |
-0,734 |
-0,806 |
66002 |
589292 |
-0,337 |
-2,019 |
3,449 |
0,435 |
-1,025 |
55482 |
69157 |
-0,649 |
0,415 |
-0,931 |
0,459 |
-0,399 |
193246 |
1247142 |
-0,025 |
0,187 |
-0,895 |
-0,955 |
-0,197 |
37001 |
378157 |
-1,094 |
0,334 |
-0,004 |
-0,284 |
-0,090 |
12878 |
23229 |
-1,176 |
-0,245 |
-0,553 |
-0,202 |
-0,518 |
41312 |
62264 |
-0,642 |
0,616 |
1,030 |
-0,574 |
-0,215 |
358014 |
579516 |
1,840 |
-0,238 |
-1,388 |
1,602 |
-3,365 |
78507 |
100145 |
0,671 |
-0,741 |
-1,415 |
2,277 |
2,952 |
72847 |
225420 |
0,549 |
-0,322 |
-0,521 |
1,017 |
1,568 |
166077 |
742020 |
1,412 |
0,029 |
-1,326 |
-0,563 |
-0,215 |
139743 |
169248 |
1,531 |
-1,748 |
0,775 |
1,484 |
0,503 |
267990 |
2240308 |
2,120 |
-1,132 |
0,318 |
0,897 |
0,281 |
41309 |
86494 |
-0,279 |
0,458 |
1,720 |
1,120 |
-0,506 |
41572 |
46245 |
-0,694 |
1,715 |
1,044 |
0,775 |
0,791 |
134469 |
345587 |
1,278 |
2,035 |
1,370 |
-0,906 |
1,059 |
88756 |
545639 |
-0,176 |
-1,276 |
0,638 |
1,007 |
-0,103 |
46675 |
34256 |
-0,603 |
-0,049 |
-0,261 |
-0,494 |
0,253 |
109974 |
1053947 |
2,742 |
0,940 |
0,468 |
-1,917 |
0,573 |
62118 |
197434 |
0,230 |
-0,546 |
-0,919 |
0,563 |
-0,259 |
33358 |
40217 |
-1,083 |
-0,398 |
-0,818 |
-0,142 |
-0,114 |
138108 |
2557635 |
1,839 |
0,257 |
-1,517 |
-0,585 |
-1,120 |
13078 |
31320 |
-1,343 |
-0,445 |
-0,829 |
-0,479 |
-0,378 |
43641 |
79264 |
-0,168 |
3,283 |
1,002 |
1,276 |
-1,358 |
39794 |
48549 |
-0,911 |
0,847 |
0,518 |
0,537 |
0,809 |
246351 |
218085 |
1,294 |
-0,327 |
0,778 |
-0,236 |
0,568 |
105395 |
344609 |
0,535 |
1,787 |
0,766 |
0,523 |
-0,930 |
109434 |
606783 |
0,011 |
1,218 |
-0,241 |
1,455 |
0,559 |
60027 |
489382 |
0,312 |
-0,825 |
0,956 |
0,228 |
0,106 |
77131 |
226204 |
0,218 |
-0,955 |
1,816 |
-1,645 |
0,587 |
351238 |
1117707 |
-0,687 |
-0,227 |
-0,347 |
-0,458 |
0,126 |
138278 |
80716 |
0,621 |
-0,322 |
-0,539 |
-0,861 |
-0,067 |
99700 |
212147 |
-1,075 |
-1,162 |
0,418 |
-0,245 |
-0,619 |
Таблица 4 «Парные коэффициенты корреляции»
Корреляции |
||||||||
|
y1 |
y2 |
z1 |
z2 |
z3 |
z4 |
z5 |
|
y1 |
Корреляция Пирсона |
1 |
,529** |
,588** |
-,144 |
-,117 |
,051 |
-,237 |
Знч.(2-сторон) |
|
,000 |
,000 |
,352 |
,448 |
,742 |
,122 |
|
N |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|
y2 |
Корреляция Пирсона |
,529** |
1 |
,531** |
-,120 |
-,123 |
-,217 |
-,112 |
Знч.(2-сторон) |
,000 |
|
,000 |
,437 |
,425 |
,156 |
,470 |
|
N |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|
z1 |
Корреляция Пирсона |
,588** |
,531** |
1 |
,000 |
,000 |
,000 |
,000 |
Знч.(2-сторон) |
,000 |
,000 |
|
,999 |
,999 |
,999 |
,998 |
|
N |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|
z2 |
Корреляция Пирсона |
-,144 |
-,120 |
,000 |
1 |
,000 |
,001 |
,001 |
Знч.(2-сторон) |
,352 |
,437 |
,999 |
|
,999 |
,997 |
,994 |
|
N |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|
z3 |
Корреляция Пирсона |
-,117 |
-,123 |
,000 |
,000 |
1 |
,000 |
,000 |
Знч.(2-сторон) |
,448 |
,425 |
,999 |
,999 |
|
,999 |
,998 |
|
N |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|
z4 |
Корреляция Пирсона |
,051 |
-,217 |
,000 |
,001 |
,000 |
1 |
-,002 |
Знч.(2-сторон) |
,742 |
,156 |
,999 |
,997 |
,999 |
|
,991 |
|
N |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|
z5 |
Корреляция Пирсона |
-,237 |
-,112 |
,000 |
,001 |
,000 |
-,002 |
1 |
Знч.(2-сторон) |
,122 |
,470 |
,998 |
,994 |
,998 |
,991 |
|
|
N |
44 |
44 |
44 |
44 |
44 |
44 |
44 |
|
**. Корреляция значима на уровне 0.01 (2-сторон.). |
Матрица парных коэффициентов корреляции (Таблица 4) демонстрирует некоррелированность главных компонент и тесноту их связи с результирующими переменными Yi. Для уровня значимости α=0,01 и числа степеней свободы ν=42 tкр=2,698, наблюдаемые значения tz1y1=4,711, tz1y2=4,061 превосходят tкр → парные коэффициенты корреляции ρ значимы, между первой главной компонентой и результирующими показателями y1 и y2 существует средняя положительная взаимосвязь. Можно предположить, что только первая главная компонента войдет в обе регрессионные модели.
Расчет регрессионных уравнений осуществим при помощи метод пошагового исключения переменных.
1) Инвестиции в основной капитал (y1)
Для уровня значимости α=0,06 уравнение регрессии имеет вид:
ŷ1=93537,446+47677,327z1-19199,140z5
(4,867) (-1,960)
Коэффициент детерминации R2=0,402 говорит о том, что 40,2% дисперсии случайной величины y1 (объема инвестиций в основной капитал) обусловлено вариацией двух главных компонент z1 и z5. Соответственно, 59,8% дисперсии y1 определяется остаточными факторами, не рассматриваемыми в данной регрессионной модели.
Fнабл.=13,764, значение F-статистики для уровня значимости α=0,06 и числа степеней свободы ν1=2 и ν2=44-2-1=41 Fкр=3,016. Так как наблюдаемое значение F-статистики больше критического значения, то на уровне значимости α=0,06 уравнение регрессии значимо. Наблюдаемые значения t-статистики приведены под уравнением регрессии, tкр(α, ν)=tкр(0,06, 41)=1,934. Так как наблюдаемые значения t-статистики по модулю больше критического значения, то на уровне значимости α=0,06 оба коэффициента регрессии значимы.
Стандартная ошибка оценки (несмещенная оценка остаточного среднего квадратического отклонения σ) Ŝ=64258,441, относительная ошибка прогноза V=68,70%.
Высокое значение относительной ошибки прогноза (должна не превышать 12-15%) свидетельствует о том, что для анализа взаимосвязи между рассматриваемыми показателями использование построенной нами регрессионной модели на главных компонентах нецелесообразно.
Сравним модель, полученную нами в регрессионном анализе, с моделью, построенной в компонентном анализе. Для уравнения регрессии ŷ1=29911,284+1,750x1-422,261x3, построенного в регрессионном анализе: Fнабл.=15,094, R2=0,424, V=67,40%.
Как видно, свойства уравнения регрессии на главных компонентах несколько хуже по сравнению с моделью, построенной в регрессионном анализе. Кроме того, модель на главных компонентах трудно интерпретируема, так как в нее входит пятая, не интерпретируемая нами компонента, вклад которой в суммарную дисперсию незначителен и составляет 1,960%. Однако, исключив z5 из уравнения регрессии, получаем уравнение со значительно худшими аналитическими свойствами.
Следовательно, в качестве регрессионной модели объема инвестиций в основной капитал следует использовать уравнение регрессии, полученное нами в регрессионном анализе.
2) Иностранные инвестиции в экономику Российской Федерации (y2)
Для уровня значимости α=0,1 уравнение регрессии имеет вид:
ŷ2=432095,941 +291425,140z1-119366,120z4
(4,147) (-1,698)
Коэффициент детерминации R2=0,329 говорит о том, что 32,9% дисперсии случайной величины y2 (объема иностранных инвестиций в экономику РФ) обусловлено вариацией двух главных компонент z1 и z4. Соответственно, 67,1% дисперсии y2 определяется остаточными факторами, не рассматриваемыми в данной регрессионной модели.
Fнабл.=10,040, значение F-статистики для уровня значимости α=0,1 и числа степеней свободы ν1=2 и ν2=44-2-1=41 Fкр=2,437. Так как наблюдаемое значение F-статистики больше критического значения, то на уровне значимости α=0,1 уравнение регрессии значимо. Наблюдаемые значения t-статистики приведены под уравнением регрессии, tкр(α, ν)=tкр(0,1, 41)=1,683. Так как наблюдаемые значения t-статистики по модулю больше критического значения, то на уровне значимости α=0,1 оба коэффициента регрессии значимы.
Стандартная ошибка оценки (несмещенная оценка остаточного среднего квадратического отклонения σ) Ŝ=461047,739, относительная ошибка прогноза V=106,70%.
Высокое значение относительной ошибки прогноза (должна не превышать 12-15%) свидетельствует о том, что построенная нами регрессионной модели на главных компонентах плохо отражает изучаемое явление.
Сравним модель, полученную нами в регрессионном анализе, с моделью, построенной в компонентном анализе. Для уравнения регрессии ŷ2=131311,1+5,072x1-3224,777x3+0,079x5, построенного в регрессионном анализе: Fнабл.=7,676, R2=0,365, V=105,03%.
Как видно, свойства уравнения регрессии на главных компонентах несколько хуже по сравнению с моделью, построенной в регрессионном анализе. Кроме того, модель на главных компонентах трудно интерпретируема, так как в нее входит четвертая, не интерпретируемая нами компонента, вклад которой в суммарную дисперсию незначителен и составляет 9,389%. Однако, исключив z4 из уравнения регрессии, получаем уравнение со значительно худшими аналитическими свойствами.
Следовательно, в качестве регрессионной модели объема инвестиций в основной капитал целесообразнее использовать уравнение регрессии, полученное нами в регрессионном анализе.