Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sis_an_pract.doc
Скачиваний:
14
Добавлен:
24.04.2019
Размер:
2.54 Mб
Скачать

Лабораторна робота 14 факторний аналіз. Виконання в пакеті statistica 6.0.

Для прикладу розглянемо факторний аналіз шести річних показників господарської діяльності восьми підприємств. Досліджувані дані занесено в таблицю:

х1

х2

х3

х4

х5

х6

1

47,1

1285,8

458,9

1,9

576

17,3

2

66,6

608,9

237,6

1,0

764

15,6

3

38,6

487,3

181,5

2,7

649

19,4

4

87,0

908,6

364,4

2,0

868

16,9

5

53,8

710,0

205,7

1,4

970

17,8

6

106,0

1023,7

394,9

1,3

521

18,0

7

74,2

743,8

260,1

1,2

493

9,1

8

47,0

1806,8

355,3

0,4

475

10,0

Х2 Х3

х1 - обсяг товарної продукції, млн. грн.;

х2 - втрати від браку, кг;

х3 - середньомісячна оплата праці, грн.;

х4 - загальні простої технологічного устаткування, тис. днів;

х5 - продуктивність праці, тис. грн.;

х6 - енергоозброєність, млн. квт-год./чол.

Головні завдання:

  1. понизити вимірність простору ознак;

  2. виявити внутрішні латентні властивості підприємств.

Відкрити модуль Факторний аналіз за допомогою перемикача модулів.

На екрані з'явиться стартова панель модуля Factor Analysis. В рядку Input File (Файл вхідних даних) вказуємо тип вхідного файла. У цьому модулі використовують такі типи вхідних файлів:

Correlation Matrix - Кореляційна матриця;

Raw Data - Вхідні дані. Це звичайний файл, у якому в рядках записані значення змінних. У рядку Missing Data - Пропущені дані потрібно задати спосіб обробки пропущених значень:

Casewise - Спосіб обробки пропущених випадків полягає в тому, що виключають з обробки всі випадки (рядки, записи), в яких є хоча б одне пропущене значення (для будь-якої змінної). Залишають лише випадки без жодного пропуску.

Pairwise - Парний спосіб виключення пропущених значень ігнорує пропущені значення тільки для пари фіксованих змінних. При такому способі обробки залишається більше випадків, ніж при попередньому. Правда, можуть з'явитись неузгодженості у зв'язку з тим, що різні коефіцієнти можуть бути обчислені по різних випадках, а також з різною кількістю вхідних даних.

Mean Substitution - Підстановка середнього замість пропущених значень.

Відкриємо файл. Для цього використовуємо кнопку Open Data -Відкрити дані.

У вікні Open Data File - вибираємо файл з даними.

Після цього відкриваємо стартову панель модуля Factor Analysis -Факторний аналіз. Вибираємо змінні у відкритому файлі для аналізу за допомогою кнопки Variables - Змінні.

У вікні вибору змінних Select the variables for the factor analysis - Вибрати змінні для факторного аналізу виконуємо вибір. Вибирати змінні можна за допомогою курсору миші, позначаючи назви або номери відповідних змінних. Кнопка Select All - Вибрати все дозволяє вибрати всі змінні одразу.

Використавши Spread - Розкрити, можемо продивитись розширений опис змінних.

Після натиснення у стартовому вікні модуля кнопки ОК починаємо виконання процедури факторного аналізу для вибраних змінних.

На першому кроці обчислюємо кореляційну матрицю (якщо тільки кореляційна матриця не була задана).

Потрібно вибрати метод виділення факторів у вікні Define Method of Factor Extraction. Можливі такі варіанти:

Principal components - Метод головних компонент. Principal factor analysis - група методів, об'єднаних під назвою Аналіз головних (загальних) факторів:

Communalities=multiple R**2 - Загальності дорівнюють квадратові коефіцієнта множинної кореляції.

Iterated communalities (MINRES) - Метод ітераційних залишків (мінімальних залишків);

Centroid method - Центроїдний метод;

Principal axis method - Метод головних осей.

У правій частині вікна потрібно задати Maximum no. of factor -Максимальну кількість факторів, які будуть виділені, та Minimum eigenvalue - Мінімальне власне значення, всі власні значення, менші від заданого, будуть ігноруватися.

Кнопка Cancel повертає до стартового вікна модуля.

Кнопка Rewier corrs/means/SD - Продивитись кореляції/середні/стандартні відхилення відкриває вікно, у якому можна проглянути середнє значення, стандартні відхилення, кореляції, коваріації, побудувати графіки. Наприклад, для обчислення кореляційної матриці для вибраних змінних потрібно натиснути кнопку Correlation. Після обчислення кореляцій повернутися до вікна Define Method of Factor Extraction можна за допомогою кнопки Continue.

За допомогою кнопки Perform multiple regression - Виконати множинну регресію можна виконати множинну регресію без виходу з модуля.

Після вибору методу факторизації (Principal components - Метод головних компонент) і натиснення кнопки ОК з'являється вікно Factor Analysis Results, яке містить таку інформацію:

Number of variables - Кількість аналізованих змінних;

Method - Метод аналізу;

log(10) determination of correlation matrix - Десятковий логарифм визначника кореляційної матриці;

Number of factor extraction - Кількість виділених факторів;

Eigenvalues - Власні значення.

Для компонентного аналізу найважливіше з'ясувати власні значення (характеристичні корені) – відповідна кнопка.

В отриманій таблиці у першому стовпці знаходяться самі характеристичні корені λL, в другому - відсоток загальної дисперсії показників, ідо пояснюють головні компоненти, в третьому - накопичені значення характеристичних коренів, у четвертому - накопичений відсоток загальної дисперсії змінних, що пояснюють головні компоненти.

Після обчислення власних значень простір загальних факторів вважають знайденим, проте самі ці загальні фактори вважають визначеними однозначно по відношенню до обертання осей знайденого простору. За допомогою процедури Factor rotation - Обертання факторів підбирають таку комбінацію загальних факторів, яка дає змістовне тлумачення моделі. Серед запропонованих методів ротації: Varimax; Biquartimax; Quartimax; Equamax. Якщо факторні навантаження в процедурі нормалізують діленням на квадрат загальностей, то використовують нормалізований (normalized) метод, якщо ж використовують початкові (raw) дані, то це означає, що факторні навантаження не піддають нормалізації. Наприклад, Varimax normalized означає, що буде використано метод варімакс із нормалізацією факторних навантажень.

Можна також розглянути і графічне зображення результатів факто-ризації, використавши Plot of loadings, 2D - Двовимірний графік факторних навантажень.

Для перегляду таблиці факторних навантажень використовують кнопку Factor loadings.

Далі аналізують таблицю факторних навантажень (відповідна кнопка). Якщо за величиною факторних навантажень важко дати змістовне тлумачення факторів, то доцільно проводити поворот різними доступними методами та побудову графіка факторних навантажень аж до отримання задовільної моделі.

З таблиці навантажень робимо висновок, що для наших даних високі факторні навантаження по першому фактору мають показники Х4 та X6, по другому - показники Х2, Х3, а по третьому – Х1.

Отже, нами виділено три фактори (знижено вимірність простору ознак з 8 до 3), які описують майже 85 % загальної дисперсії досліджуваних показників.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]