Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный университет биоресурсов и природопользования

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

sis_an_pract.doc

Скачиваний:

Добавлен:

24.04.2019

Размер:

2.54 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1212

Лабораторна робота 14 факторний аналіз. Виконання в пакеті statistica 6.0.

Для прикладу розглянемо факторний аналіз шести річних показників господарської діяльності восьми підприємств. Досліджувані дані занесено в таблицю:

№	х₁	х₂	х₃	х₄	х₅	х₆
1	47,1	1285,8	458,9	1,9	576	17,3
2	66,6	608,9	237,6	1,0	764	15,6
3	38,6	487,3	181,5	2,7	649	19,4
4	87,0	908,6	364,4	2,0	868	16,9
5	53,8	710,0	205,7	1,4	970	17,8
6	106,0	1023,7	394,9	1,3	521	18,0
7	74,2	743,8	260,1	1,2	493	9,1
8	47,0	1806,8	355,3	0,4	475	10,0

Х₂Х₃

х₁ - обсяг товарної продукції, млн. грн.;

х₂ - втрати від браку, кг;

х₃ - середньомісячна оплата праці, грн.;

х₄ - загальні простої технологічного устаткування, тис. днів;

х₅ - продуктивність праці, тис. грн.;

х₆ - енергоозброєність, млн. квт-год./чол.

Головні завдання:

понизити вимірність простору ознак;
виявити внутрішні латентні властивості підприємств.

Відкрити модуль Факторний аналіз за допомогою перемикача модулів.

На екрані з'явиться стартова панель модуля Factor Analysis. В рядку Input File (Файл вхідних даних) вказуємо тип вхідного файла. У цьому модулі використовують такі типи вхідних файлів:

Correlation Matrix - Кореляційна матриця;

Raw Data - Вхідні дані. Це звичайний файл, у якому в рядках записані значення змінних. У рядку Missing Data - Пропущені дані потрібно задати спосіб обробки пропущених значень:

Casewise - Спосіб обробки пропущених випадків полягає в тому, що виключають з обробки всі випадки (рядки, записи), в яких є хоча б одне пропущене значення (для будь-якої змінної). Залишають лише випадки без жодного пропуску.

Pairwise - Парний спосіб виключення пропущених значень ігнорує пропущені значення тільки для пари фіксованих змінних. При такому способі обробки залишається більше випадків, ніж при попередньому. Правда, можуть з'явитись неузгодженості у зв'язку з тим, що різні коефіцієнти можуть бути обчислені по різних випадках, а також з різною кількістю вхідних даних.

Mean Substitution - Підстановка середнього замість пропущених значень.

Відкриємо файл. Для цього використовуємо кнопку Open Data -Відкрити дані.

У вікні Open Data File - вибираємо файл з даними.

Після цього відкриваємо стартову панель модуля Factor Analysis -Факторний аналіз. Вибираємо змінні у відкритому файлі для аналізу за допомогою кнопки Variables - Змінні.

У вікні вибору змінних Select the variables for the factor analysis - Вибрати змінні для факторного аналізу виконуємо вибір. Вибирати змінні можна за допомогою курсору миші, позначаючи назви або номери відповідних змінних. Кнопка Select All - Вибрати все дозволяє вибрати всі змінні одразу.

Використавши Spread - Розкрити, можемо продивитись розширений опис змінних.

Після натиснення у стартовому вікні модуля кнопки ОК починаємо виконання процедури факторного аналізу для вибраних змінних.

На першому кроці обчислюємо кореляційну матрицю (якщо тільки кореляційна матриця не була задана).

Потрібно вибрати метод виділення факторів у вікні Define Method of Factor Extraction. Можливі такі варіанти:

Principal components - Метод головних компонент. Principal factor analysis - група методів, об'єднаних під назвою Аналіз головних (загальних) факторів:

Communalities=multiple R**2 - Загальності дорівнюють квадратові коефіцієнта множинної кореляції.

Iterated communalities (MINRES) - Метод ітераційних залишків (мінімальних залишків);

Centroid method - Центроїдний метод;

Principal axis method - Метод головних осей.

У правій частині вікна потрібно задати Maximum no. of factor -Максимальну кількість факторів, які будуть виділені, та Minimum eigenvalue - Мінімальне власне значення, всі власні значення, менші від заданого, будуть ігноруватися.

Кнопка Cancel повертає до стартового вікна модуля.

Кнопка Rewier corrs/means/SD - Продивитись кореляції/середні/стандартні відхилення відкриває вікно, у якому можна проглянути середнє значення, стандартні відхилення, кореляції, коваріації, побудувати графіки. Наприклад, для обчислення кореляційної матриці для вибраних змінних потрібно натиснути кнопку Correlation. Після обчислення кореляцій повернутися до вікна Define Method of Factor Extraction можна за допомогою кнопки Continue.

За допомогою кнопки Perform multiple regression - Виконати множинну регресію можна виконати множинну регресію без виходу з модуля.

Після вибору методу факторизації (Principal components - Метод головних компонент) і натиснення кнопки ОК з'являється вікно Factor Analysis Results, яке містить таку інформацію:

Number of variables - Кількість аналізованих змінних;

Method - Метод аналізу;

log(10) determination of correlation matrix - Десятковий логарифм визначника кореляційної матриці;

Number of factor extraction - Кількість виділених факторів;

Eigenvalues - Власні значення.

Для компонентного аналізу найважливіше з'ясувати власні значення (характеристичні корені) – відповідна кнопка.

В отриманій таблиці у першому стовпці знаходяться самі характеристичні корені λ_L, в другому - відсоток загальної дисперсії показників, ідо пояснюють головні компоненти, в третьому - накопичені значення характеристичних коренів, у четвертому - накопичений відсоток загальної дисперсії змінних, що пояснюють головні компоненти.

Після обчислення власних значень простір загальних факторів вважають знайденим, проте самі ці загальні фактори вважають визначеними однозначно по відношенню до обертання осей знайденого простору. За допомогою процедури Factor rotation - Обертання факторів підбирають таку комбінацію загальних факторів, яка дає змістовне тлумачення моделі. Серед запропонованих методів ротації: Varimax; Biquartimax; Quartimax; Equamax. Якщо факторні навантаження в процедурі нормалізують діленням на квадрат загальностей, то використовують нормалізований (normalized) метод, якщо ж використовують початкові (raw) дані, то це означає, що факторні навантаження не піддають нормалізації. Наприклад, Varimax normalized означає, що буде використано метод варімакс із нормалізацією факторних навантажень.

Можна також розглянути і графічне зображення результатів факто-ризації, використавши Plot of loadings, 2D - Двовимірний графік факторних навантажень.

Для перегляду таблиці факторних навантажень використовують кнопку Factor loadings.

Далі аналізують таблицю факторних навантажень (відповідна кнопка). Якщо за величиною факторних навантажень важко дати змістовне тлумачення факторів, то доцільно проводити поворот різними доступними методами та побудову графіка факторних навантажень аж до отримання задовільної моделі.

З таблиці навантажень робимо висновок, що для наших даних високі факторні навантаження по першому фактору мають показники Х₄ та X₆, по другому - показники Х₂, Х₃, а по третьому – Х₁.

Отже, нами виділено три фактори (знижено вимірність простору ознак з 8 до 3), які описують майже 85 % загальної дисперсії досліджуваних показників.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1212

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.201568.72 Кб9samostiyne_opratsyuvannya_Gorodenko-3.docx
#
01.05.20158.52 Mб439sherbak-etc-1996-zool_bezhreb-vol2.pdf
#
01.05.2015229.38 Кб6shpory_org_bukh_ucheta.doc
#
01.05.2015165.38 Кб4Shpory_po_org_i_upravl_1.doc
#
01.05.2015308.23 Кб21shpory_Stepanov.docx
#
24.04.20192.54 Mб14sis_an_pract.doc
#
30.04.2019181.76 Кб4Skinner_Oper_povedenie_1_2.doc
#
01.05.20151.4 Mб98slavianskii_geneticheskii_slovnik_prav.pdf
#
01.05.2015203.78 Кб14Slovnik.doc
#
10.03.201642.77 Mб654Solutions_2nd_Ed_-_Interm_-_SB.pdf
#
05.05.20191.56 Mб2Spiral Falling.doc