- •Лабораторна робота 1 методи вибіркових обстежень. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 2 оцінювання параметрів генеральної сукупності та вибірки. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 3 оцінювання частки та кількості елементів за певною ознакою. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 4 оцінювання середніх та сумарних значень. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 5 перевірка статистичних гіпотез. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 6 непараметричні критерії. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 7 тести про вигляд розподілу. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 8 регресійний аналіз. Множинна лінійна регресія – виконання в пакеті statistica 6.0.
- •Лабораторна робота 9 кластер ний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 10 дисперсійний ний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 11 Категорізовані дані. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 12 канонічний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 13 дискримінантний аналіз. Виконання в пакеті statistica 6.0.
- •Лабораторна робота 14 факторний аналіз. Виконання в пакеті statistica 6.0.
Лабораторна робота 10 дисперсійний ний аналіз. Виконання в пакеті statistica 6.0.
Однофакторний дисперсійний аналіз
У трьох магазинах, що торгують однотипними товарами, зібрано дані про товарообіг за 8 місяців роботи (в тис. грн.)
Магазин |
Товарообіг за місяць |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
19 |
23 |
26 |
18 |
20 |
20 |
18 |
35 |
2 |
20 |
20 |
32 |
27 |
40 |
24 |
22 |
18 |
3 |
16 |
15 |
18 |
26 |
19 |
17 |
19 |
18 |
Перевірити гіпотезу про рівність середніх значень товарообігу в різних магазинах. Якщо гіпотеза буде відхилена, провести попарне порівняння середніх.
Будемо виконувати дії в модулі Basic Statistics and Tables (можна виконувати також у модулі ANOVA/MANOVA). Спочатку перевіримо гіпотезу про рівність середніх.
1. Створимо таблицю з двома стовпцями М (магазин) і Т (товарообіг) та 24 (3×8) рядками.
2. У Т занесемо дані про товарообіг, а у М – номери магазинів (рівні фактора) Ml, M2, М3.
3. Далі в меню вибираємо Analysis; потім вибираємо Breakdown and one-way ANOVA; у вікні, що відкрилося, вибираємо:
Analysis: Detailed Analysis Of Individual tables,
Variables: Grouping variables (групуючі змінні): 1-М, Dependent variables (залежні змінні - відгуки): 2-Р,
OK;
Codes for grouping variables: All+OK;
OK
4. У вікні (Descriptive Statistics and Correlations by groups - Results), що відкрилося (рис. 12.3), вибираємо:
Statistics:
Number of observations (кількість спостережень),
Standard deviations (стандартні відхилення),
Variances (дисперсії);
OK.
У вікні Summary Table of Means бачимо, як відрізняються середні в залежності від рівня фактора М.
Повертаємось у вікно Descriptive Statistics and Correlations by groups - Results, натиснувши на ×;
Вибираємо Analysis of Variance і отримуємо таблицю резуль татів Analysis of Variance.
p = 0,079683 – ймовірність, з якою можна стверджувати, що середні рівні між собою. Оскільки р надто мале, щоб вважати середні однаковими, то гіпотезу про рівність середніх відхиляємо. Проведемо попарне порівняння середніх методом лінійних контрастів (метод Шеффе).
Повернемось до вікна Descriptive Statistics and Correlations by groups - Results;
Виберемо Post-hoc comparisons of means (рис. 12.6);
Виберемо Sheffe test;
У вікні, що відкрилося, читаємо рівні значущості для гіпотез про рівність усіх пар середніх.
З результатів можна зробити висновок, що слід вважати різними середні значення товарообігу в другому та третьому магазинах.
Двофакторнии дисперсійний аналіз.
Досліджувався вплив факторів А і В на рейтинг правих політичних партій (у відсотках): фактор А - регіони (А1 - західний, А2 - центральний, Аз - східний); фактор В - вік опитаних (В1 – 20-35 років, В2 – 35-50 років, В3 – 50-70 років). Результати досліджень наведені в таблиці:
Фактор В |
Фактор А |
|||||
А1 |
А2 |
А3 |
||||
В1 |
25,2 |
10,2 |
4,3 |
10,5 |
14,3 |
10,6 |
5,4 |
13,2 |
20,3 |
32,4 |
28,4 |
10,8 |
|
18,2 |
5,2 |
5,6 |
12,4 |
7,4 |
6,5 |
|
13,4 |
15,2 |
6,2 |
9,8 |
4,5 |
26,3 |
|
4,5 |
19,2 |
16,8 |
18,4 |
30,2 |
11,8 |
|
В2 |
10,6 |
8,4 |
12,4 |
4,3 |
6,2 |
7,5 |
11,2 |
4,6 |
13,2 |
5,6 |
3,5 |
12,4 |
|
5,8 |
18,2 |
8,9 |
14,8 |
13,5 |
16,4 |
|
16,4 |
13,2 |
22,3 |
6,8 |
7,9 |
8,9 |
|
4,8 |
8,9 |
7,2 |
11,4 |
15,4 |
10,8 |
|
В3 |
2,5 |
6,4 |
4,5 |
4,9 |
14,8 |
2,9 |
12,5 |
14,8 |
12,3 |
15,6 |
5,9 |
10,6 |
|
12,3 |
8,5 |
7,9 |
8,9 |
8,5 |
13,4 |
|
5,9 |
8,9 |
9,8 |
13,9 |
2,2 |
19,5 |
|
15,4 |
12,8 |
4,2 |
6,9 |
7,9 |
9,9 |
Використаємо модуль ANOVA/MANOVA.
1. Створимо таблицю з трьома стовпцями X (рейтинг), А (регіони), В (вік) та 90 (3×3×10) рядками.
2. У X занесемо дані про рейтинг, у А – індекс регіону, а в В – індекс віку.
3. В меню модуля вибираємо Analysis, а потім пункт Resume Analysis.
4. У вікні, що відкриється, натискаємо:
Variables та вводимо інформацію: Independent variables (factors): 2-А, 3-В; Dependent variable list: 1-Х; OK.
Натискуємо OK.
У вікні ANOVA Results, що з'являється вибираємо All effects і читаємо результат у Summary of all Effects (для кожного фактора та їх сукупності):
df Effect: p - 1 = 2, q - 1 = 2, (р - 1)(q - 1) = 4;
MS Effect: S21 = 163,9488, S22 = 3,1214, S23 = 6,1313;
df Error: pq(n - 1) = 81;
MS Error: S24 = 38,06314;
F: FA = 4, 307285, FB = 0, 082007, FAВ = 0,161082;
p - level: pA = 0, 016684, pВ = 0, 921342, pAB = 0,957390.
З отриманих результатів можна зробити висновок, що фактор А (регіон) істотно впливає на рейтинг правих політичних сил (ймовірність помилки не перевищує 0,017), а про наявність впливу фактора В (вік) на підставі отриманих результатів статистичних досліджень говорити не можна. Останнє стосується і сукупного впливу цих факторів.