566_Lazareva_a._JU._Kolichestvennye_metody_sotsiologicheskogo_issledovanija_
.pdf2.8.3. Однофакторный дисперсионный анализ – сравнение средних в n-группах
(One-way ANOVA)
С помощью процедуры One-way ANOVA осуществляется однофакторный дисперсионный анализ. Есть возможность получения описательных статистик распределения исследуемого признака в выделенных исследователем группах (например, возраста в группах с разной оценкой современной городской ситуации, как представлено в табл. 9 и 11). Есть возможность получить статистику Ливиня для проверки равенства дисперсий в группах (табл. 10 и 12). В табл. 13 отражены результаты однофакторного дисперсионного анализа. Также в процедуре One-way ANOVA реализованы априорные и апостериорные методы попарных сравнений средних. Табл. 14 – 16 содержат результаты тестов Бонферрони и Шеффе. Презентацию результатов можно дополнить иллюстрацией соотношения средних в группах – рис 1.
Таблица 9. Описательные статистики
Оценка |
|
|
|
|
95% Confidence Interval |
||
современной си- |
|
Mean |
Std. Devia- |
Std. Er- |
for Mean (95% ДИ для |
||
туации в городе |
|
tion (стан- |
ror |
среднего) |
|||
|
N |
(сред- |
Lower |
Upper |
|||
|
дартное от- |
(станд. |
|||||
|
|
нее) |
клонение) |
ошибка) |
Bound |
Bound |
|
|
|
|
Нижняя |
Верхняя |
|||
|
|
|
|
|
граница |
граница |
|
все идет хорошо |
90 |
31,00 |
12,090 |
1,274 |
28,47 |
33,53 |
|
все не так плохо, |
470 |
38,71 |
15,857 |
,731 |
37,27 |
40,15 |
|
жить можно |
|||||||
|
|
|
|
|
|
||
жить трудно, но |
453 |
50,44 |
15,556 |
,731 |
49,01 |
51,88 |
|
можно терпеть |
|||||||
|
|
|
|
|
|
||
все очень плохо, |
142 |
54,13 |
15,310 |
1,285 |
51,59 |
56,67 |
|
терпеть уже |
|||||||
невозможно |
|
|
|
|
|
|
|
В целом |
1155 |
44,61 |
17,030 |
0,501 |
43,62 |
45,59 |
|
по выборке |
|||||||
|
|
|
|
|
|
Таблица 10. Тест Ливиня – проверка равенства дисперсий в группах (Test of Homogeneity of Variance)
Levene Statistic |
df1 (степени |
df2 (степени |
Sig. (эмп. уровень зна- |
(Статистика Ливиня) |
свободы 1) |
свободы 2) |
чимости) |
4,759 |
3 |
1151 |
0,003* |
* Мы должны отвергнуть нулевую гипотезу и проанализировать возможные причины неравенства дисперсий.
31
Таблица 11. Описательные статистики
|
|
|
|
|
95% Confidence Interval |
||
|
|
Mean |
Std. Deviation |
Std. Error |
for Mean (95% ДИ для |
||
|
N |
(сред- |
(стандартное |
(станд. |
среднего) |
||
|
Lower |
Upper |
|||||
|
|
нее) |
отклонение) |
ошибка) |
|||
Оценка современной |
|
Bound |
Bound |
||||
|
|
|
|
||||
ситуации в городе |
|
|
|
|
Нижняя |
Верхняя |
|
|
|
|
|
|
граница |
граница |
|
все идет хорошо + все |
564 |
37,45 |
15,534 |
0,654 |
36,17 |
38,74 |
|
не так плохо, жить |
|||||||
можно |
|
|
|
|
|
|
|
жить трудно, но |
455 |
50,42 |
15,554 |
0,729 |
48,99 |
51,85 |
|
можно терпеть |
|||||||
|
|
|
|
|
|
||
все очень плохо, тер- |
143 |
54,11 |
15,416 |
1,291 |
51,55 |
56,66 |
|
петь уже невозможно |
|
|
|
|
|
|
|
В целом по выборке |
1163 |
44,58 |
17,026 |
0,499 |
43,60 |
45,56 |
Таблица 12. Тест Ливиня – проверка равенства дисперсий в группах (Test of Homogeneity of Variance)
Levene Statistic |
df1 (степени |
df2 (степени |
Sig. (эмп. уровень зна- |
(Статистика Ливиня) |
свободы 1) |
свободы 2) |
чимости) |
0,258 |
2 |
1160 |
0,77 |
Таблица 13. Однофакторный дисперсионный анализ (ANOVA)
|
Сумма квадра- |
|
Средний |
F (статистика |
Sig. (уровень |
|
Тип дисперсии |
тов |
df |
квадрат |
|||
Фишера) |
значимости) |
|||||
|
Sum of Squares |
|
Mean Square |
|||
Межгрупповая |
57166,667 |
2 |
28583,334 |
118,493 |
0,000 |
|
дисперсия Be- |
||||||
tween Groups |
|
|
|
|
|
|
Внутригруп- |
|
|
|
|
|
|
повая диспер- |
279578,015 |
1159 |
241,223 |
- |
- |
|
сия |
||||||
|
|
|
|
|
||
Within Groups |
|
|
|
|
|
|
Всего |
336744,683 |
1161 |
- |
- |
- |
32
Таблица 14. Множественные попарные сравнения (Multiple Comparisons)
|
|
|
|
|
|
95% ДИ разни- |
|
|
|
|
Разница |
|
|
цы средних |
|
|
(I) современ- |
(J) современная |
средних |
Std. |
|
95% Confidence |
|
|
|
Sig. |
|||||
Тест |
ная ситуация |
ситуация |
Mean Dif- |
Error |
Interval |
||
|
|
|
ference |
|
|
Lower |
Upper |
|
|
|
(I-J) |
|
|
Bound |
Bound |
|
|
|
|
|
|
Нижняя |
верхняя |
|
|
|
|
|
|
граница |
граница |
Scheffe |
все идет хо- |
жить трудно, |
-12,97 |
0,978 |
0,000 |
-15,37 |
-10,57 |
Шеффе |
рошо + все не |
но можно тер- |
|||||
|
так плохо, |
петь |
|
|
|
|
|
|
жить можно |
все очень пло- |
-16,65 |
1,455 |
0,000 |
-20,22 |
-13,09 |
|
|
хо, терпеть уже |
|||||
|
|
невозможно |
|
|
|
|
|
|
|
все идет хоро- |
|
|
|
|
|
|
жить трудно, |
шо + все не так |
12,97 |
0,978 |
0,000 |
10,57 |
15,37 |
|
но можно тер- |
плохо, жить |
|||||
|
|
|
|
|
|
||
|
петь |
можно |
|
|
|
|
|
|
|
все очень пло- |
-3,68 |
1,490 |
0,047 |
-7,34 |
-,03 |
|
|
хо, терпеть уже |
|||||
|
|
невозможно |
|
|
|
|
|
|
все очень пло- |
все идет хоро- |
|
|
|
|
|
|
хо, терпеть |
шо + все не так |
16,65 |
1,455 |
0,000 |
13,09 |
20,22 |
|
уже невоз- |
плохо, жить |
|||||
|
|
|
|
|
|
||
|
можно |
можно |
|
|
|
|
|
|
|
жить трудно, |
3,68 |
1,490 |
0,047 |
0,03 |
7,34 |
|
|
но можно тер- |
|||||
|
|
петь |
|
|
|
|
|
Bonferroni |
все идет хо- |
жить трудно, |
-12,97 |
0,978 |
0,000 |
-15,31 |
-10,62 |
Бонферро- |
рошо + все не |
но можно тер- |
|||||
ни |
так плохо, |
петь |
|
|
|
|
|
|
жить можно |
все очень пло- |
-16,65 |
1,455 |
0,000 |
-20,14 |
-13,16 |
|
|
хо, терпеть уже |
|||||
|
|
невозможно |
|
|
|
|
|
|
|
все идет хоро- |
|
|
|
|
|
|
жить трудно, |
шо + все не так |
12,97 |
0,978 |
0,000 |
10,62 |
15,31 |
|
но можно тер- |
плохо, жить |
|||||
|
|
|
|
|
|
||
|
петь |
можно |
|
|
|
|
|
|
|
все очень пло- |
-3,68 |
1,490 |
0,041 |
-7,26 |
-0,11 |
|
|
хо, терпеть уже |
|||||
|
все очень пло- |
невозможно |
|
|
|
|
|
|
все идет хоро- |
|
|
|
|
|
|
|
хо, терпеть |
шо + все не так |
16,65 |
1,455 |
0,000 |
13,16 |
20,14 |
|
уже невоз- |
плохо, жить |
|||||
|
|
|
|
|
|
||
|
можно |
можно |
|
|
|
|
|
|
|
житьтрудно,но |
3,68 |
1,490 |
0,041 |
0,11 |
7,26 |
|
|
можнотерпеть |
|||||
|
|
|
|
|
|
|
* The mean difference is significant at the 0.05 level. (Различие средних значимо при 5% уровне значимости)
33
Таблица 15. Множественные попарные сравнения (Multiple Comparisons)
|
|
|
|
|
|
99% ДИ разни- |
||
|
|
|
Разница |
|
|
цы средних |
||
|
(I) современ- |
(J) современ- |
средних |
Std. |
|
99% Confidence |
||
|
|
Sig. |
||||||
Тест |
ная ситуация |
ная ситуация |
Mean Dif- |
Error |
Interval |
|||
|
|
|
ference |
|
|
Lower |
Upper |
|
|
|
|
(I-J) |
|
|
Bound |
Bound |
|
|
|
|
|
|
|
Нижняя |
верхняя |
|
|
|
|
|
|
|
граница |
граница |
|
Scheffe |
все идет хо- |
жить трудно, |
-12,97 |
,978 |
,000 |
-15,94 |
-9,99 |
|
Шеффе |
рошо + все |
но можно тер- |
||||||
|
не так плохо, |
петь |
|
|
|
|
|
|
|
жить можно |
все очень пло- |
-16,65 |
1,455 |
,000 |
-21,08 |
-12,23 |
|
|
|
хо, терпеть уже |
||||||
|
|
невозможно |
|
|
|
|
|
|
|
|
все идет хоро- |
|
|
|
|
|
|
|
жить труд- |
шо + все не так |
12,97 |
,978 |
,000 |
9,99 |
15,94 |
|
|
но, но можно |
плохо, жить |
||||||
|
|
|
|
|
|
|||
|
терпеть |
можно |
|
|
|
|
|
|
|
|
все очень пло- |
-3,68 |
1,490 |
,047 |
-8,22 |
,85 |
|
|
|
хо, терпеть уже |
||||||
|
|
невозможно |
|
|
|
|
|
|
|
все очень |
все идет хоро- |
|
|
|
|
|
|
|
плохо, тер- |
шо + все не так |
16,65 |
1,455 |
,000 |
12,23 |
21,08 |
|
|
петь уже не- |
плохо, жить |
||||||
|
|
|
|
|
|
|||
|
возможно |
можно |
|
|
|
|
|
|
|
|
жить трудно, |
3,68 |
1,490 |
,047 |
-,85 |
8,22 |
|
|
|
но можно тер- |
||||||
|
|
петь |
|
|
|
|
|
|
Bonferroni |
все идет хо- |
житьтрудно,но |
-12,97 |
,978 |
,000 |
-15,85 |
-10,09 |
|
Бонферро- |
рошо + все |
можнотерпеть |
||||||
|
|
|
|
|
||||
ни |
не так плохо, |
все очень пло- |
|
|
|
|
|
|
|
жить можно |
хо, терпеть уже |
-16,65 |
1,455 |
,000 |
-20,93 |
-12,37 |
|
|
|
невозможно |
|
|
|
|
|
|
|
|
все идет хоро- |
|
|
|
|
|
|
|
жить труд- |
шо + все не так |
12,97 |
,978 |
,000 |
10,09 |
15,85 |
|
|
но, но можно |
плохо, жить |
||||||
|
|
|
|
|
|
|||
|
терпеть |
можно |
|
|
|
|
|
|
|
|
все очень пло- |
-3,68 |
1,490 |
,041 |
-8,07 |
,70 |
|
|
|
хо, терпеть уже |
||||||
|
все очень |
невозможно |
|
|
|
|
|
|
|
все идет хоро- |
|
|
|
|
|
||
|
плохо, тер- |
шо + все не так |
16,65 |
1,455 |
,000 |
12,37 |
20,93 |
|
|
петь уже не- |
плохо, жить |
||||||
|
|
|
|
|
|
|||
|
возможно |
можно |
|
|
|
|
|
|
|
|
житьтрудно,но |
3,68 |
1,490 |
,041 |
-,70 |
8,07 |
|
|
|
можнотерпеть |
||||||
|
|
|
|
|
|
|
*The mean difference is significant at the 0.01 level (Различие средних значимо при 1% уровне значимости)
34
Таблица 16. Метод Шеффе
|
|
|
Subset for alpha = .05 (наборы |
||
Тест |
Оценка современной ситуации |
|
неразличимых средних для |
||
|
N |
α=.05) |
|
||
|
|
|
|||
|
|
|
1 |
|
2 |
Scheffe |
все идет хорошо + все не так плохо, |
564 |
37,45 |
|
- |
(a,b) |
жить можно |
|
|
|
|
|
жить трудно, но можно терпеть |
455 |
- |
|
50,42 |
|
все очень плохо, терпеть уже невоз- |
142 |
- |
|
54,11 |
|
можно |
|
|
|
|
|
Sig. |
- |
1,000 |
|
0,022 |
Рис. 1. Средний возраст в группах с разной оценкой современной ситуации в городе
35
2.9. Непараметрические тесты
(Процедура NONPARAMETRIC TESTS)
Непараметрические тесты позволяют проверять статистические гипотезы о совпадении распределений, долей, рангов. Они являются альтернативой параметрических тестов в ситуации, если исследуемые данные не удовлетворяют требованиям методов сравнения средних.
2.9.1. Одновыборочный тест Хи-квадрат
(Chi-square test)
Одновыборочный тест Хи-квадрат является непараметрическим аналогом одновыборочного T-теста. Например, проверяется соответствие долей мужчин и женщин в выборке их представленности в генеральной совокупности (в генеральной совокупности доля мужчин (1) – 0,46; женщин (2) – 0,54). Табл. 1 и 2 являются результатом реализации данного теста с помощью пакета SPSS.
Таблица 1. Ожидаемый и наблюдаемый объем групп
|
Observed N |
Expected N |
|
Пол |
(наблюдаемое коли- |
(ожидаемое количе- |
Residual |
|
чество) |
ство) |
(остаток) |
мужской |
449 |
540,5 |
-91,5 |
женский |
726 |
634,5 |
91,5 |
ВСЕГО |
1175 |
- |
- |
Таблица 2. Статистика теста
Статистика |
Значение |
|
|
Хи-квадрат Chi-Square(a) |
28,685 |
|
|
Степени свободы df |
1 |
|
|
Уровень значимости Asymp. Sig. |
0,000 |
|
|
a 0cells(,0%) haveexpected frequencieslessthan5.Theminimumexpected cellfrequency is540,5.
(В таблице нет клеток, в которых ожидаемая частота была бы меньше 5. Минимальная ожидаемая частота 540,5)
2.9.2. Тест, основанный на биномиальном распределении
(Binomial test)
Биномиальный тест решает задачу схожую с одновыборочным тестом Хи-квадрат для варианта, когда исследуемый признак принимает только два значения. Одно из них назначается «успехом», в тесте оценивается вероятность его проявления. В SPSS по умолчанию наступлением события считается выбор первой альтернативы (в нашем примере «успех» – это быть мужчиной).
36
Таблица 3. Биномиальный тест
|
|
|
|
|
Asymp. Sig. (1- |
|
|
|
Observed Prop. |
Test Prop. |
tailed) (односто- |
|
Category |
|
(наблюдаемая |
(тестируемая |
ронний уровень |
|
(группа) |
N |
пропорция) |
пропорция) |
значимости) |
пол |
|
|
|
|
|
мужчины |
449 |
0,4 |
0,4 |
0,111(a,b) |
|
|
женщины |
726 |
0,6 |
- |
- |
|
ВСЕГО |
1175 |
1,0 |
- |
- |
2.9.3. Двухвыборочный тест Манна-Уитни для несвязанных выборок
(2-independent samples test)
Двухвыборочный тест Манна-Уитни является аналогом двухвыборочного T-теста. Он основан на сравнении средних рангов в выделенных группах. Пример: исследуемая переменная – возрастные группы (1– 18-34 года, 2 – 35-44 года, 3 – 45-54 года, 4 – 55-64 года, 5 – 65+); группирующая переменная – готовность доверять окружающим (номинальная переменная – 2 значения). В табл. 4 приведены характеристики исследуемого признака, которые выдаются процедурой. Табл. 5 содержит статистики Манна-Уитни и Вилкоксона.
Таблица 4. Описательные статистики
|
|
|
Mean Rank |
Sum of |
|
Установка обобщенного доверия |
N |
(средний |
Ranks (сум- |
|
|
|
ранг) |
ма рангов) |
|
|
|
|
|
Возрас- |
да, нужно быть открытым |
140 |
295,36 |
41350,00 |
тные |
|
|
|
|
можно доверять, но только знакомым |
482 |
316,19 |
152403,00 |
|
группы |
|
|
|
|
ВСЕГО |
622 |
- |
- |
Таблица 5. Статистики теста
Статистика |
Значение |
|
|
Mann-Whitney U (статистика Манна-Уитни) |
31480,000 |
|
|
Wilcoxon W (статистика Вилкоксона) |
41350,000 |
|
|
Z |
-1,226 |
|
|
Asymp. Sig. (2-tailed) |
0,220 |
|
|
a Grouping Variable (переменная группирования): доверие
37
2.9.4. Двухвыборочный тест Колмогорова-Смирнова
(2-independent samples test)
Двухвыборочный тест Колмогорова-Смирнова нацелен на проверку гипотезы о совпадении распределений признака в двух несвязанных выборках. Помимо собственно статистик (табл. 7), выдаются данные о количестве объектов в группах (табл. 6). Пример: зависимая переменная «возраст» (количество полных лет) – количественная, имеющая распределение, значимо отличающееся от нормального.
Таблица 6. Одномерное частотное распределение
Пол |
N (количество) |
мужской |
449 |
женский |
726 |
Всего |
1175 |
Таблица 7. Статистика теста
Статистика |
возраст |
||
Наибольшие раз- |
|
Абсолютные |
0,086 |
личия |
|
Absolute |
|
|
|
||
Most Extreme Dif- |
|
Положительные |
0,008 |
ferences |
|
Positive |
|
|
|
||
|
|
|
|
|
|
Отрицательные |
-0,086 |
|
|
Negative |
|
|
|
|
|
|
|
|
|
Kolmogorov-Smirnov Z |
1,436 |
||
Asymp. Sig. (2-tailed) |
|
0,032 |
2.9.5. Тест медиан для k-независимых выборок
(k- independent samples test/Median)
Так как непараметрические методы менее устойчивы по сравнению с их параметрическими аналогами, для проверки статистических гипотез следует использовать несколько тестов. В пакете доступны два непараметрических теста для 3-х и более выборок: тест медиан и тест Краскела-Уоллиса. При реализации теста медиан выдаются частотные распределения (табл. 8) и статистика теста, основанная на критерии Хи-квадрат (табл. 9). Пример: зависимая переменная «возраст» (количество полных лет) – количественная, ненормально распределенная; медиана – 46 лет.
38
Таблица 8. Частотные распределения
|
|
|
Уровень образования |
|
|
|
|
|
|
|
|
|
Тест медиан |
начальное и |
|
среднетехниче- |
|
|
среднее |
ское, средне спе- |
высшее |
||
|
|
ниже |
|||
|
|
|
циальное |
|
|
возраст |
|
|
|
|
|
|
|
|
|
|
|
> Median (больше |
33 |
126 |
176 |
234 |
|
|
медианы) |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
<= Median (меньше |
3 |
103 |
148 |
345 |
|
либо равно медиане) |
||||
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 9. Статистики теста
Статистика |
Значение |
|
|
N (количество) |
1168 |
|
|
Median (Медиана) |
46,00 |
|
|
Chi-Square (Хи-квадрат) |
50,272(a) |
|
|
Df (Число степеней свободы) |
3 |
|
|
Asymp. Sig. (уровень значимости) |
0,000 |
|
|
2.9.6. Однофакторный дисперсионный анализ – Тест Краскела-Уоллиса
(Kruskal-Wallis H)
В основе теста лежит сравнение средних рангов исследуемого признака в 3-х и более группах. Пример: группирующая переменная – возрастные группы; исследуемый признак – оценка условий жизни (1 – хорошо; 2 – средне; 3 – плохо). В табл. 10 представлены средние ранги по возрастным группам, в табл.11 – статистика теста.
Таблица 10. Средний ранг оценки условий жизни в возрастных группах
|
|
Mean Rank (средний ранг |
Возрастные группы |
N |
оценки условий жизни) |
|
|
|
18 – 24 |
193 |
345,57 |
25 – 34 |
192 |
480,07 |
35 – 44 |
163 |
554,81 |
45 – 54 |
236 |
598,12 |
55 – 64 |
171 |
702,09 |
65+ |
192 |
770,10 |
|
|
39 |
Таблица 11. Статистика теста
Статистика |
Значение |
|
|
Chi-Square (Хи-квадрат) |
228,250 |
|
|
Df (Число степеней свободы) |
5 |
|
|
Asymp. Sig. (уровень значимости) |
0,000 |
|
|
2.9.7. Двухвыборочный критерий знаков для 2-х связанных выборок
(2-related samples/ Sign)
Для сравнения средних рангов в двух связанных выборках в пакете предназначены два теста: двухвыборочный критерий знаков и знаково-ранговый критерий Вилкоксона. Пример: исследуемые признаки – оценка качества уборки подъезда и оценка качества уборки дворовой территории (оценка по пятибалльной шкале, где 1 – очень плохо). Табл. 12 и 13 содержат результаты реализации теста знаков, а табл. 14 и 15 – теста Вилкоксона.
Таблица 12. Разница рангов в оценках уборки подъездов и дворов
Разница рангов |
N |
|
|
|
|
Negative Differences(a) |
299 |
|
(отрицательная разница) |
||
|
||
|
|
|
Positive Differences(b) |
215 |
|
(положительная разница) |
||
|
||
|
|
|
Ties(c) (связанные ранги) |
567 |
|
ВСЕГО |
1081 |
aуборка подъезда < уборка двора
bуборка подъезда > уборка двора
cуборка подъезда = уборка двора
Таблица 13. Статистика критерия знаков
Статистика |
Значение |
|
|
Z |
-3,661 |
|
|
Asymp. Sig. (2-tailed) (двухсторонняя значимость) |
0,000 |
|
|
40