Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

566_Lazareva_a._JU._Kolichestvennye_metody_sotsiologicheskogo_issledovanija_

.pdf
Скачиваний:
1
Добавлен:
12.11.2022
Размер:
679.14 Кб
Скачать

2.8.3. Однофакторный дисперсионный анализ – сравнение средних в n-группах

(One-way ANOVA)

С помощью процедуры One-way ANOVA осуществляется однофакторный дисперсионный анализ. Есть возможность получения описательных статистик распределения исследуемого признака в выделенных исследователем группах (например, возраста в группах с разной оценкой современной городской ситуации, как представлено в табл. 9 и 11). Есть возможность получить статистику Ливиня для проверки равенства дисперсий в группах (табл. 10 и 12). В табл. 13 отражены результаты однофакторного дисперсионного анализа. Также в процедуре One-way ANOVA реализованы априорные и апостериорные методы попарных сравнений средних. Табл. 14 – 16 содержат результаты тестов Бонферрони и Шеффе. Презентацию результатов можно дополнить иллюстрацией соотношения средних в группах – рис 1.

Таблица 9. Описательные статистики

Оценка

 

 

 

 

95% Confidence Interval

современной си-

 

Mean

Std. Devia-

Std. Er-

for Mean (95% ДИ для

туации в городе

 

tion (стан-

ror

среднего)

 

N

(сред-

Lower

Upper

 

дартное от-

(станд.

 

 

нее)

клонение)

ошибка)

Bound

Bound

 

 

 

Нижняя

Верхняя

 

 

 

 

 

граница

граница

все идет хорошо

90

31,00

12,090

1,274

28,47

33,53

все не так плохо,

470

38,71

15,857

,731

37,27

40,15

жить можно

 

 

 

 

 

 

жить трудно, но

453

50,44

15,556

,731

49,01

51,88

можно терпеть

 

 

 

 

 

 

все очень плохо,

142

54,13

15,310

1,285

51,59

56,67

терпеть уже

невозможно

 

 

 

 

 

 

В целом

1155

44,61

17,030

0,501

43,62

45,59

по выборке

 

 

 

 

 

 

Таблица 10. Тест Ливиня – проверка равенства дисперсий в группах (Test of Homogeneity of Variance)

Levene Statistic

df1 (степени

df2 (степени

Sig. (эмп. уровень зна-

(Статистика Ливиня)

свободы 1)

свободы 2)

чимости)

4,759

3

1151

0,003*

* Мы должны отвергнуть нулевую гипотезу и проанализировать возможные причины неравенства дисперсий.

31

Таблица 11. Описательные статистики

 

 

 

 

 

95% Confidence Interval

 

 

Mean

Std. Deviation

Std. Error

for Mean (95% ДИ для

 

N

(сред-

(стандартное

(станд.

среднего)

 

Lower

Upper

 

 

нее)

отклонение)

ошибка)

Оценка современной

 

Bound

Bound

 

 

 

 

ситуации в городе

 

 

 

 

Нижняя

Верхняя

 

 

 

 

 

граница

граница

все идет хорошо + все

564

37,45

15,534

0,654

36,17

38,74

не так плохо, жить

можно

 

 

 

 

 

 

жить трудно, но

455

50,42

15,554

0,729

48,99

51,85

можно терпеть

 

 

 

 

 

 

все очень плохо, тер-

143

54,11

15,416

1,291

51,55

56,66

петь уже невозможно

 

 

 

 

 

 

В целом по выборке

1163

44,58

17,026

0,499

43,60

45,56

Таблица 12. Тест Ливиня – проверка равенства дисперсий в группах (Test of Homogeneity of Variance)

Levene Statistic

df1 (степени

df2 (степени

Sig. (эмп. уровень зна-

(Статистика Ливиня)

свободы 1)

свободы 2)

чимости)

0,258

2

1160

0,77

Таблица 13. Однофакторный дисперсионный анализ (ANOVA)

 

Сумма квадра-

 

Средний

F (статистика

Sig. (уровень

Тип дисперсии

тов

df

квадрат

Фишера)

значимости)

 

Sum of Squares

 

Mean Square

Межгрупповая

57166,667

2

28583,334

118,493

0,000

дисперсия Be-

tween Groups

 

 

 

 

 

Внутригруп-

 

 

 

 

 

повая диспер-

279578,015

1159

241,223

-

-

сия

 

 

 

 

 

Within Groups

 

 

 

 

 

Всего

336744,683

1161

-

-

-

32

Таблица 14. Множественные попарные сравнения (Multiple Comparisons)

 

 

 

 

 

 

95% ДИ разни-

 

 

 

Разница

 

 

цы средних

 

(I) современ-

(J) современная

средних

Std.

 

95% Confidence

 

 

Sig.

Тест

ная ситуация

ситуация

Mean Dif-

Error

Interval

 

 

 

ference

 

 

Lower

Upper

 

 

 

(I-J)

 

 

Bound

Bound

 

 

 

 

 

 

Нижняя

верхняя

 

 

 

 

 

 

граница

граница

Scheffe

все идет хо-

жить трудно,

-12,97

0,978

0,000

-15,37

-10,57

Шеффе

рошо + все не

но можно тер-

 

так плохо,

петь

 

 

 

 

 

 

жить можно

все очень пло-

-16,65

1,455

0,000

-20,22

-13,09

 

 

хо, терпеть уже

 

 

невозможно

 

 

 

 

 

 

 

все идет хоро-

 

 

 

 

 

 

жить трудно,

шо + все не так

12,97

0,978

0,000

10,57

15,37

 

но можно тер-

плохо, жить

 

 

 

 

 

 

 

петь

можно

 

 

 

 

 

 

 

все очень пло-

-3,68

1,490

0,047

-7,34

-,03

 

 

хо, терпеть уже

 

 

невозможно

 

 

 

 

 

 

все очень пло-

все идет хоро-

 

 

 

 

 

 

хо, терпеть

шо + все не так

16,65

1,455

0,000

13,09

20,22

 

уже невоз-

плохо, жить

 

 

 

 

 

 

 

можно

можно

 

 

 

 

 

 

 

жить трудно,

3,68

1,490

0,047

0,03

7,34

 

 

но можно тер-

 

 

петь

 

 

 

 

 

Bonferroni

все идет хо-

жить трудно,

-12,97

0,978

0,000

-15,31

-10,62

Бонферро-

рошо + все не

но можно тер-

ни

так плохо,

петь

 

 

 

 

 

 

жить можно

все очень пло-

-16,65

1,455

0,000

-20,14

-13,16

 

 

хо, терпеть уже

 

 

невозможно

 

 

 

 

 

 

 

все идет хоро-

 

 

 

 

 

 

жить трудно,

шо + все не так

12,97

0,978

0,000

10,62

15,31

 

но можно тер-

плохо, жить

 

 

 

 

 

 

 

петь

можно

 

 

 

 

 

 

 

все очень пло-

-3,68

1,490

0,041

-7,26

-0,11

 

 

хо, терпеть уже

 

все очень пло-

невозможно

 

 

 

 

 

 

все идет хоро-

 

 

 

 

 

 

хо, терпеть

шо + все не так

16,65

1,455

0,000

13,16

20,14

 

уже невоз-

плохо, жить

 

 

 

 

 

 

 

можно

можно

 

 

 

 

 

 

 

житьтрудно,но

3,68

1,490

0,041

0,11

7,26

 

 

можнотерпеть

 

 

 

 

 

 

 

* The mean difference is significant at the 0.05 level. (Различие средних значимо при 5% уровне значимости)

33

Таблица 15. Множественные попарные сравнения (Multiple Comparisons)

 

 

 

 

 

 

99% ДИ разни-

 

 

 

Разница

 

 

цы средних

 

(I) современ-

(J) современ-

средних

Std.

 

99% Confidence

 

 

Sig.

Тест

ная ситуация

ная ситуация

Mean Dif-

Error

Interval

 

 

 

ference

 

 

Lower

Upper

 

 

 

(I-J)

 

 

Bound

Bound

 

 

 

 

 

 

Нижняя

верхняя

 

 

 

 

 

 

граница

граница

Scheffe

все идет хо-

жить трудно,

-12,97

,978

,000

-15,94

-9,99

Шеффе

рошо + все

но можно тер-

 

не так плохо,

петь

 

 

 

 

 

 

жить можно

все очень пло-

-16,65

1,455

,000

-21,08

-12,23

 

 

хо, терпеть уже

 

 

невозможно

 

 

 

 

 

 

 

все идет хоро-

 

 

 

 

 

 

жить труд-

шо + все не так

12,97

,978

,000

9,99

15,94

 

но, но можно

плохо, жить

 

 

 

 

 

 

 

терпеть

можно

 

 

 

 

 

 

 

все очень пло-

-3,68

1,490

,047

-8,22

,85

 

 

хо, терпеть уже

 

 

невозможно

 

 

 

 

 

 

все очень

все идет хоро-

 

 

 

 

 

 

плохо, тер-

шо + все не так

16,65

1,455

,000

12,23

21,08

 

петь уже не-

плохо, жить

 

 

 

 

 

 

 

возможно

можно

 

 

 

 

 

 

 

жить трудно,

3,68

1,490

,047

-,85

8,22

 

 

но можно тер-

 

 

петь

 

 

 

 

 

Bonferroni

все идет хо-

житьтрудно,но

-12,97

,978

,000

-15,85

-10,09

Бонферро-

рошо + все

можнотерпеть

 

 

 

 

 

ни

не так плохо,

все очень пло-

 

 

 

 

 

 

жить можно

хо, терпеть уже

-16,65

1,455

,000

-20,93

-12,37

 

 

невозможно

 

 

 

 

 

 

 

все идет хоро-

 

 

 

 

 

 

жить труд-

шо + все не так

12,97

,978

,000

10,09

15,85

 

но, но можно

плохо, жить

 

 

 

 

 

 

 

терпеть

можно

 

 

 

 

 

 

 

все очень пло-

-3,68

1,490

,041

-8,07

,70

 

 

хо, терпеть уже

 

все очень

невозможно

 

 

 

 

 

 

все идет хоро-

 

 

 

 

 

 

плохо, тер-

шо + все не так

16,65

1,455

,000

12,37

20,93

 

петь уже не-

плохо, жить

 

 

 

 

 

 

 

возможно

можно

 

 

 

 

 

 

 

житьтрудно,но

3,68

1,490

,041

-,70

8,07

 

 

можнотерпеть

 

 

 

 

 

 

 

*The mean difference is significant at the 0.01 level (Различие средних значимо при 1% уровне значимости)

34

Таблица 16. Метод Шеффе

 

 

 

Subset for alpha = .05 (наборы

Тест

Оценка современной ситуации

 

неразличимых средних для

 

N

α=.05)

 

 

 

 

 

 

 

1

 

2

Scheffe

все идет хорошо + все не так плохо,

564

37,45

 

-

(a,b)

жить можно

 

 

 

 

 

жить трудно, но можно терпеть

455

-

 

50,42

 

все очень плохо, терпеть уже невоз-

142

-

 

54,11

 

можно

 

 

 

 

 

Sig.

-

1,000

 

0,022

Рис. 1. Средний возраст в группах с разной оценкой современной ситуации в городе

35

2.9. Непараметрические тесты

(Процедура NONPARAMETRIC TESTS)

Непараметрические тесты позволяют проверять статистические гипотезы о совпадении распределений, долей, рангов. Они являются альтернативой параметрических тестов в ситуации, если исследуемые данные не удовлетворяют требованиям методов сравнения средних.

2.9.1. Одновыборочный тест Хи-квадрат

(Chi-square test)

Одновыборочный тест Хи-квадрат является непараметрическим аналогом одновыборочного T-теста. Например, проверяется соответствие долей мужчин и женщин в выборке их представленности в генеральной совокупности (в генеральной совокупности доля мужчин (1) – 0,46; женщин (2) – 0,54). Табл. 1 и 2 являются результатом реализации данного теста с помощью пакета SPSS.

Таблица 1. Ожидаемый и наблюдаемый объем групп

 

Observed N

Expected N

 

Пол

(наблюдаемое коли-

(ожидаемое количе-

Residual

 

чество)

ство)

(остаток)

мужской

449

540,5

-91,5

женский

726

634,5

91,5

ВСЕГО

1175

-

-

Таблица 2. Статистика теста

Статистика

Значение

 

 

Хи-квадрат Chi-Square(a)

28,685

 

 

Степени свободы df

1

 

 

Уровень значимости Asymp. Sig.

0,000

 

 

a 0cells(,0%) haveexpected frequencieslessthan5.Theminimumexpected cellfrequency is540,5.

(В таблице нет клеток, в которых ожидаемая частота была бы меньше 5. Минимальная ожидаемая частота 540,5)

2.9.2. Тест, основанный на биномиальном распределении

(Binomial test)

Биномиальный тест решает задачу схожую с одновыборочным тестом Хи-квадрат для варианта, когда исследуемый признак принимает только два значения. Одно из них назначается «успехом», в тесте оценивается вероятность его проявления. В SPSS по умолчанию наступлением события считается выбор первой альтернативы (в нашем примере «успех» – это быть мужчиной).

36

Таблица 3. Биномиальный тест

 

 

 

 

 

Asymp. Sig. (1-

 

 

 

Observed Prop.

Test Prop.

tailed) (односто-

 

Category

 

(наблюдаемая

(тестируемая

ронний уровень

 

(группа)

N

пропорция)

пропорция)

значимости)

пол

 

 

 

 

 

мужчины

449

0,4

0,4

0,111(a,b)

 

женщины

726

0,6

-

-

 

ВСЕГО

1175

1,0

-

-

2.9.3. Двухвыборочный тест Манна-Уитни для несвязанных выборок

(2-independent samples test)

Двухвыборочный тест Манна-Уитни является аналогом двухвыборочного T-теста. Он основан на сравнении средних рангов в выделенных группах. Пример: исследуемая переменная – возрастные группы (1– 18-34 года, 2 – 35-44 года, 3 – 45-54 года, 4 – 55-64 года, 5 – 65+); группирующая переменная – готовность доверять окружающим (номинальная переменная – 2 значения). В табл. 4 приведены характеристики исследуемого признака, которые выдаются процедурой. Табл. 5 содержит статистики Манна-Уитни и Вилкоксона.

Таблица 4. Описательные статистики

 

 

 

Mean Rank

Sum of

 

Установка обобщенного доверия

N

(средний

Ranks (сум-

 

 

 

ранг)

ма рангов)

 

 

 

 

 

Возрас-

да, нужно быть открытым

140

295,36

41350,00

тные

 

 

 

 

можно доверять, но только знакомым

482

316,19

152403,00

группы

 

 

 

 

ВСЕГО

622

-

-

Таблица 5. Статистики теста

Статистика

Значение

 

 

Mann-Whitney U (статистика Манна-Уитни)

31480,000

 

 

Wilcoxon W (статистика Вилкоксона)

41350,000

 

 

Z

-1,226

 

 

Asymp. Sig. (2-tailed)

0,220

 

 

a Grouping Variable (переменная группирования): доверие

37

2.9.4. Двухвыборочный тест Колмогорова-Смирнова

(2-independent samples test)

Двухвыборочный тест Колмогорова-Смирнова нацелен на проверку гипотезы о совпадении распределений признака в двух несвязанных выборках. Помимо собственно статистик (табл. 7), выдаются данные о количестве объектов в группах (табл. 6). Пример: зависимая переменная «возраст» (количество полных лет) – количественная, имеющая распределение, значимо отличающееся от нормального.

Таблица 6. Одномерное частотное распределение

Пол

N (количество)

мужской

449

женский

726

Всего

1175

Таблица 7. Статистика теста

Статистика

возраст

Наибольшие раз-

 

Абсолютные

0,086

личия

 

Absolute

 

 

Most Extreme Dif-

 

Положительные

0,008

ferences

 

Positive

 

 

 

 

 

 

 

 

Отрицательные

-0,086

 

 

Negative

 

 

 

 

 

 

Kolmogorov-Smirnov Z

1,436

Asymp. Sig. (2-tailed)

 

0,032

2.9.5. Тест медиан для k-независимых выборок

(k- independent samples test/Median)

Так как непараметрические методы менее устойчивы по сравнению с их параметрическими аналогами, для проверки статистических гипотез следует использовать несколько тестов. В пакете доступны два непараметрических теста для 3-х и более выборок: тест медиан и тест Краскела-Уоллиса. При реализации теста медиан выдаются частотные распределения (табл. 8) и статистика теста, основанная на критерии Хи-квадрат (табл. 9). Пример: зависимая переменная «возраст» (количество полных лет) – количественная, ненормально распределенная; медиана – 46 лет.

38

Таблица 8. Частотные распределения

 

 

 

Уровень образования

 

 

 

 

 

 

 

 

Тест медиан

начальное и

 

среднетехниче-

 

 

среднее

ское, средне спе-

высшее

 

 

ниже

 

 

 

циальное

 

возраст

 

 

 

 

 

 

 

 

 

> Median (больше

33

126

176

234

 

медианы)

 

 

 

 

 

 

 

 

 

 

 

 

<= Median (меньше

3

103

148

345

 

либо равно медиане)

 

 

 

 

 

 

 

 

 

 

 

Таблица 9. Статистики теста

Статистика

Значение

 

 

N (количество)

1168

 

 

Median (Медиана)

46,00

 

 

Chi-Square (Хи-квадрат)

50,272(a)

 

 

Df (Число степеней свободы)

3

 

 

Asymp. Sig. (уровень значимости)

0,000

 

 

2.9.6. Однофакторный дисперсионный анализ – Тест Краскела-Уоллиса

(Kruskal-Wallis H)

В основе теста лежит сравнение средних рангов исследуемого признака в 3-х и более группах. Пример: группирующая переменная – возрастные группы; исследуемый признак – оценка условий жизни (1 – хорошо; 2 – средне; 3 – плохо). В табл. 10 представлены средние ранги по возрастным группам, в табл.11 – статистика теста.

Таблица 10. Средний ранг оценки условий жизни в возрастных группах

 

 

Mean Rank (средний ранг

Возрастные группы

N

оценки условий жизни)

 

 

 

18 – 24

193

345,57

25 – 34

192

480,07

35 – 44

163

554,81

45 – 54

236

598,12

55 – 64

171

702,09

65+

192

770,10

 

 

39

Таблица 11. Статистика теста

Статистика

Значение

 

 

Chi-Square (Хи-квадрат)

228,250

 

 

Df (Число степеней свободы)

5

 

 

Asymp. Sig. (уровень значимости)

0,000

 

 

2.9.7. Двухвыборочный критерий знаков для 2-х связанных выборок

(2-related samples/ Sign)

Для сравнения средних рангов в двух связанных выборках в пакете предназначены два теста: двухвыборочный критерий знаков и знаково-ранговый критерий Вилкоксона. Пример: исследуемые признаки – оценка качества уборки подъезда и оценка качества уборки дворовой территории (оценка по пятибалльной шкале, где 1 – очень плохо). Табл. 12 и 13 содержат результаты реализации теста знаков, а табл. 14 и 15 – теста Вилкоксона.

Таблица 12. Разница рангов в оценках уборки подъездов и дворов

Разница рангов

N

 

 

Negative Differences(a)

299

(отрицательная разница)

 

 

 

Positive Differences(b)

215

(положительная разница)

 

 

 

Ties(c) (связанные ранги)

567

ВСЕГО

1081

aуборка подъезда < уборка двора

bуборка подъезда > уборка двора

cуборка подъезда = уборка двора

Таблица 13. Статистика критерия знаков

Статистика

Значение

 

 

Z

-3,661

 

 

Asymp. Sig. (2-tailed) (двухсторонняя значимость)

0,000

 

 

40