Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

566_Lazareva_a._JU._Kolichestvennye_metody_sotsiologicheskogo_issledovanija_

.pdf
Скачиваний:
1
Добавлен:
12.11.2022
Размер:
679.14 Кб
Скачать

Федеральное агентство связи Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования «Сибирский государственный университет телекоммуникаций и информатики» (ФГОБУ ВПО «СибГУТИ»)

А.Ю. Лазарева

Количественные методы социологического исследования

Учебно-методическое пособие по дисциплине «Количественные методы социологического исследования»

Новосибирск

2015

УДК 303.642.023 (078)

Лазарева А. Ю. Количественные методы социологического исследования: Учебно-методическое пособие. – Новосибирск: Изд-во СибГУТИ, 2015. – 60 с.

Настоящее издание предназначено для организации семинарских занятий и самостоятельной работы студентов по дисциплине «Количественные методы социологических исследований» для направления 39.03.01 «Социология».

Учебно-методическое пособие содержит темы и вопросы к семинарским занятиям, методические рекомендации для подготовки к занятию, темы выступлений, литературу для самостоятельной работы и контрольные вопросы по данной дисциплине.

В учебно-методическом пособии рассматриваются особенности предмета «Количественные методы социологических исследований». Освоение данной дисциплины создает основу для дальнейшего самостоятельного постижения теоретического социологического знания, а также для проведения эмпирических научных исследований. Изучение дисциплины способствует расширению и углублению знаний студентов в области анализа социологических данных с применением специализированного статистического пакета SPSS, формированию профессиональных компетенций, связанных с особенностями социологического анализа данных, а также закреплению навыков работы с первичными данными и проведения вторичного анализа социологической информации.

Кафедра социологии, политологии и психологии

Рецензент: канд. филос. наук, доцент Чуркина Н.А.

Список рекомендуемой литературы –10 наименований

Для студентов направления 39.03.01 «Социология», квалификация (степень) бакалавра, модуль специализации «Социология управления»

Утверждено редакционно-издательским советом СибГУТИ в качестве учебнометодического пособия.

©Лазарева А.Ю., 2015

©Сибирский государственный университет телекоммуникаций и информатики, 2015

СОДЕРЖАНИЕ

Введение………………………………………………………………………...........5

Часть 1. Темы и содержание семинарских (практических) занятий

Семинар 1. Структура пакета SPSS и правила организации таблицы

«объект-признак» (2 часа)……………………………….…….…..…………….….7

Семинар 2. Одномерное частотное распределение (2 часа)…………….……...…7

Семинар 3. Преобразование данных (2 часа)……………………….……….……..8 Семинар 4. Таблицы сопряженности (часть 1) (2 часа)…………….………….….8

Семинар 5. Таблицы сопряженности (часть 2) (2 часа)……………….…………9

Семинар 6. Работа с массивами данных (2 часа)……………………….…….…..10 Семинар 7. Коэффициенты корреляции (2 часа)…………………………..……..11 Семинар 8. Обобщающий семинар по анализу взаимосвязи неколичественных переменных (2 часа)………………………..………………...11 Семинар 9. Одновыборочные тесты: параметрический и непараметрический аналоги (2 часа)…………… ………………….………….12

Семинар 10. Двухвыборочный t-тест (2 часа)………………………..………..…13

Семинар 11. Однофакторный дисперсионный анализ (2 часа)…………..…….13

Семинар 12. Двухвыборочные непараметрические тесты (2 часа)………….….14

Семинар 13. Простая линейная регрессия (2 часа)………………………........…15

Семинар 14. Процедура факторного анализа: метод главных компонент

(2 часа)…………………………………………………………………...............…16

Часть 2. Стимульный материал для организации семинарских занятий и самостоятельной работы студентов

2.1.Пошаговая исследовательская модель анализа данных…………………..16

2.2.Общая схема проверки статистической гипотезы………………………...18

2.3.Одномерные частотные распределения (Процедура FREQUENCIES) ….19

2.4.Таблицы сопряженности и меры связи (Процедура CROSSTABS)……...20

2.5.Исследование данных (Процедура EXPLORE)……………………………22

2.6.Операции с файлами данных (Процедура DATA) ……………………… .23

2.6.1.Агрегирование данных (Aggregate)………………………………………....23

2.6.2.Процедура взвешивания данных (Weight cases)……………………...….....25

2.7.Коэффициенты корреляции (Процедура CORRELATE)………………….25

2.7.1.Парная корреляция (Bivariate)………………………………………………26

2.7.2.Частная корреляция (Partial)……………………………………………….27

2.8.Параметрические методы – сравнение средних

(Процедура COMPARE MEANS) …………………...……………….……27

2.8.1.Одновыборочный T-тест (One-sample t-test)……………….………..…....28

2.8.2.Двухвыборочный T-тест (Independent-samples t-test)…………….…..…..29

2.8.3.Однофакторный дисперсионный анализ – сравнение средних

вn-группах (One-way ANOVA)………………………………………...…….31

2.9. Непараметрические тесты (Процедура NONPARAMETRIC TESTS)……36

2.9.1.Одновыборочный тест Хи-квадрат (Chi-square test)…….….…..……..36

3

2.9.2.Тест, основанный на биномиальном распределении (Binomial test)…....36

2.9.3.Двухвыборочный тест Манна-Уитни для несвязанных выборок

(2-independent samples test)……………………………………………........37

2.9.4. Двухвыборочный тест Колмогорова-Смирнова (2-independent

samples test)………………………………………………………………... .38

2.9.5.Тест медиан для k-независимых выборок (k-independent samples test/Median)……………………………………………………..………..….38

2.9.6.Однофакторный дисперсионный анализ – Тест Краскела-Уоллиса

(Kruskal-Wallis H)………………………………………………………..…..39

2.9.7.Двухвыборочный критерий знаков для 2-х связанных выборок (2-related samples/ Sign)………………………………………………………………...40

2.9.8.Двухвыборочный знаково-ранговый критерий Вилкоксона для 2-х

связанных выборок(2-related samples/ Wilcoxon)…………………………..41

2.9.9.Ранговый дисперсионный анализ – критерий Фридмана для k-связанных выборок (k-related samples/ Friedman)…………………………………..….41

2.10.Простая линейная регрессия (Процедура REGRESSION/ LINEAR) ……42

2.11.Факторный анализ/ Метод главных компонент (Процедура DATA REDUCTION/ FACTOR/ PRINCIPAL COMPONENTS)………………….44

2.12.Иерархический кластерный анализ (Процедура CLASSIFY/ HIERARCHICAL CLUSTER)……………………………………………….48

2.13.Быстрый кластерный анализ (Процедура CLASSIFY/ K-means)………...50

2.14.Справочные и вспомогательные таблицы………………………………....54

2.15.Полезные опции в процедуре регрессионного анализа…………………...55

2.16.Полезные опции в процедуре факторного анализа…………………….….56

2.17.Сводная таблица различий методов кластерного анализа……………..…58

Литература Список основной литературы… ………………………………………..….. .....59

Рекомендуемые Интернет-ресурсы…………………………………….…...…..59

4

ВВЕДЕНИЕ

Дисциплина «Количественные методы социологического исследования» является базовой дисциплиной в профессиональной подготовке студентовсоциологов. Она выступает в качестве теоретической базы для дальнейшей профессиональной специализации студентов. Освоение данной дисциплины создает основу для дальнейшего самостоятельного постижения теоретического социологического знания, а также для проведения эмпирических научных исследований.

Цель и задачи дисциплины «Количественные методы социологического исследования» состоят в расширении и углублении знаний студентов в области анализа социологических данных с применением специализированного статистического пакета SPSS, закреплении навыков работы с первичными данными и проведения вторичного анализа социологической информации, а также формировании профессиональных компетенций, связанных с особенностями социологического анализа данных.

Дисциплина «Количественные методы социологического исследования» читается на кафедре социологии, политологии и психологии. Дисциплина осваивается во втором семестре 3 курса бакалавриата и рассчитана на 72 часа, из них лекционные занятия – 18 часов, семинарские занятия – 34 часов, самостоятельная работа студентов – 20 часов. Освоение курса предполагает контроль знаний посредством сдачи зачета.

Учебно-методическое пособие предназначено для организации работы студентов при подготовке к семинарским занятиям и самостоятельной работы студентов.

В учебно-методическом пособии представлен список литературы, который поможет в освоении курса. В нем отражена литература, имеющаяся в библиотечном фонде университета, а также электронно-библиотечных системах

IPRbooks и Ibooks.

1. Цели и задачи дисциплины

Расширение и углубление знаний студентов в области анализа социологических данных с применением специализированного статистического пакета SPSS, закрепление навыков работы с первичными данными и проведения вторичного анализа социологической информации, а также формирование профессиональных компетенций, связанных с особенностями социологического анализа данных.

2. Место дисциплины в структуре основной образовательной программы

Дисциплина относится к базовой части профессионального цикла (Б3.Б.). Шифр дисциплины в рабочем учебном плане – Б3.Б.4.3.

Дисциплина является продолжением курса «Методы прикладной статистики для социологов», дополняя знания студентов, полученные в процессе

5

изучения дисциплин, посвященных методологии и методам социологического исследования.

3.Требования к результатам освоения дисциплины

Врезультате освоения дисциплины студент должен: 1. Знать:

-ограничения и возможности применения отдельных методов для анализа разного типа социологических данных;

-статистические модели для анализа социологических данных;

-критерии и коэффициенты, необходимые для оценки связи между различными типами признаков.

2. Уметь:

-работать со статистическим пакетом SPSS;

-осуществлять выбор наиболее адекватного для цели исследования статистического метода;

-строить различные типы графиков и интерпретировать их;

-интерпретировать полученные результаты, исходя из решаемой исследовательской задачи, учитывая ограничения реализованных моделей.

3.Иметь навыки:

-написания письменных работ;

-оформления таблиц, графиков, диаграмм.

6

Часть 1. Темы и содержание семинарских (практических) занятий

Семинар 1. Структура пакета SPSS и правила организации таблицы «объект-признак» (2 часа)

Организация матрицы «объект-признак» в программе SPSS. Структура пакета SPSS. Правила создания макета опросного листа (анкеты). Особенности разработки макета для альтернативных и неальтернативных вопросов. Ввод данных. Идентификация ошибок кодирования и ввода. Презентация результатов обработки данных.

Задание

1.Придумайте 5-6 вопросов анкеты. Вопросы должны быть как альтернативные, так и неальтернативные. Кроме того, Ваши переменные должны быть измерены в разных шкалах.

2.Создайте макет Вашей анкеты в SPSS, учитывая количество вариантов ответов, а также тип переменной. Для неальтернативного признака используйте два вида кодирования.

3.Откройте массив «GOROD» и выберите одну альтернативную переменную (не выбирайте социально-демографические признаки). Постройте одномерное частотное распределение выбранного признака. Полученную таблицу переместите в Word и оформите по образцу из «Стимульного материала для организации семинарских занятий и самостоятельной работы студентов».

Семинар 2. Одномерное частотное распределение (ОЧР) (2 часа)

ОЧР – первый этап анализа первичных данных. Особенности представления признаков, измеренных в разных шкалах. Статистики центральной тенденции. Возможности анализа кумулятивного процента. Процент опрошенных/процент ответивших. Изучение ошибок кодирования с помощью ОЧР.

Задание

1.Открыть массив gorod.sav, выбрать для проведения анализа любую номинальную или ранговую переменную. С помощью процедуры FREQUENCIES получить частотное распределение выбранного признака, а также возможные статистические средние тенденции. Описать полученные данные: дать содержательный комментарий на основе изучения процентного соотношения, статистик, графиков.

2.Из того же массива выбрать любую интервальную переменную. С помощью процедуры FREQUENCIES получить возможные меры средней тенденции и разброса, а также статистики симметричности распределения признака (факультативно).

3.Используя значения стандартных ошибок, рассчитать 95% и 99% доверительный интервал для среднего, коэффициенты скошенности и пико-

7

образности (факультативно). Проанализировать полученные результаты, описать особенности распределения признака (в частности, относительно нормального). Для наглядности стоит построить гистограмму распределения с наложением кривой нормального распределения (про-

цедура FREQUENCIES).

Внимание! Обратите внимание на «выбросы» и пропущенные значения. Используйте опцию для построения «ящичковых» диаграмм (BOXPLOT/Summaries of separate variables).

Семинар 3. Преобразование данных (2 часа)

Процедуры преобразования первичных данных. Создание переменной с помощью процедуры COMPUTE и COUNT. Интервалирование количественной переменной посредством процедуры RECODE.

Задание

1.Пользуясь командами COMPUTE и IF построить переменную «Life – жизненная позиция» со следующими значениями: 1 – «оптимист по жизни», 2 – «терпеливый», 3 – «пессимист». Постарайтесь получить непустые и интересные типы. Используйте в качестве критериев для типологии несколько признаков. Получить диаграмму распределения по переменной LIFE (GRAPH/HISTOGRAM), а также диаграмму, на которой будет изображен средний возраст респондентов в полученных группах (GRAPH/BAR (SIMPLE)).

2.С помощью программы подсчитать год рождения респондента, а затем проинтервалировать переменную «возраст»: получить и прокомментировать качество полученной классификации возраста.

3.С помощью процедуры COUNT преобразовать неальтернативный признак в дихотомический вид. Можно использовать для тренировки переменную «современные проблемы» (V12_1, v12_2, V12_3).

4.Для выполнения этого задания следует открыть файл Childrem.sav.

Пользуясь меню (TRANSFORM/ COMPUTE) построить переменную LNV6, представляющую собой логарифм доходов: (LNV6 = Ln (V6)).Сравните распределение переменной «доход», «логарифм дохода» с кривой нормального распределения. С помощью уже известных процедур проанализируйте характеристики распределения.

Семинар 4. Таблицы сопряженности (часть 1) (2 часа)

Построение таблиц сопряженности в программе SPSS. Представление данных в ячейках таблицы (абсолютные значения, процент по столбцу/строке/от общего числа ответивших). Первый уровень анализа таблиц сопряженности. Правила презентации данных.

8

Задание

1.С помощью процедуры RECODE на основе переменной «возраст» построить переменную «возрастные группы». Проверить наполненность групп. Описать полученное распределение.

2.Построить частотное распределение объектов по уровню образования (проверить на наличие ошибок кодировки, при необходимости – исключить их). Проанализировать наполненность групп с разным уровнем образования. Описать полученное распределение.

3.Подготовить для дальнейшего анализа признак «отношение к будущему» (v7). Проверить на наличие ошибок кодировки. Построить новый признак «отношение к будущему_1», объединив сходные по смыслу подсказки исходной переменной. Описать полученное распределение.

4.Построить таблицы сопряженности признака «уровень обобщенного доверия» (v11) с переменными «уровень образования», «возрастная группа» и «отношение к будущему_1». Решить вопрос о наиболее целесообразном представлении данных в таблице. Проанализировать наполненность отдельных клеток, при необходимости трансформировать признаки. Описать полученные таблицы сопряженности.

Семинар 5. Таблицы сопряженности (часть 2) (2 часа)

Статистики ячейки. Задание расчета стандартизированного остатка. Обсуждение возможностей анализа статистик для анализа взаимосвязи признаков ТС. Изучение взаимосвязи с помощью критерия «Хи-квадрат», а также коэффициента Крамера. Логика представления результатов анализа с помощью ТС: описательные статистики, особенности взаимосвязи признаков с учетом стандартизированных остатков.

Задание

1.Используйте таблицу сопряженности, построенную на прошлом семинаре, чтобы проверить: существует ли связь между уровнем обобщенного доверия и обозначенными выше социально-демографическими характеристиками, а также уровнем оптимизма своего будущего. С какими из включенных в анализ признаков уровень доверия связан более всего? Прокомментируйте полученные результаты.

2.Проанализируйте в каждой из таблиц Z-статистики (стандартизованные остатки) и свяжите Ваши выводы со своими статистиками «Хиквадрат». Какие именно связи в таблице формируют общую связь между признаками?

3.Изучите взаимосвязь пар признаков с помощью критерия «Хиквадрат» (не забывайте про ограничения!!!). Выделите те пары признаков, в которых наблюдается статистически значимая связь. Опираясь на коэффициенты Крамера, ранжируйте взаимосвязи по силе связи (какие признаки в большей степени связаны с демонстрируемым уровнем обобщенного доверия).

9

4.Обобщите всю полученную информацию, сформулируйте общий вывод.

Семинар 6. Работа с массивами данных (2 часа)

Объединение массивов данных. Отбор случаев (объектов) по выбранным условиям. Взвешивание данных как один из способов «ремонта» выборки.

Задание

1.С помощью команды AGGREGATE создать новый файл на основе исходного GOROD. Для этого, подготовить исходные переменные V3, V2,V9,V10_1, V10_2 к агрегированию (исключить ошибки кодировки). В качестве группирующей переменной выступает признак «район проживания» (V02).

2.В меню DATA/AGGREGATE в окно BREAK Var. поместить группирующий признак (район), а в окно AGGREGATE Var. – остальные признаки. Затем необходимо определить каким образом будут трансформированы исходные признаки для включения в новый массив. Для признака «возраст» поставьте галочку напротив MEAN – в новом файле возраст будет представлен как средний возраст в районе. «Уровень жизни» необходимо трансформировать в долю людей, достаточно хорошо оценивающих свой жизненный уровень (подсказки 1 и 2), для этого нужно поставить галочку в окне FRACTION/Inside 1 – 2. Аналогично для признаков «уверенность в стабильности работы» и «уверенность в правовой защищенности». Для того чтобы в новом файле появилась переменная «доля людей, имеющих высшее образование», необходимо выбрать опцию FRAСTION/Аbove (3), где «3» - это среднетехническое образование. Помните: для того, чтобы задать способ агрегирования признака необходимо его выделить. В итоге Вы получите новый агрегированный файл с десятью объектами – районами и их характеристиками. Файл сохраняется в той же директории, что и исходный, если иное не было задано. Для дальнейшей работы необходимо назвать новые признаки.

3.Известно, что распределение жителей города по районам следующее: Кировский (11,9%), Заельцовский (9,7%), Ленинский (19,2%), Калининский (12,2%), Первомайский (5%), Железнодорожный (4,4%), Дзержинский (11%), Советский (9,2%), Центральный (5,1%) и Октябрьский (12,4%). Необходимо произвести ремонт выборки с учетом структуры по районам, то есть добиться репрезентативности выборки по данному признаку. Первый шаг – рассчитайте весовые коэффициенты, второй шаг – с помощью процедуры COMPUTE/ IF создайте признак «вес» – поставьте в соответствие каждому району его весовой коэффициент. Затем произведите взвешивание массива (WEIGHT cases/ weight cases by). Помните, что особенностью программы является то, что процедура взвешивания производится по одному признаку,

10