- •Первое знакомство с spss Запуск программы
- •Создание рабочего каталога
- •Окна программы
- •Главное окно
- •Структура файла данных
- •Имя переменной
- •Тип переменной
- •Дробная часть числа
- •Ширина переменной
- •Метки переменных
- •Метки значений переменных
- •Пропуски
- •Столбцы
- •Выравнивание
- •Шкала измерения
- •Ввод данных
- •Вставка ячеек
- •Поиск данных
- •Пример файла данных
- •Управление данными
- •Знакомство с возможностями управления данными
- •Получение сводки по данным
- •Обработка пропущенных значений
- •Преобразование данных
- •Ранжирование
- •Перекодировка в новую переменную
- •Перекодировка существующей переменной
- •Выбор объектов для анализа
- •Сортировка объектов
- •Объединение данных разных файлов
- •Печать результатов и выход из программы
- •Диаграммы
- •Графика в программе spss
- •Редактирование графиков и диаграмм
- •Частоты
- •Пошаговые алгоритмы вычислений
- •Столбиковые диаграммы
- •Гистограммы
- •Описательные статистики и процентили
- •Описательные статистики
- •Пошаговый алгоритм вычислений
- •Критерий независимости хи-квадрат
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Терминология, используемая при выводе
- •Корреляции
- •Пошаговые алгоритмы вычислений
- •Представление результатов
- •Средние значения
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Сравнение двух средних и t-критерий
- •Уровень значимости
- •Пошаговые алгоритмы вычислений
- •Применение t-критерия для независимых выборок
- •Применение t-критерия для зависимых выборок
- •Применение t-критерия для одной выборки
- •Представление результатов
- •Результаты применения t-критерия для независимых выборок
- •Результаты применения t-критерия для зависимых выборок
- •Результаты применения t-критерия для одной выборки
- •Терминология, используемая при выводе
Критерий независимости хи-квадрат
Помимо частот (или наблюдаемых величин) SPSS может вычислять ожидаемые значения для каждой ячейки таблицы. Ожидаемое значение вычисляется в предположении, что две номинативные переменные независимы друг от друга. Рассмотрим простой пример. Пусть в комнате находится 100 человек, из которых 30 являются мужчинами, а 70 - женщинами. Если известно, что из этих 100 человек 10 увлекаются искусством, то в случае, если увлечение не зависит от пола, мы будем ожидать, что из 10 увлекающихся искусством 3 являются мужчинами, а 7 - женщинами. Сопоставляя эти ожидаемые частоты с наблюдаемыми частотами, мы можем судить о том, действительно ли два номинативных признака не связаны. Чем больше расхождение наблюдаемых и ожидаемых частот, тем, очевидно, два признака сильнее связаны друг с другом. Целью применения критерия независимости и является установление степени соответствия между наблюдаемыми и ожидаемыми значениями ячеек.
В основе критерия независимости лежит вычисление величины определяемой как сумма отношений суммы квадратов отклонений наблюдаемой величины от ожидаемой величины . к ожидаемой величине каждой ячейки:
Как можно видеть из формулы, при больших отклонениях от величина также становится большой. Вместе с вычисляется р-уровень значимости. При р > 0,05 считается, что различия между наблюдаемыми и ожидаемыми значениями незначительны. В противном случае предположение о независимости двух номинативных переменных отклоняется и делается вывод о том, что две классификации (переменные) зависят друг от друга. Более подробные описания величии, связанных с критерием , вы можете найти в разделе «Представление результатов» этой главы.
Зачастую величина ошибочно воспринимается исследователями как величина силы связи между переменными. Однако это не так, поскольку в значительной степени определяется числом переменных таблицы сопряженности и размером выборки. Таким образом, сравнение двух значений , полученных при разных условиях, становится бессмысленным. По этой причине Пирсон (Pearson) предложил коэффициент «фи», получаемый извлечением квадратного корня из отношения к размеру выборки N. Целью введения новой величины было получения наглядной интерпретации связи между переменными в виде коэффициента, лежащего в пределах от 0 до 1 и принимающего нулевое значение для независимых переменных и единичное значение для строго связанных переменных. Однако цель не была достигнута полностью: если одна из переменных таблицы сопряженности имеет более двух градаций, значение «фи» может превышать 1. Крамеру (Cramer) удалось исправить последний недостаток путем введения коэффициента V. Этот коэффициент всегда принимает значения от 0 до 1 и служит характеристикой силы связи между переменными.
Пошаговый алгоритм вычислений
Для применения команды Таблицы сопряженности (Crosstabs) мы снова обратимся к файлу ex01.sav. Число объектов, или наборов значений, в этом файле равно 100, поэтому программа будет считать N равным 100. Мы создадим несколько таблиц сопряженности, а также применим критерий для определения зависимости переменных пол и хобби.
Шаг 1 В меню Анализ (Analyze) выберите команду Описательные статистики ► Таблицы сопряженности (Descriptive Statistics ► Crosstabs). На экране появится диалоговое окно Таблицы сопряженности (Crosstabs), показанное на рис. 8.1.
Рис. 8.1. Диалоговое окно Crosstabs
С помощью диалогового окна Таблицы сопряженности (Crosstabs) можно задать конфигурацию будущей таблицы сопряженности. Главное, что требуется сделать в этом окне, - это выбрать переменные в исходном списке и переместить их в целевые списки Строки (Row(s)) и Столбцы (Column(s)), Тем самым вы определите, градации какой переменной будут составлять строки таблицы, а какой - столбцы.
Поместите в список Строки (Row(s)) переменную пол, в список Столбцы (Column(s)) - переменную хобби и щелкните затем па кнопке ОК, вы создадите таблицу с двумя строками и тремя столбцами.
Самый нижний список диалогового окна позволяет построить таблицу сопряженности для трех и более переменных. Если бы мы захотели подключить к таблице, содержащей переменные пол и хобби, еще и переменную класс, последнюю следовало бы поместить в нижний список при помощи нижней кнопки со стрелкой. В результате вы увидели бы на экране таблицу, разбитую на три части, каждая из которых представляла бы собой таблицу сопряженности пол-хобби для соответствующего значения переменной класс (1, 2 и 3). Кнопки Предыдущий (Previous) и Следующий (Next) слева и справа от метки Слой 1 из 1 (Layer 1 of 1) предназначены для случаев, когда необходимо построить таблицы сопряженности с более чем одной дополнительной переменной. Например, если бы вам понадобилось составить таблицу сопряженности с переменными пол, хобби, класс и вуз, то в нижнем списке нужно было бы указать две переменные класс и вуз, а в итоге программой была бы сгенерирована общая таблица сопряженности, включающая в себя 3 таблицы пол-хобби для каждой градации переменной класс и 4 таблицы пол-хобби для каждого значения переменной вуз.
В следующем примере мы создадим таблицу сопряженности пол-хобби-класс.
Шаг 2 Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)), класс в список дополнительных переменных под меткой Слой 1 из 1 (Layer1 of 1). Щелкните на кнопке ОК, чтобы открыть окно вывода.
Как правило, исследователи редко ограничиваются вычислением частот, предпочитая дополнять процедуру заданием разнообразных параметров. При щелчке на кнопке Ячейки (Cells) открывается диалоговое окно Таблицы сопряженности: вывод в ячейках (Crosstabs: Cell Display), представленное на рис. 8.2. Это окно позволяет управлять информацией в ячейках. По умолчанию флажок Наблюдаемые (Observed) в группе Значения (Counts) установлен, поскольку наблюдаемые частоты являются главной вычисляемой величиной в любой таблице сопряженности. Установка флажка Ожидаемые (Expected) позволит вычислять в ячейках и ожидаемые частоты. Остальные параметры задаются в зависимости от целей и предпочтений конкретного исследователя.
Рис. 8.2. Диалоговое окно Crosstabs: Cell Display
Ниже описано назначение некоторых флажков, управляющих содержимым ячеек в диалоговом окне Таблицы сопряженности: вывод в ячейках (Crosstabs: Cell Display).
► При установке флажка Наблюдаемые (Observed) в группе Значения (Counts) отображается реальное количество объектов, соответствующее каждой ячейке.
► При установке флажка Ожидаемые (Expected) в группе Значения (Counts) отображается значение ожидаемой частоты для каждой ячейки, вычисленное в предположении, что соответствующие переменные являются независимыми.
► При установке флажка Строки (Row) в группе Проценты (Percentages) отображается частота ячейки в процентах от суммарной частоты строки, в которой она находится.
► При установке флажка Столбцы (Column) в группе Проценты (Percentages) отображается частота ячейки в процентах от суммарной частоты столбца, в котором она находится.
► При установке флажка Всего (Total) в группе Проценты (Percentages) отображается частота ячейки в процентах от суммарной частоты всей таблицы сопряженности.
►При установке флажка Нестандартизированные (Unstandardized) в группе Остатки (Residuals) отображается разность между наблюдаемой и ожидаемой частотами.
В следующем примере мы создадим таблицу сопряженности пол-хобби, в ячейки которой включим наблюдаемые и ожидаемые частоты, процент от суммы и нестандартизированный остаток.
Обратите внимание, что мы не устанавливали флажок Наблюдаемые (Observed), поскольку он уже установлен программой по умолчанию.
В приведенных примерах мы научились создавать таблицы сопряженности и заполнять их ячейки различными показателями. Как правило, на практике при создании таблиц сопряженности применяется критерий . Для настройки параметров анализа необходимо в диалоговом окне Таблицы сопряженности (Crosstabs) щелкнуть на кнопке Статистики (Statistics). В ответ программа откроет диалоговое окно Таблицы сопряженности: Статистики (Crosstabs: Statistics), представленное па рис. 8.3. В этом окне с помощью флажков можно выбрать желаемые статистические критерии и меры независимости и согласия распределений. В следующих примерах мы расскажем лишь о трех наиболее употребительных флажках: Хи-квадрат (Chi-square), . фи и V Крамера (Phi and Cramer's V) и Корреляции (Correlations). Как и в случае окна Ячейки (Cells), вам необходимо установить нужные флажки, а затем вернуться в диалоговое окно Таблицы сопряженности (Crosstabs) для завершения анализа.
Шаг 3 Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)). Щелкните на кнопке Ячейки (Cells) и установите флажки Ожидаемые (Expected), Всего (Total) и Нестандартизированные (Unstandardized). Щелкните па кнопке Продолжить (Continue), и ОК, чтобы открыть окно вывода.
Рис. 8.3. Диалоговое окно Crosstabs: Statistics
В следующем примере мы создадим таблицу сопряженности пол-хобби, в ячейки которой включим наблюдаемые и ожидаемые частоты, нестандартизированные остатки, применим критерий Х2 и вычислим коэффициенты фи и V Крамера. Анализ корреляций между переменными в данном случае не имеет смысла, так как они не являются количественными.
Шаг 4 Откройте диалоговое окно Таблицы сопряженности (Crosstabs) Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)).
Щелкните на кнопке Ячейки (Cells), чтобы открыть диалоговое окно Таблицы сопряженности: Ячейки (Crosstabs: Cell Display), и установите флажки Ожидаемые (Expected) и Нестандартизированные (Unstandardized). Щелкните на кнопке Продолжить (Continue).
Щелкните на кнопке Статистики (Statistics), чтобы открыть диалоговое окно Таблицы сопряженности: Статистики (Crosstabs: Statistics), и установите флажки Хи-квадрат (Chi-square) и Фи и V Крамера (Phi and Cramer's V). Щелкните па кнопке Продолжить (Continue).
Щелкните на кнопке ОК, чтобы открыть окно вывода.
Зачастую приходится строить таблицы сопряженности и применять критерий не для всей выборки объектов, а только для их части. Например, может возникнуть необходимость в создании таблицы пол-хобби только для двух из трех градаций переменной хобби: спорт и искусство. Это делается следующим образом. После выбора переменных для построения перекрестной таблицы, определения набора величии, вычисляемых для каждой ячейки, и задания желаемых статистик, в меню Данные (Data) выберите команду Выбор объектов (Select Cases). На экране появится одноименное диалоговое окно, в котором в группе Выбор (Select) следует установить переключатель Если удовлетворяет условию (If condition is satisfied), а затем щелкнуть на расположенной рядом кнопке Если (If). Откроется диалоговое окно Выбор объектов: Если (Select Cases: If). В данном случае пас будет интересовать выбор уровней 1 и 3 переменной хобби. Для исключения уровня 2 из анализа выделите переменную хобби в исходном списке, введите ее в условие отбора, щелкнув на кнопке с направленной вправо стрелкой, на панели калькулятора щелкните на кнопке ~= (не равно) и введите в условие отбора число 2. После этого щелкните сначала на кнопке Продолжить (Continue), а затем - на кнопке ОК, чтобы вернуться в диалоговое окно Таблицы сопряженности (Crosstabs). Наконец, щелчок на кнопке ОК в окне Таблицы сопряженности (Crosstabs) приведет к построению таблицы сопряженности с двумя выбранными градациями переменной хобби и двумя градациями переменной пол.
Реализуем описанный алгоритм в виде пошаговых инструкций.
Шаг 5: Откройте диалоговое окно Таблицы сопряженности (Crosstabs) Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)).
Щелкните на кнопке Ячейки (Cells), чтобы открыть диалоговое окно и установите флажки Ожидаемые (Expected) и Нестандартизированные (Unstandardized). Щелкните па кнопке Продолжить (Continue).
Щелкните на кнопке Статистики (Statistics) и установите флажки Хи-квадрат (Chi-square) и и V Крамера (Phi and Cramer's V). Щелкните на кнопке Продолжить (Continue).
В меню Данные (Data) выберите команду Отобрать наблюдения (Select Cases), чтобы открыть одноименное диалоговое окно, установите переключатель Если удовлетворяет условию (If condition is satisfied) и щелкните на расположенной рядом кнопке Если (If), открыв диалоговое окно Выбор объектов: Если (Select Cases: If).
В списке доступных переменных щелкните сначала на переменной хобби, чтобы выделить ее, а затем - на кнопке с направленной вправо стрелкой, чтобы ввести переменную в условие отбора. Дополните условие отбора оператором ~= (не равно) и числом 2, используя панель калькулятора и клавиатуру, и щелкните на кнопке Продолжить (Continue), на кнопке ОК.
Щелкните на кнопке ОК, чтобы открыть окно вывода.