Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛП SPSS.doc
Скачиваний:
21
Добавлен:
23.09.2019
Размер:
2.46 Mб
Скачать

Критерий независимости хи-квадрат

Помимо частот (или наблюдаемых величин) SPSS может вычислять ожидаемые значения для каждой ячейки таблицы. Ожидаемое значение вычисляется в предположении, что две номинативные переменные независимы друг от друга. Рас­смотрим простой пример. Пусть в комнате находится 100 человек, из которых 30 являются мужчинами, а 70 - женщинами. Если известно, что из этих 100 чело­век 10 увлекаются искусством, то в случае, если увлечение не зависит от пола, мы будем ожидать, что из 10 увлекающихся искусством 3 являются мужчинами, а 7 - женщинами. Сопоставляя эти ожидаемые частоты с наблюдаемыми часто­тами, мы можем судить о том, действительно ли два номинативных признака не связаны. Чем больше расхождение наблюдаемых и ожидаемых частот, тем, очевид­но, два признака сильнее связаны друг с другом. Целью применения критерия независимости и является установление степени соответствия между наблю­даемыми и ожидаемыми значениями ячеек.

В основе критерия независимости лежит вычисление величины определяе­мой как сумма отношений суммы квадратов отклонений наблюдаемой величины от ожидаемой величины . к ожидаемой величине каждой ячейки:

Как можно видеть из формулы, при больших отклонениях от величина также становится большой. Вместе с вычисляется р-уровень значимости. При р > 0,05 считается, что различия между наблюдаемыми и ожидаемыми значе­ниями незначительны. В противном случае предположение о независимости двух номинативных переменных отклоняется и делается вывод о том, что две классификации (переменные) зависят друг от друга. Более подробные описания величии, связанных с критерием , вы можете найти в разделе «Представление результатов» этой главы.

Зачастую величина ошибочно воспринимается исследователями как величина силы связи между переменными. Однако это не так, поскольку в значительной степени определяется числом переменных таблицы сопряженности и размером выборки. Таким образом, сравнение двух значений , полученных при разных условиях, становится бессмысленным. По этой причине Пирсон (Pearson) пред­ложил коэффициент «фи», получаемый извлечением квадратного корня из отно­шения к размеру выборки N. Целью введения новой величины было получе­ния наглядной интерпретации связи между переменными в виде коэффициента, лежащего в пределах от 0 до 1 и принимающего нулевое значение для незави­симых переменных и единичное значение для строго связанных переменных. Однако цель не была достигнута полностью: если одна из переменных таблицы сопряженности имеет более двух градаций, значение «фи» может превышать 1. Крамеру (Cramer) удалось исправить последний недостаток путем введения коэффициента V. Этот коэффициент всегда принимает значения от 0 до 1 и служит характеристикой силы связи между переменными.

Пошаговый алгоритм вычислений

Для применения команды Таблицы сопряженности (Crosstabs) мы снова обратимся к файлу ex01.sav. Число объектов, или наборов значений, в этом файле равно 100, поэтому программа будет считать N равным 100. Мы создадим несколько таблиц со­пряженности, а также применим критерий для определения зависимости переменных пол и хобби.

Шаг 1 В меню Анализ (Analyze) выберите команду Описательные статистики ► Таблицы сопряженности (Descriptive Statistics ► Crosstabs). На экране появится диалоговое окно Таблицы сопряженности (Crosstabs), показанное на рис. 8.1.

Рис. 8.1. Диалоговое окно Crosstabs

С помощью диалогового окна Таблицы сопряженности (Crosstabs) можно задать конфигурацию будущей таблицы сопряженности. Главное, что требуется сделать в этом окне, - это выбрать переменные в исходном списке и пе­реместить их в целевые списки Строки (Row(s)) и Столбцы (Column(s)), Тем самым вы определите, градации какой переменной будут составлять строки таблицы, а какой - столбцы.

Поместите в список Строки (Row(s)) переменную пол, в список Столбцы (Column(s)) - переменную хобби и щелкните затем па кнопке ОК, вы создадите таблицу с двумя строками и тремя столбцами.

Самый нижний список диалогового окна позволяет построить таблицу сопряженности для трех и более переменных. Если бы мы захотели подключить к таблице, содержащей переменные пол и хобби, еще и переменную класс, последнюю следовало бы поместить в нижний список при помощи нижней кноп­ки со стрелкой. В результате вы увидели бы на экране таблицу, разбитую на три части, каждая из которых представляла бы собой таблицу сопряженности пол-хобби для соответствующего значения переменной класс (1, 2 и 3). Кнопки Предыдущий (Previous) и Следующий (Next) слева и справа от метки Слой 1 из 1 (Layer 1 of 1) предназначены для случаев, когда необходимо построить таблицы сопряженности с более чем одной дополнительной переменной. Например, если бы вам понадобилось составить таблицу сопряженности с переменными пол, хобби, класс и вуз, то в нижнем списке нужно было бы указать две переменные класс и вуз, а в итоге программой была бы сгенерирована общая таблица сопряженно­сти, включающая в себя 3 таблицы пол-хобби для каждой градации переменной класс и 4 таблицы пол-хобби для каждого значения переменной вуз.

В следующем примере мы создадим таблицу сопряженности пол-хобби-класс.

Шаг 2 Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)), класс в список дополнительных переменных под меткой Слой 1 из 1 (Layer1 of 1). Щелкните на кнопке ОК, чтобы открыть окно вывода.

Как правило, исследователи редко ограничиваются вычислением частот, предпо­читая дополнять процедуру заданием разнообразных параметров. При щелчке на кнопке Ячейки (Cells) открывается диалоговое окно Таблицы сопряженности: вывод в ячейках (Crosstabs: Cell Display), представленное на рис. 8.2. Это окно позволяет управ­лять информацией в ячейках. По умолчанию флажок Наблюдаемые (Observed) в группе Значения (Counts) установлен, поскольку наблюдаемые частоты являют­ся главной вычисляемой величиной в любой таблице сопряженности. Установка флажка Ожидаемые (Expected) позволит вычислять в ячейках и ожидаемые час­тоты. Остальные параметры задаются в зависимости от целей и предпочтений конкретного исследователя.

Рис. 8.2. Диалоговое окно Crosstabs: Cell Display

Ниже описано назначение некоторых флажков, управляющих содержимым яче­ек в диалоговом окне Таблицы сопряженности: вывод в ячейках (Crosstabs: Cell Display).

► При установке флажка Наблюдаемые (Observed) в группе Значения (Counts) отображается реальное количество объектов, соответствующее каждой ячейке.

► При установке флажка Ожидаемые (Expected) в группе Значения (Counts) ото­бражается значение ожидаемой частоты для каждой ячейки, вычисленное в предположении, что соответствующие переменные являются независимыми.

► При установке флажка Строки (Row) в группе Проценты (Percentages) отобра­жается частота ячейки в процентах от суммарной частоты строки, в которой она находится.

► При установке флажка Столбцы (Column) в группе Проценты (Percentages) ото­бражается частота ячейки в процентах от суммарной частоты столбца, в кото­ром она находится.

► При установке флажка Всего (Total) в группе Проценты (Percentages) отобра­жается частота ячейки в процентах от суммарной частоты всей таблицы со­пряженности.

►При установке флажка Нестандартизированные (Unstandardized) в группе Остатки (Residuals) отображается разность между наблюдаемой и ожидаемой частотами.

В следующем примере мы создадим таблицу сопряженности пол-хобби, в ячейки которой включим наблюдаемые и ожидаемые частоты, процент от суммы и нестандартизированный остаток.

Обратите внимание, что мы не устанавливали флажок Наблюдаемые (Observed), поскольку он уже установлен программой по умолчанию.

В приведенных примерах мы научились создавать таблицы сопряженности и за­полнять их ячейки различными показателями. Как правило, на практике при созда­нии таблиц сопряженности применяется критерий . Для настройки параметров анализа необходимо в диалоговом окне Таблицы сопряженности (Crosstabs) щелкнуть на кнопке Статистики (Statistics). В ответ программа откроет диалоговое окно Таблицы сопряженности: Статистики (Crosstabs: Statistics), представленное па рис. 8.3. В этом окне с помощью флажков можно выбрать желаемые статистические кри­терии и меры независимости и согласия распределений. В следующих примерах мы расскажем лишь о трех наиболее употребительных флажках: Хи-квадрат (Chi-square), . фи и V Крамера (Phi and Cramer's V) и Корреляции (Correlations). Как и в случае окна Ячейки (Cells), вам необходимо установить нужные флажки, а затем вернуться в диалоговое окно Таблицы сопряженности (Crosstabs) для завершения анализа.

Шаг 3 Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)). Щелкните на кнопке Ячейки (Cells) и установите флаж­ки Ожидаемые (Expected), Всего (Total) и Нестандартизированные (Unstandardized). Щелкните па кнопке Продолжить (Continue), и ОК, чтобы открыть окно вывода.

Рис. 8.3. Диалоговое окно Crosstabs: Statistics

В следующем примере мы создадим таблицу сопряженности пол-хобби, в ячей­ки которой включим наблюдаемые и ожидаемые частоты, нестандартизированные остатки, применим критерий Х2 и вычислим коэффициенты фи и V Крамера. Анализ корреляций между переменными в данном случае не имеет смысла, так как они не являются количественными.

Шаг 4 Откройте диалоговое окно Таблицы сопряженности (Crosstabs) Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)).

Щелкните на кнопке Ячейки (Cells), чтобы открыть диалоговое окно Таблицы сопряженности: Ячейки (Crosstabs: Cell Display), и установите флаж­ки Ожидаемые (Expected) и Нестандартизированные (Unstandardized). Щелкните на кнопке Продолжить (Continue).

Щелкните на кнопке Статистики (Statistics), чтобы открыть диалоговое окно Таблицы сопряженности: Статистики (Crosstabs: Statistics), и установи­те флажки Хи-квадрат (Chi-square) и Фи и V Крамера (Phi and Cramer's V). Щелкните па кнопке Продолжить (Continue).

Щелкните на кнопке ОК, чтобы открыть окно вывода.

Зачастую приходится строить таблицы сопряженности и применять критерий не для всей выборки объектов, а только для их части. Например, может возник­нуть необходимость в создании таблицы пол-хобби только для двух из трех гра­даций переменной хобби: спорт и искусство. Это делается следующим образом. После выбора переменных для построения перекрестной таблицы, определения набора величии, вычисляемых для каждой ячейки, и задания желаемых стати­стик, в меню Данные (Data) выберите команду Выбор объектов (Select Cases). На экране появится одноименное диалоговое окно, в котором в группе Выбор (Select) следует установить пере­ключатель Если удовлетворяет условию (If condition is satisfied), а затем щелк­нуть на расположенной рядом кнопке Если (If). Откроется диалоговое окно Выбор объектов: Если (Select Cases: If). В данном случае пас будет интересовать выбор уровней 1 и 3 переменной хобби. Для исключения уровня 2 из анализа выделите переменную хобби в исходном списке, введите ее в условие отбора, щелкнув на кнопке с направленной вправо стрелкой, на панели кальку­лятора щелкните на кнопке ~= (не равно) и введите в условие отбора число 2. После этого щелкните сначала на кнопке Продолжить (Continue), а затем - на кнопке ОК, чтобы вернуться в диалоговое окно Таблицы сопряженности (Crosstabs). Наконец, щелчок на кнопке ОК в окне Таблицы сопряженности (Crosstabs) приведет к построению таблицы сопряженности с двумя выбранными градациями переменной хобби и двумя градациями переменной пол.

Реализуем описанный алгоритм в виде пошаговых инструкций.

Шаг 5: Откройте диалоговое окно Таблицы сопряженности (Crosstabs) Переместите переменную пол, в список Строки (Row(s)), хобби в список Столбцы (Column(s)).

Щелкните на кнопке Ячейки (Cells), чтобы открыть диалоговое окно и установите флаж­ки Ожидаемые (Expected) и Нестандартизированные (Unstandardized). Щелкните па кнопке Продолжить (Continue).

Щелкните на кнопке Статистики (Statistics) и установи­те флажки Хи-квадрат (Chi-square) и и V Крамера (Phi and Cramer's V). Щелкните на кнопке Продолжить (Continue).

В меню Данные (Data) выберите команду Отобрать наблюдения (Select Cases), чтобы открыть одноименное диалоговое окно, установите переключа­тель Если удовлетворяет условию (If condition is satisfied) и щелкните на расположенной рядом кнопке Если (If), открыв диалоговое окно Выбор объектов: Если (Select Cases: If).

В списке доступных переменных щелкните сначала на переменной хобби, чтобы выделить ее, а затем - на кнопке с направленной вправо стрелкой, чтобы ввести переменную в условие отбора. Дополните условие отбора оператором ~= (не равно) и числом 2, используя панель калькулятора и клавиатуру, и щелкните на кнопке Продолжить (Continue), на кнопке ОК.

Щелкните на кнопке ОК, чтобы открыть окно вывода.