- •Первое знакомство с spss Запуск программы
- •Создание рабочего каталога
- •Окна программы
- •Главное окно
- •Структура файла данных
- •Имя переменной
- •Тип переменной
- •Дробная часть числа
- •Ширина переменной
- •Метки переменных
- •Метки значений переменных
- •Пропуски
- •Столбцы
- •Выравнивание
- •Шкала измерения
- •Ввод данных
- •Вставка ячеек
- •Поиск данных
- •Пример файла данных
- •Управление данными
- •Знакомство с возможностями управления данными
- •Получение сводки по данным
- •Обработка пропущенных значений
- •Преобразование данных
- •Ранжирование
- •Перекодировка в новую переменную
- •Перекодировка существующей переменной
- •Выбор объектов для анализа
- •Сортировка объектов
- •Объединение данных разных файлов
- •Печать результатов и выход из программы
- •Диаграммы
- •Графика в программе spss
- •Редактирование графиков и диаграмм
- •Частоты
- •Пошаговые алгоритмы вычислений
- •Столбиковые диаграммы
- •Гистограммы
- •Описательные статистики и процентили
- •Описательные статистики
- •Пошаговый алгоритм вычислений
- •Критерий независимости хи-квадрат
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Терминология, используемая при выводе
- •Корреляции
- •Пошаговые алгоритмы вычислений
- •Представление результатов
- •Средние значения
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Сравнение двух средних и t-критерий
- •Уровень значимости
- •Пошаговые алгоритмы вычислений
- •Применение t-критерия для независимых выборок
- •Применение t-критерия для зависимых выборок
- •Применение t-критерия для одной выборки
- •Представление результатов
- •Результаты применения t-критерия для независимых выборок
- •Результаты применения t-критерия для зависимых выборок
- •Результаты применения t-критерия для одной выборки
- •Терминология, используемая при выводе
Представление результатов
На рис. 8.4 приведены фрагменты выводимых результатов, сгенерированные программой после выполнения шага 4 и 5.
Первое, на что необходимо обратить внимание при интерпретации выводимых результатов, - это соотношение между наблюдаемыми (Count) и ожидаемыми (Expected count) частотами в каждой ячейке. Беглый взгляд на первую таблицу говорит о том, что эти величины заметно различаются. Как уже отмечалось, это различие характеризуется остатком, который рассчитывается как разность между наблюдаемой и ожидаемой величинами. При составлении таблицы сопряженности мы включили в каждую ячейку остаток (Residual), поэтому па самом деле вам нет необходимости самому сравнивать наблюдаемую величину с ожидаемой, чтобы оценить их соотношение. Итак, различие наблюдаемых и ожидаемых величин говорит о том, что переменные пол и хобби связаны друг с другом. Это подтверждается относительно большим значением критерия (14,032) и малым значением р-уровня (р<0,000), то есть высокой статистической значимостью. Как можно видеть, аналогичная картина наблюдается и с результатами остальных тестов на независимость.
Таблица сопряженности пол * хобби |
||||||
|
|
|
хобби |
Итого |
||
|
|
|
спорт |
компьютер |
искусство |
|
пол |
ЖЕН |
Частота |
15 |
19 |
27 |
61 |
Ожидаемая частота |
20,1 |
22,6 |
18,3 |
61,0 |
||
Остаток |
-5,1 |
-3,6 |
8,7 |
|
||
МУЖ |
Частота |
18 |
18 |
3 |
39 |
|
Ожидаемая частота |
12,9 |
14,4 |
11,7 |
39,0 |
||
Остаток |
5,1 |
3,6 |
-8,7 |
|
||
Итого |
Частота |
33 |
37 |
30 |
100 |
|
Ожидаемая частота |
33,0 |
37,0 |
30,0 |
100,0 |
Критерии хи-квадрат |
|||
|
Значение |
ст.св. |
Асимпт. значимость (2-стор.) |
Хи-квадрат Пирсона |
15,405a |
2 |
,000 |
Отношение правдоподобия |
17,504 |
2 |
,000 |
Линейно-линейная связь |
12,652 |
1 |
,000 |
Кол-во валидных наблюдений |
100 |
|
|
a. В 0 (,0%) ячейках ожидаемая частота меньше 5. Минимальная ожидаемая частота равна 11,70. |
Симметричные меры |
|||
|
|
Значение |
Прибл. значимость |
Номинальная по номинальной |
Фи |
,392 |
,000 |
V Крамера |
,392 |
,000 |
|
Кол-во валидных наблюдений |
100 |
|
Рис. 8.4. Фрагменты окна вывода после выполнения шага 56
Для таблиц сопряженности большой размерности следует помнить о проблеме малых значений частот. Малым считается значение ожидаемой частоты, меньшее 5. Предполагается, что если более 25 % ячеек таблицы сопряженности имеют малые ожидаемые значения частот, то вероятность ошибки -анализа очень высока. В этом случае необходимо исключать градации с малыми значениями частот или объединять градации.