- •Первое знакомство с spss Запуск программы
- •Создание рабочего каталога
- •Окна программы
- •Главное окно
- •Структура файла данных
- •Имя переменной
- •Тип переменной
- •Дробная часть числа
- •Ширина переменной
- •Метки переменных
- •Метки значений переменных
- •Пропуски
- •Столбцы
- •Выравнивание
- •Шкала измерения
- •Ввод данных
- •Вставка ячеек
- •Поиск данных
- •Пример файла данных
- •Управление данными
- •Знакомство с возможностями управления данными
- •Получение сводки по данным
- •Обработка пропущенных значений
- •Преобразование данных
- •Ранжирование
- •Перекодировка в новую переменную
- •Перекодировка существующей переменной
- •Выбор объектов для анализа
- •Сортировка объектов
- •Объединение данных разных файлов
- •Печать результатов и выход из программы
- •Диаграммы
- •Графика в программе spss
- •Редактирование графиков и диаграмм
- •Частоты
- •Пошаговые алгоритмы вычислений
- •Столбиковые диаграммы
- •Гистограммы
- •Описательные статистики и процентили
- •Описательные статистики
- •Пошаговый алгоритм вычислений
- •Критерий независимости хи-квадрат
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Терминология, используемая при выводе
- •Корреляции
- •Пошаговые алгоритмы вычислений
- •Представление результатов
- •Средние значения
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Сравнение двух средних и t-критерий
- •Уровень значимости
- •Пошаговые алгоритмы вычислений
- •Применение t-критерия для независимых выборок
- •Применение t-критерия для зависимых выборок
- •Применение t-критерия для одной выборки
- •Представление результатов
- •Результаты применения t-критерия для независимых выборок
- •Результаты применения t-критерия для зависимых выборок
- •Результаты применения t-критерия для одной выборки
- •Терминология, используемая при выводе
Терминология, используемая при выводе
Трактовка терминов, используемых программой в окне вывода, дана далее.
► Наблюдаемая частота (Count) - верхнее из чисел, приведенных в каждой ячейке, равное количеству объектов в соответствующей градации.
► Ожидаемая частота (Expected Count) - среднее из чисел, приведенных в каждой ячейке, равное количеству объектов в соответствующей градации, вычислен-ное в предположении, что переменные, входящие в таблицу сопряженности, являются независимыми.
► Остаток (Residual) - разность между наблюдаемой и ожидаемой частотами.
► Всего (Total) - суммарное число объектов в каждой строке (42 - для женщин, 21 - для мужчин) или в каждом столбце (33 - спорт, 30 - искусство).
► Хи-квадрат Пирсона (Pearson Chi-Square) и С поправкой на непрерывность (Continuity Correction) - два варианта критерия - При больших значениях N эти коэффициенты практически равны.
► Значение (Value) - для критерия значение тем больше, чем больше зависимость между переменными (как в нашем примере). Значения, близкие к 0, свидетельствуют о независимости переменных.
► Степени свободы (df) - произведение количества градаций переменных, уменьшенных на 1. Для дайной таблицы сопряженности число степеней свободы равно
(2-1)х(2-1)=1.
► Асимптотическая значимость (Asymp. Sig.) - мера случайности связи, или р-уровень значимости, то есть вероятность того, что связь является случайной. Чем меньше эта величина, тем выше статистическая значимость (достоверность) связи.
► Линейная связь между переменными (Linear-by-linear Association) - статистический критерий, определяющий степень корреляции между переменными. Чаще всего результаты этого теста являются бессмысленными, поскольку порядок уровней переменных не имеет логической интерпретации. К примеру, нет смысла говорить об упорядоченной структуре хобби. Тем не менее, если бы одной из переменных был уровень дохода, упорядоченный по возрастанию, количественная оценка корреляции несла бы вполне определенную смысловую нагрузку.
► Минимальная ожидаемая частота (Minimum expected count) - смысл этого значения в полной мере раскрывается его названием. В рассматриваемой таблице сопряженности минимальная ожидаемая частота равна 10 - для юношей, увлекающихся искусством.
► Значение (Nominal by Phi) - коэффициент, являющийся мерой связи двух "переменных и вычисляющийся по формуле Значение =-0,472 показывает умеренную связь между двумя переменными.
► Значение V Крамера (Nominal Cramer's V) - как и коэффициент , этот коэффициент является мерой связи между двумя переменными, однако отличается тем, что всегда принимает значения от 0 до 1.
► Приблизительная значимость (Approx. sig.) - как и для критерия , является мерой значимости вычисленного значения. Значимость, равная 0,000 (как в нашем примере), говорит о высокой статистической значимости связи.
Корреляции
Для вычисления корреляций между данными в программе SPSS используются команды подменю Корреляция (Correlate) меню Анализ (Analyze). Корреляция представляет собой величину, заключенную в пределах от -1 до +1, и обозначается буквой r. Понятия корреляция и двумерная корреляция часто употребляются как синонимы; последнее означает «корреляция между двумя переменными» и подчеркивает, что рассматривается именно двухмерное соотношение. Основной коэффициент корреляции r Пирсона предназначен для оценки связи между двумя переменными, измеренными в метрической шкале, распределение которых соответствует нормальному. Несмотря на то, что величина r рассчитывается в предположении, что значения обеих переменных распределены по нормальному закону, формула для ее вычисления дает достаточно точные результаты и в случаях аномальных распределений, а также в случаях, когда одна из переменных является дискретной. Для распределений, не являющихся нормальными, предпочтительнее пользоваться ранговыми коэффициентами корреляции Спирмена или Кендалла. Команды подменю Корреляция (Correlate) позволяют вычислить как коэффициент Пирсона (Pearson), так и коэффициенты Спирмена (Spearman) и Кендалла (Kendall's tau-b). Существуют и другие коэффициенты корреляции, применяющиеся для самых разных типов данных.