- •Первое знакомство с spss Запуск программы
- •Создание рабочего каталога
- •Окна программы
- •Главное окно
- •Структура файла данных
- •Имя переменной
- •Тип переменной
- •Дробная часть числа
- •Ширина переменной
- •Метки переменных
- •Метки значений переменных
- •Пропуски
- •Столбцы
- •Выравнивание
- •Шкала измерения
- •Ввод данных
- •Вставка ячеек
- •Поиск данных
- •Пример файла данных
- •Управление данными
- •Знакомство с возможностями управления данными
- •Получение сводки по данным
- •Обработка пропущенных значений
- •Преобразование данных
- •Ранжирование
- •Перекодировка в новую переменную
- •Перекодировка существующей переменной
- •Выбор объектов для анализа
- •Сортировка объектов
- •Объединение данных разных файлов
- •Печать результатов и выход из программы
- •Диаграммы
- •Графика в программе spss
- •Редактирование графиков и диаграмм
- •Частоты
- •Пошаговые алгоритмы вычислений
- •Столбиковые диаграммы
- •Гистограммы
- •Описательные статистики и процентили
- •Описательные статистики
- •Пошаговый алгоритм вычислений
- •Критерий независимости хи-квадрат
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Терминология, используемая при выводе
- •Корреляции
- •Пошаговые алгоритмы вычислений
- •Представление результатов
- •Средние значения
- •Пошаговый алгоритм вычислений
- •Представление результатов
- •Сравнение двух средних и t-критерий
- •Уровень значимости
- •Пошаговые алгоритмы вычислений
- •Применение t-критерия для независимых выборок
- •Применение t-критерия для зависимых выборок
- •Применение t-критерия для одной выборки
- •Представление результатов
- •Результаты применения t-критерия для независимых выборок
- •Результаты применения t-критерия для зависимых выборок
- •Результаты применения t-критерия для одной выборки
- •Терминология, используемая при выводе
Управление данными
Данное занятие посвящено вопросам эффективной работы с исходными данными. Описанные операции весьма полезны в большинстве случаев обработки и анализа данных, так как практически всегда существует необходимость в предварительной подготовке и преобразовании исходных данных. Поэтому изложенные рекомендации по форматированию данных помогут вам работать с программой гораздо свободнее.
Знакомство с возможностями управления данными
В процессе работы вам могут понадобиться агрегированные данные, то есть данные, являющиеся результатом некоторых действий над исходными данными файла. К примеру, для вашего исследования может представлять интерес среднее значение или сумма баллов по нескольким тестам для каждого учащегося, ранг каждого ученика по успеваемости и т. п. Иногда желательно упорядочить данные файла по какому-либо признаку, например по результатам выполнения какого-либо задания. Нередко возникает необходимость обработки не всех данных файла, а лишь их подмножества, выделяемого по определенным критериям (например, по полу, классу, успеваемости и пр.). Существует и обратная задача: если данные хранятся в нескольких небольших файлах, может возникнуть потребность в их объединении для последующего анализа.
Перечисленные проблемы указывают на то, что для регулярной аналитической работы недостаточно умения вводить данные и применять к ним статистические процедуры. Возникает задача эффективного управления данными. Способы решения этой задачи бывают весьма нетривиальными, и исчерпывающий рассказ о них не вполне соответствовал бы теме книги. Тем не менее представленного в этой главе материала вполне достаточно, чтобы научиться свободно манипулировать данными даже новичку.
Несмотря на то, что навыки управления данными приходят с опытом и требуют некоторого терпения, обязательно освойте их. Это придаст процессу исследования гибкость, простоту и легкость. Тогда выполнение статистических процедур, казавшихся сложными и громоздкими, станет для вас интуитивно понятным.
Мы рассмотрим следующие основные команды управления данными:
команда Анализ ► Отчеты ► Итоги по наблюдениям (Analyze ► Reports ► Case Summaries) предназначена для проверки состава и качества данных;
команда Преобразование ► Заменить пропущенные значения (Transform ► Replace Missing Values), как ясно из ее названия, работает с отсутствующими значениями переменных;
команда Преобразование ► Вычислить переменную (Transforms Compute) позволяет путем вычислений создавать новые переменные на основе существующих;
команда Преобразование ► Ранжировать объекты (Transform Rank Cases) позволяет создать новую переменную путем ранжирования значений существующей переменной;
команды подменю Перекодировка (Recode) меню Преобразование (Transform) предназначены для изменения способа кодирования переменных, например уменьшения числа возможных значений;
с помощью команды Данные ► Отобрать наблюдения (Data ►Select Cases) можно выбрать подмножество объектов для дальнейшего анализа;
команда Данные ► Сортировать наблюдения(Data ► Sort Cases) позволяет упорядочить объекты в соответствии с назначенными критериями;
команды Данные ►Слить файлы (Data ►Merge Files) используются для добавления в файл новых переменных или объектов из другого файла.