- •Введение
- •1.Структура пакета STATISTICA
- •Структура данных
- •Редактирование данных
- •Источники данных
- •Открытие файла данных
- •Создание файла данных
- •Сохранение файла
- •Импорт файла данных
- •Экспорт файла данных
- •Вычисление основных статистик и построение графиков
- •2. Лабораторные работы по теории вероятностей
- •Выполнение в пакете STATISTICA
- •. Работа с Probability Distr. Calculator
- •Моделирование распределений случайных величин
- •3. Лабораторные работы по статистическим методам
- •Выполнение в пакете STATISTICA
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 5. Доверительные интервалы для разности средних и отношения дисперсий
- •Основные понятия
- •Задание
- •Выполнение в пакете STATISTICA
- •Задания для самостоятельной работы
- •Работа 6. Группировка данных по классифицирующему признаку
- •Выполнение в пакете STATISTICA
- •4. Непараметрические методы математической статистики
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Коэффициент ранговой корреляции Спирмена
- •Задания для самостоятельной работы
- •Задания для самостоятельной работы
- •Задание 1
- •Задание 2
- •4.8. Критерий знаков (Sign test)
- •4.9. Критерий Вилкоксона (Wilcoxon watched pairs test)
- •Задания для самостоятельной работы
- •5. Однофакторный дисперсионный анализ
- •5.1. Основные понятия
- •5.2. Решение примеров в пакете STATISTICA
- •6. Регрессионный анализ
- •Работа 7. Простая линейная регрессия
- •Литература
Структура данных
Файлы данных в пакете STATISTICA организованы аналогично файлам в электронных таблицах (например Excel). Такой файл можно рассматривать как таблицу (Spreadsheet), в которой столбцы являются переменными (Variables), а в строках записываются значения переменных - наблюдения (Cases).
На рис.1.3 приведен файл, содержащий данные медицинского обследования двенадцати пациентов. Для каждого пациента определялись: пол, вес, рост, температура и давление. Таким образом, файл содержит значение пяти переменных, каждая из которых представлена двенадцатью наблюдениями.
Имя файла (111.STA) и размер таблицы, содержащей файл (6v×15c), указаны в заголовке таблицы. Три последние строки таблицы не содержат данных. В вычислительных процедурах пакета строки таблицы, не содержащие данных, рассматриваются как пропущенные значения (missing). Пропущенные
значения |
учитываются |
в |
некоторых процеду- |
рах пакета, |
в частности |
при |
выполнении |
частотной табуляции (Frequency tables) в модуле Basic Stat./ Tables.
Вфайле на рис.1.3 переменная ПОЛ представлена в нечисловой (текстовой) форме (Text Values).
Впакете STATISTICA при вводе текстовой переменной каждому значению ставится в соответствие
числовая метка (число). Таким образом, значения текстовых переменных имеют двойную запись. Например, при вводе переменной ПОЛ значению МУЖ.
соответствует |
1, |
а значению |
ЖЕН. - 2. Чтобы перевести текстовые |
13
переменные в числовую форму, нужно нажать кнопку на панели инструментов. Задать или изменить числовые метки для выделенных переменных можно, нажав инструментальную кнопку Vars (Modify Variables) и выбрав в выпадающем меню (см. рис.1.2 меню в правом нижнем углу) кнопку Text Values либо нажать
инструментальную кнопку |
. |
Рассмотрим несколько |
файлов из директории |
EXAMPLES. В файле cardata переменными (Vars)
являются характеристики 155 автомобилей: мощность двигателя, вес, год выпуска и т.д., а наблюдениями (Cases) - рассматриваемые автомобили.
В файле adstudy переменными являются характеристики конкретных людей: пол (Gender), предпочтения (Advert) и другие, а наблюдениями - фамилии людей.
14
15
Рис.1.3. Файл данных 111.STA
Файлы данных в пакете STATISTICA имеют расширение sta. Такие файлы могут иметь практически неограниченное число строк (если нужно - миллионы), количество столбцов ограничено числом 4092. Таблицы, имеющие более чем 4092 столбца (вплоть до 32 тысяч столбцов), могут быть оформлены как мегафайлы (megafiles). Мегафайлы имеют расширение mfm.
Редактирование данных
При нажатии кнопки Vars на панели инструментов становятся доступными команды редактирования переменных - столбцов (см. рис.1.2 меню в правом нижнем углу): Add (Добавить новые переменные), Delete (Удалить переменные), Move (Переместить) и др. При нажатии кнопки Cases становятся доступными аналогичные команды редактирования строк.
Рис.1.4. Окно спецификации переменной
16