Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методические указания и задания МАД.doc
Скачиваний:
35
Добавлен:
05.05.2019
Размер:
752.64 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ, МОЛОДЕЖИ

И СПОРТА УКРАИНЫ

ТАВРИЧЕСКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ

имени В.И.Вернадского

Кафедра информатики

Руденко л.И. Методические рекомендации и задания по работе в системе statistica

для студентов 5 курса специальности

7.04030201 «Информатика»

Симферополь, 2011

Рекомендовано к печати заседанием кафедры информатики

от «19» 04 2011 г., протокол № 12.

Рекомендовано к печати Учебно-методическим советом ТНУ

от «26» 04 2011 г., протокол № 4.

Методические рекомендации предназначены для обеспечения компьютерного практикума по дисциплине выбора «Многомерный анализ данных» с использованием системы статистического анализа STATISTICA.

Раздел 1 включает основные сведения о системе и ознакомление с модулями описательной статистики (Basic Statistics) и графических средств (Graphics). В разделе 2 представлены сценарии проведения анализа.

Содержание

I. Модульная система STATISTICA

4

1. Ввод данных в системе STATISTICA

6

2. Basic Statistics/Tables - Описательная статистика и таблицы

5

3. Графики системы STATISTICA

11

II.Примеры выполнения статистического анализа

1.Предварительная обработка. Т-тесты

14

2. Множественная регрессия

18

3. Дисперсионный анализ (ANOVA/MANOVA)

22

4. Кластерный анализ

25

5. Канонический анализ

29

6. Факторный анализ

34

7. Дискриминантный анализ

38

8. Временные ряды

47

Приложение

54

I. Модульная система statistica

Система STATISTICA, разработанная фирмой StatSoft.Inc., реализует графически-ориентированный подход к анализу данных.

В пакете STATISTICA реализованы многочисленные статистические методы анализа, представленные в виде модулей. Выбрать модуль можно с помощью переключателя модулей – пункта Statistics главного меню STATISTICA. При нажатии переключателя появляется список модулей. Стандартный список включает следующие модули:

Basic Statistics /Tables - Основные статистики и таблицы;

Multiply Regression - Множественная регрессия;

ANOVA - Дисперсионный анализ (ANOVA);

Nonparametrics - Непараметрическая статистика;

Distribution Fitting - Подгонка распределения;

Advanced Linear/Nonlinear Models

- Расширенные линейные и нелинейные модели, в том числе:

General Linear Models - Общие линейные модели;

Generalized Linear models - Обобщенные линейные модели;

General Linear regressions - Общие регрессионные модели;

General Partial Least - Общие модели

Square Models наименьших квадратов;

Variance Components - Компоненты дисперсии;

Survival Analysis - Анализ выживаемости;

Nonlinear Estimations - Нелинейное оценивание;

Fixed Nonlinear regressions - Выбор нелинейных преобразований;

Log-Linear Analysis - Логлинейный анализ частотных таблиц;

of Frequency Tables

Time Series/Forecasting - Временные ряды/Прогнозирование;

Structural Equation Modeling - Структурные уравнения;

Multivariate Exploratory Techniques

- Методы многомерного анализа, в том числе:

Cluster Analysis - Кластерный анализ;

Factor Analysis - Факторный анализ;

Principal Components& - Метод главных компонент и

Classification Analysis классификационный анализ;

Canonical Analysis - Канонический анализ;

Reliability /Item Analysis - Анализ надежности;

Classification Trees - Деревья классификации;

Correspondence Analysis - Анализ соответствий;

Multidimensional Scaling - Многомерное шкалирование;

Discriminant Analysis - Дискриминантный анализ;

General Discriminant - Общие модели

Analysis Model дискриминантного анализа;

Industrial Statistics& Six Sigma - Промышленная статистика;

Power Analysis - Анализ мощности;

Data Mining - Извлечение закономерностей;

Statistics of Block Data - Статистика блоков данных;

STATISTICA Visual Basic - Язык программирования;

Probability Calculator - Вероятностный калькулятор.

Данные для работы в среде STATISTICA могут быть импортированы из электронных таблиц и баз данных либо введены с клавиатуры. Удобно при изучении использовать большие массивы данных, которые хранятся в папке Examples системы STATISTICA. В разделе I рассматривается пример создания файла данных и его предварительной обработки. В разделе II приведены примеры анализа данных из файлов папки Examples/Datasets.