Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 3 Статистический анализ в Statistica.doc
Скачиваний:
135
Добавлен:
02.05.2015
Размер:
982.02 Кб
Скачать

Тема 3 Статистический анализ в statistica

1. Интерфейс, основные возможности

Система состоит из ряда модулей, работающих независимо. Каждый модуль включает определенный класс процедур. Почти все процедуры являются интерактивными, т.е. для запуска обработки необходимо выбрать из меню переменные и ответить на ряд вопросов системы.

Рисунок 1 – Модули пакета Statistica

Элемент главного меню позволяет выбрать необходимый модуль.

1.1. Основные модули и процедуры

1.1.1. Основные статистики и таблицы

Модуль Основные статистики и таблицы (Basic Statistics/Tables) содержит следующие процедуры:

Описательные статистики – Descriptive Statistics

Корреляционные матрицы – Correlation matrices

t-критерии для независимых и зависимых выборок – t-test

Внутригрупповые описательные статистики и корреляции (группировка) – Breakdown & one-way ANOVA

Таблицы частот – Frequency tables

Таблицы сопряженности и таблицы флагов и заголовков – Tables and banners

Назначение и описание данных процедур приведено в электронном учебнике textbook/modules/stbasic.html.

1.1.2 Множественная регрессия

Общее назначение множественной регрессии (этот термин был впервые использован в работе Пирсона - Pearson, 1908) состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях. В общем, множественная регрессия позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, "что является лучшим предиктором для...". Например, исследователь в области образования мог бы пожелать узнать, какие факторы являются лучшими предикторами успешной учебы в средней школе.

Более полное описание назначения процедуры приведено в файле Модули Статистики.

1.1.3 Анализ вариантов

1.1.4 Непараметрические данные

1.1.5 Настройка распределения

1.1.6 Дополнительные линейные/нелинейные модели (Advanced Linear/Nonlinear Models)

1.1.6 Многомерные Исследовательские Методы (Multivariate Exploratory Techniques)

1.1.7 Промышленная статистика и статистика 6-ти сигм Industrial Statistic and Six Sigma

1.1.8 Анализ мощности

2. Теоретические сведения

Существует несколько видов статистического анализа данных:

– корреляционный;

– регрессионный;

– дисперсионный;

– факторный;

– кластерный и др.

Рассмотрим некоторые из них.

2.1 Корреляционный анализ

Иногда корреляцию и регрессию рассматривают как совокупный процесс статистического исследования. Корреляционно-регрессионный анализ является одним из значимых методов построения математических моделей в экономике и считается одним из главных методов в маркетинге.

Корреляция в широком смысле слова означает связь между объективно существующими явлениями.

Корреляционный анализ – вид статистического анализа, который состоит в количественной оценке силы и направления связи между двумя (парная корреляция) или несколькими (множественная корреляция) наборами данных. Для количественной оценки силы связи используются коэффициенты парной корреляции r и множественной корреляции R.

Коэффициент корреляции (безразмерная величина) – количественный показатель линейной связи между двумя или более наборами данных, значение которого лежит в интервале от -1 до 1. Если коэффициент равен  1, то связь функциональная, если равен 0, то связь отсутствует.

Для качественной оценки силы связи используются специальные табличные соотношения (например, шкала Чеддока, табл. 1)

Таблица 1 – Шкала Чеддока

Значения коэффициента корреляции

Характер связи

Очень слабая

Слабая

Заметная

Сильная

Очень сильная

Направление связи определяется знаками : близость к +1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, близость к -1 означает обратное.

Для наглядности измерения всех связей в случае множественной корреляции целесообразно использовать корреляционную матрицу – матрицу из попарных коэффициентов корреляции.