Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лабораторный практикум в системе Statistica

.pdf
Скачиваний:
308
Добавлен:
26.03.2016
Размер:
2.04 Mб
Скачать

то гипотезу (6.6) или (6.7) необходимо отвергнуть и считать, что соответствующий фактор значимо влияет на исследуемый признак.

Выполнение работы.

1. Процедура однофакторного ДА.

Рассмотрим процедуру проведения ДА на примере данных, представленных в таблице 6.3. Данные представляют собой значения выручки, полученной в четырех торговых точках, расположенных в четырех районах города за четыре дня недели. Условно районы города назовем «Черемушки», «Центр», «Сельмаш», «Домики». Проверяется влияние расположения торговой точки на объем выручки.

Таблица 6.3

Исходные данные для проведения ДА

Район расположения торговой точки (уровень фактора)

 

 

Объем реализации, т. руб. (наблюдения)

 

Пн.

 

Вт.

Ср.

Чт.

«Черемушки»

14

 

15

14,8

15

 

 

 

 

 

 

«Центр»

14,4

 

14,9

14,9

15,5

 

 

 

 

 

 

«Сельмаш»

14,2

 

15,2

14,6

15,4

 

 

 

 

 

 

«Домики»

14,5

 

15

14,7

15,2

 

 

 

 

 

 

Запустите систему STATISTICA. Создайте файл размерности 3 × 16 . Первая переменная файла будет предназначена для фиксации района расположения торговой точки, вторая – для фиксации дня недели (понадобится в дальнейшем для проведения двухфакторного ДА), третья переменная – для фиксации выручки. Заполните электронную таблицу, как показано на рис. 6.1.

В пункте меню «Статистика» выберите пункт ANOVA (от analyze of variance), который предназначен для проведения процедуры как однофакторного, так и многофакторного ДА. В результате будет открыто стартовое окно модуля (рис. 6.2).

61

Рис. 6. 1. Исходные данные для проведения ДА

Рис. 6.2. Стартовое окно модуля ANOVA

62

Для начала проведем процедуру однофакторного ДА. Для этого установите тип анализа и метод . Нажмите «OK». Откроется окно установки переменных и опций анализа (рис. 6.3). Факторной переменной будем считать переменную «Расположение торговых точек», а результирующей переменной - переменную «Выручка».

Рис. 6.3. Окно установки переменных и опций анализа

Нажмите кнопку . В открывшемся окне установите результирующую переменную «Выручка» и факторную переменную «Расположение торговых точек» так, как показано на рисунке 6.4, и нажмите

«OK».

Рис. 6.4. Окно выбора переменных для анализа

63

Нажмите «OK» и затем нажмите кнопку , в открывшемся окне нажмите кнопку . Окно должно выглядеть так, как показано на рисунке

6.5. Нажмите «OK».

Рис. 6.5. Окно установки уровней факторной переменной

В окне выбора переменных и опций анализа нажмите . В результате будет открыто окно результатов анализа (рис. 6.6).

Рис. 6.6. Окно результатов анализа

Оставьте уровень значимости «Significance level» равным α = 0,05 и

нажмите кнопку . Будет открыто окно с результатами расчета

64

компонент вариации и проверки гипотезы (6.1) с использованием статистики Фишера (рис. 6.7). Проведем анализ полученных результатов (при анализе игнорируем строку «Intercept»).

 

 

Рис. 6.7. Окно результатов однофакторного ДА

 

 

1.

Система

рассчитала компоненты

«Сумма

квадратов»

(SS)

Q2

= 0,107

и Q2

= 2,488 общей вариации

Q2 (см.

формулу

6.3),

1

 

2

 

 

 

 

обусловленные фактором «Расположение торговых точек» и неучтенными факторами.

2. Определила число степеней свободы (Degr. of Freedom) каждой компоненты. В частности, для компоненты вариации, обусловленной факторной переменной, число степеней свободы равно m 1 = 3 , а для компоненты, обусловленной неучтенными факторами, число степеней свободы равно m (n 1) = 12 .

 

3.

Рассчитала

величины

«Средний

квадрат»

(MS)

Q2

(m 1) = 0,036 и Q2

m(n 1) = 0,207 соответственно.

 

1

 

 

2

 

 

 

 

 

4.

Рассчитала

величину

статистики

Фишера,

равную

 

 

Q2

(m 1)

 

 

 

 

 

1

 

 

(см. формулу

6.4), и определила вероятность

F =

 

 

= 0,17

Q2

m (n 1)

 

2

 

 

 

 

 

 

p = 0,913350 того, что при справедливости гипотезы

H0 (6.1) величина F

 

 

 

 

 

 

 

 

65

может принять такие же или большие значения. Так как эта вероятность существенно больше уровня значимости α = 0,05 , то гипотезу о значимости влияния фактора «Расположение торговых точек» на объемы реализации можно отвергнуть.

2. Процедура многофакторного ДА (на примере двухфакторного).

Перейдите в стартовое окно модуля ANOVA. Установите тип анализа и нажмите «ОК». В открывшемся окне нажмите кнопку и установите результирующую переменную и факторы так, как

показано на рисунке 6.8.

Рис. 6.8. Окно выбора переменных для анализа

Нажмите «OK» и затем кнопку , в открывшемся окне нажмите кнопки напротив обозначения обоих факторов. Окно должно выглядеть так, как показано на рисунке 6.9.

66

Рис. 6.9. Окно установки уровней факторных переменных

Нажмите «OK». В окне установки переменных и опций анализа также нажмите . В результате будет открыто окно результатов анализа, аналогичное представленному на рисунке 6.6. Оставьте уровень значимости «Significance level» равным α = 0,05 и нажмите кнопку . Будет открыто окно с результатами расчета компонент вариации и проверки гипотез (6.6-6.7) с использованием статистик Фишера (рис. 6.10). Проведем анализ полученных результатов (при анализе также игнорируем строку

«Intercept»).

 

 

 

Рис. 6.10. Окно результатов двухфакторного ДА

 

 

 

 

1.

Система рассчитала компоненты «Сумма квадратов»

Q2

= 0,107

 

 

 

 

 

1

 

и

Q2

= 2,202 и Q2 = 0,286

общей вариации Q2 (6.9), обусловленные

 

2

 

3

 

 

 

выбранными и неучтенными факторами.

67

2. Определила число степеней свободы каждой компоненты. В частности, для компоненты вариации, обусловленной переменной «Расположение торговых точек», число степеней свободы равно m 1 = 3 , для компоненты, обусловленной переменной «День недели», число степеней свободы равно n 1 = 3 , а для компоненты, обусловленной неучтенными факторами, число степеней свободы равно (m 1)(n 1) = 9 .

 

3.

 

Рассчитала

величины

«Средний

квадрат»

 

Q2 (m 1) = 0,036 ,

 

 

 

 

 

 

 

 

 

 

 

 

1

 

Q2

n 1

= 0,734 и Q2

 

((m 1)(n 1)) = 0,032 соответственно.

 

2

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

4.

 

Рассчитала

значения

 

статистик

Фишера,

равные

 

 

Q2

(m 1)

 

 

 

 

 

Q2

(n 1)

 

 

 

FA

=

 

1

 

= 1,1 и

FB

=

 

2

 

 

= 23,1

(6.10), и

Q2

 

 

Q2

 

 

 

 

 

(m 1)(n 1)

 

 

 

 

(m 1)(n 1)

 

 

3

 

 

 

 

 

3

 

 

 

 

 

определила соответствующие значениям FA и FB вероятности pA = 0,390317

и pB = 0,000145 того, что при справедливости гипотез H0 (6.6-6.7) величины

FA и FB могут принять такие же или большие значения.

Так как вероятность pA существенно больше, а вероятность pB

существенно меньше уровня значимости α = 0,05 , то гипотезу о значимости влияния фактора «Расположение торговых точек» на объемы реализации можно отвергнуть, а гипотезу о значимости влияния фактора «День недели» на объемы реализации необходимо принять.

Задание для самостоятельной работы.

Получите вариант исходных данных для выполнения самостоятельной работы у преподавателя. Выполните процедуры однофакторного и двухфакторного ДА по своему варианту исходных данных.

3. Оформление отчета о лабораторной работе.

Отчет о лабораторной работе №6 должен содержать:

постановку задачи;

электронную таблицу, заполненную в соответствии с индивидуальным вариантом исходных данных;

68

− таблицы с результатами проведения процедур однофакторного и двухфакторного ДА с соответствующими выводами относительно наличия или отсутствия влияния факторов на результирующий признак.

69

7. Лабораторная работа № 7

Тема работы: Корреляционный и регрессионный анализ (2 часа).

Цель работы: Освоение методов анализа парной корреляции и регрессии.

Содержание работы:

1.Создание электронной таблицы с исходными данными.

2.Анализ парной корреляции.

3.Построение и анализ уравнения регрессии.

4.Оформление отчета по лабораторной работе.

Выполнение работы.

1. Создание электронной таблицы с исходными данными.

В системе STATISTICA создайте файл размерности 2 × 20 и заполните электронную таблицу в соответствии с исходными данными, представленными в таблице 7.1. Сохраните файл и добавьте исходные данные в отчет по лабораторной работе.

Таблица 7.1 Исходные данные для проведения корреляционно-регрессионного анализа

Год

Личный

Расходы на

Год

Личный

Расходы на

 

доход - xi ,

мед. услуги -

 

доход - xi ,

мед. услуги -

 

млрд $

yi , млрд $

 

млрд $

yi , млрд $

1964

658,0

11,9

1974

1004,8

17,6

1965

700,4

12,1

1975

1010,8

17,9

1966

740,6

12,1

1976

1056,2

18,0

1967

774,4

12,5

1977

1105,4

19,2

1968

816,2

12,8

1978

1162,3

18,6

1969

853,5

13,6

1979

1200,7

20,1

1970

876,8

14,4

1980

1209,5

21,5

1971

900,0

14,8

1981

1248,6

22,0

1972

951,4

15,7

1982

1254,4

22,4

1973

1007,9

16,9

1983

1284,6

23,3

Данные, представленные в таблице 7.1, представляют собой значения личного дохода домохозяйств США и их расходов на медицинские услуги в период с 1964 по 1983 гг. Предполагается методами корреляционного

70