Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_методичка.doc
Скачиваний:
66
Добавлен:
12.02.2016
Размер:
1.25 Mб
Скачать

1.2.3. Изучение формы распределения с помощью критериев согласия

Критерии согласия, используемые в системе Statistica, доступны в диалоговом окне Frequency tables – Таблицы частот меню Analysis – Анализ модуля Basic Statistics and Tables – Основные статистики и таблицы.

В этом диалоговом окне имеется группа кнопок Tests of normality – Критерии нормальности:

  • K-S test - Критерий Колмогорова-Смирнова вычисляется при известном среднем и среднеквадратическом отклонении генеральной совокупности. Если вычисленная D-статистика значима (на экране строка будет иметь красный цвет), то гипотеза о том, что данные имеют нормальное распределение, отвергается. В противном случае, гипотеза о нормальности распределения принимается.

  • Lilliefors test - Критерий Лиллиефорса вычисляется при неизвестном среднем и среднеквадратическом отклонении генеральной совокупности (они оцениваются по имеющимся данным). Как и в предыдущем случае, если вычисленная D-статистика значима и строка на экране красного цвета, то гипотеза о том, что данные имеют нормальное распределение, отвергается. В противном случае, гипотеза о нормальности распределения принимается.

  • ShapiroWilks W test – Критерий Шапиро-Уилка W - по данным наблюдений вычисляется W-статистика, и если она значима (на экране строка выделена красным цветом), гипотеза о нормальном характере распределения отвергается, в противном случае – принимается.

Отметив галочками все три критерия в группе опций Tests of normality – Критерии нормальности окна Frequency tables – Таблицы частот (рис. 2.9),

Рисунок 2. 11 - Диалоговое окно Frequency tables – Таблицы частот

нажмем клавишу Tests for normality. Результат представлен на рис. 2.10.

Рисунок 2.12 - Окно результатов Tests of normality – Критерии нормальности

Строки, соответствующие переменной GABARIT, во всех трех таблицах выделены красным цветом, что говорит о необходимости отвергнуть гипотезу о нормальном характере распределения данной переменной. Гипотеза о нормальном характере распределения переменной VES принимается.

Расчет всех рассмотренных критериев возможен также в окне Descriptive statistics – Описательная статистика (см. рис. 2.2). Соответствующие опции имеются в группе опций Distribution – Распределение, и если отметить их галочками, то рассчитанные значения будут отображены либо под названием гистограммы (при построении гистограмм), либо над таблицей частот (при построении таблицы частот).

1.3. Проверка гипотез о равенстве средних для нормальных распределений

Проверка гипотезы о равенстве средних двух совокупностей имеет важное практическое значение. Так, иногда оказывается, что среднее значение одной выборки отличается от среднего значения другой, хотя обе выборки взяты из схожих совокупностей.. Возникает вопрос: можно ли это различие объяснить случайной ошибкой экспериментов или же оно не случайно?

Сравнивать средние в двух группах позволяет сравнивать t-критерий[5,6]. В меню Analysis – Анализ модуля Basic Statistics and Tables – Основные статистики и таблицы предлагаются t-test for independent samplest-критерий для независимых выборок и t-test for dependent samplest-критерий для зависимых выборок. Если мы имеем дело с развитием явления, например, если выборки извлечены из одной и той же совокупности в разные моменты времени, то следует использовать t-test for dependent samplest-критерий для зависимых выборок. Если же между выборками нет причинной связи, следует использовать t-test for independent samplest-критерий для независимых выборок.

1.3.1. t-критерий для зависимых выборок

Рассмотрим применение t-критерия на примере файла ex3.sta, где приведены данные об объеме выполненных работ в расчете на одного рабочего строительного предприятия за 14 дней до перехода на новую форму оплаты труда и за 14 дней после того. Требуется установить, повлияла ли новая форма оплаты на производительность труда. В данном случае для решения воспользуемся меню t-test for dependent samplest-критерий для зависимых выборок.

Необходимым требованием применения t-критерия для анализа статистической значимости различия выборочных средних является нормальный характер распределения в исследуемых выборках. Поэтому переменные DO и POSLE следует проверить критериями нормальности, как было описано выше.

На основе полученных значений критериев нормальности (рис.2.11) гипотеза о нормальном характере распределения переменных не отвергается.

Вычисленные средние значения переменных DO и POSLE несколько различны (рис.2.12).

Требуется установить, является ли это расхождение статистически значимым. Выбрав в меню Analysis - Анализ пункт t-test for dependent samplest-критерий для зависимых выборок, в открывшемся диалоговом окне (рис.2.13) выберем переменные для анализа через клавишу Variables – Переменные. В первом списке переменных (first list) укажем переменную DO, во втором (second list) – POSLE.

Рисунок 2.13 - Окно результатов Tests of normality – Критерии нормальности для переменных DO и POSLE

Рисунок 2.14 - Статистические характеристики результатов наблюдений по данным файла ex3.sta

Рисунок 2.15 - Диалоговое окно t-test for dependent samplest-критерий для зависимых выборок

Нажав на кнопку T-tests или OK, выведем на экран таблицу результатов (рис.2.14). На экране появляется таблица результатов проверки гипотезы о том, что результаты не равны. Если гипотеза не отклоняется, то различие между средними можно считать статистически значимым (строка на экране будет выделена красным цветом). В таблице приводится в том числе значение t-критерия и значение вероятности р отклонения гипотезы о равенстве средних.

Рисунок 2.16 - Результаты проверки гипотезы о неравенстве средних для зависимых выборок

В нашем примере вычисленное значение р = 0,801930, т.е. вероятность отклонения гипотезы о неравенстве средних близка к 1. Таким образом, можно сделать вывод о том, что различие в средних несущественно, и изменение формы оплаты труда не повлияло на выработку рабочих.

1.3.2. t-критерий для независимых выборок

В файле ex4.sta приведены данные статистического наблюдения за работой двух бригад рабочих (каждая бригада наблюдалась по 12 дней), в результате которого фиксировалась их дневная выработка. Требуется выяснить имеется ли различие в производительности труда двух бригад.

Как и в предыдущем случае сначала проверим распределение данных на соответствие закону нормального распределения, затем воспользуемся пунктом t-test for independent samplest-критерий для независимых выборок.

В данном случае данные по каждой бригаде не сгруппированы, они занесены в таблицу в соответствии с днями работы той или иной бригады. Поэтому в диалоговом окне (рис.2.15) выберем One record per case (Use a grouping variable) – Используется группирующая переменная.

Рисунок 2.17 - Диалоговое окно t-test for independent samplest-критерий для независимых выборок

(Если бы данные были сгруппированы, как в предыдущем примере, т.е. одна переменная содержала бы данные о выработке одной бригады, а вторая – другой, то следовало бы выбрать Each variable contents data for one group – Каждая переменная содержит данные для одной переменой).

Вид диалогового окна изменится (рис.2.16).

Рисунок 2.18 - Диалоговое окно t-test for independent samplest-критерий для независимых выборок

В открывшемся диалоговом окне (рис.2.16) выберем переменные для анализа через клавишу Variables – Переменные. В открывшемся списке (рис. 2.17) выберем группирующую переменную (Groping variable) – BRIGADA, и зависимую переменную (Dependent variable) – VIRABOTK.

Рисунок 2.19 - Выбор группирующей и зависимой переменных

Щелкнув ОК, вернемся в основное диалоговое окно. Программа автоматически (рис.2.18) проставит коды для групп, в качестве которых берутся значения группирующей переменной (в нашем случае Бригада 1, Бригада 2).

Рисунок 2.20 - Диалоговое окно t-test for independent samplest-критерий для независимых выборок

Нажатие кнопки ОК или T-tests выводит на экран окно результатов анализа (рис.2.19).

Рисунок 2.21 - Окно результатов проверки гипотезы о неравенстве средних для независимых выборок

Вероятность отклонения гипотезы о неравенстве средних р = 0,000001 (строка высвечена красным), поэтому можно сделать вывод о существенности различий в производительности труда в двух бригадах.

Задание № 1

Проработать и представить в электронном и печатном виде рассмотренные выше примеры.

Задание № 2.

Имеются следующие данные о месячной выработке, стаже работы и почасовой заработной плате двадцати рабочих фирмы.

№ предприятия

Выработка

Стаж

работы

Зарплата

1

31

7

4,80

2

40

7

4,50

3

39

6

3,50

4

40

7

4,50

5

36

7

2,50

6

42

9

4,80

7

44

7

3,50

8

47

7

3,60

9

43

10

2,80

10

35

8

3,00

11

42

7

4,50

12

50

7

3,50

13

35

11

4,00

14

33

7

4,20

15

36

8

3,80

16

45

9

3,70

17

41

7

4,20

18

39

7

3,90

19

40

8

4,40

20

39

7

4,00

Провести анализ данных в системе «STATISTICA»:

1) вычислить основные статистические характеристики каждой переменной;

2) по сгруппированным данным построить гистограмму и диаграмму размаха и дать заключение о близости полученного распределения к нормальному.

Задание №3.

Имеются данные выборочного наблюдения, характеризующие товарооборот (тыс. грн) за месяц однотипных торговых организаций двух микрорайонов города (обследовалось по 20 предприятий каждого микрорайона).

Товарооборот за месяц предприятия, расположенного в первом микрорайоне

Товарооборот за месяц предприятия, расположенного во втором микрорайоне

8609,2

8490,7

9139,6

8829,5

9378,4

9168,3

9526,8

9216,7

9417,3

9361,9

9091,2

8781,1

8448,1

8442,3

9623,6

9313,5

9236,4

8926,3

9042,8

8732,7

9188,0

8877,9

9430,0

9119,9

9023,6

8974,7

8994,4

8684,3

8946,0

8635,9

9333,2

9023,1

9381,6

9071,5

9275,2

9265,1

8897,6

8587,5

8849,2

8539,1

Проверить, является ли различие по двум микрорайонам в величине товарооборота предприятия статистически значимым.

Задание №4.

Имеются следующие данные о величине дневной выработки (грн.) водителей городских автобусов двух автотранспортных предприятий (АТП), расположенных в двух микрорайонах города (обследовалось по 20 водителей каждого АТП).

Величина выработки

АТП №

Величина выработки

АТП №

Величина выработки

АТП №

Величина выработки

АТП №

8274,1

1

9392,9

2

8786,3

2

8399,7

1

8516,7

2

9460,3

2

8853,7

2

8462,5

1

8584,1

2

9467,3

1

8902,1

1

8651,5

2

8525,3

1

8449,3

2

9527,7

2

8718,9

2

8588,1

1

8713,7

1

9404,5

1

9341,7

1

8650,9

1

8776,5

1

8200,4

2

9662,5

2

8921,1

2

8839,3

1

9153,3

1

9729,9

2

8988,5

2

9595,1

2

9123,3

2

8964,9

1

9055,9

2

9216,1

1

9190,7

2

9090,5

1

8336,9

1

9278,9

1

9027,7

1

9325,5

2

Проверить, является ли различие в дневной выработке водителей по двум АТП статистически значимым.

Задание №5.

В целях повышения эффективности продаж 2 фирмы воспользовались возможностями рекламной кампании. Имеются данные о ежедневном товарообороте (у.е.) каждой фирмы за 20 дней до проведения рекламной акции и за 20 дней после того.

Данные по фирме А

Данные по фирме В

Ежедневный товарооборот до проведения рекламной акции

Ежедневный товарооборот после проведения рекламной акции

Ежедневный товарооборот до проведения рекламной акции

Ежедневный товарооборот после проведения рекламной акции

8442,3

8619,0

8684,3

8794,4

8490,7

8647,3

8732,7

8842,8

8539,1

8675,6

8781,1

8891,2

8587,5

8703,9

8829,5

8939,6

8635,9

8732,2

8877,9

8988,0

8684,3

8760,5

8926,3

8400,7

9071,5

9047,2

8974,7

9084,8

9119,9

9095,6

9023,1

9133,2

9168,3

9144,0

9071,5

9181,6

9216,7

9192,4

9119,9

9230,0

9265,1

9240,8

9168,3

9278,4

9313,5

9289,2

9216,7

9326,8

9361,9

9337,6

9265,1

9375,2

8732,7

8788,8

9313,5

9423,6

8781,1

8817,1

9361,9

9472,0

8829,5

8845,4

8442,3

8552,4

8877,9

8873,7

8490,7

8600,8

8926,3

8902,0

8539,1

8649,2

8974,7

8950,4

8587,5

8697,6

9023,1

8998,8

8635,9

8746,0

Определить по каждой фирме, явилась ли рекламная акция эффективной.