Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СборПракПосл.doc
Скачиваний:
12
Добавлен:
11.04.2015
Размер:
4.16 Mб
Скачать

Задание к самостоятельной работе.

  1. Выполнить анализ производственного травматизма на предприятии табличным (групповым) методом. Для этого сделать выборку данных из таблиц 1-3 приложения 1, согласно варианту, выданному преподавателем.

Вариант

Таблица 1 (прил. 1).

Строки в таблице

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

1 - 40

6 - 45

11 - 50

16 - 55

21 – 60

26 – 65

31 – 70

36 – 75

41 – 80

46 – 85

51 – 90

56 – 95

61 - 100

1 -20, 81-100

21-40, 61-80

41-60, 11-30

61-80, 6-25

81-100, 16-35

26- 45, 56-75

36- 55, 66-85

Применяя табличный метод, выполнить анализ распределения несчастных случаев:

а) по цехам: 1, 2, 3, 4;

б) по полу: мужчины, женщины;

в) по квалификации (разряду, классу): 1, 2.3.4.5;

г) по стажу работы: до 10 лет, 10 – 20 лет, выше 20 лет.

2. Для переменной Х – «t от обучения » ( время, прошедшее после последнего обучения безопасным приемам труда) – построить гистограмму, оценку плотности вероятности и эмпирическую функцию распределения.

3. По статистическим данным варианта получить оценки числовых характеристик

( математического ожидания, дисперсии, коэффициентов асимметрии и эксцесса).

4. Сделать выводы в контексте решаемой задачи.

Практическая работа n 2. Предварительный анализ данных. Проверка гипотез о согласии эмпирического распределения и выбранной модели

Цель: Приобрести навыки выбора адекватного в смысле начальных условий критерия проверки гипотез о согласии эмпирического распределения и выбранной модели; научится проверять, используя пять шагов логической схемы, гипотезы о согласии с помощью критериев χ2 Пирсона и Колмогорова.

Содержание работы.

После построения эмпирической функции распределения и расчета числовых характеристик одним из путей обработки данных является описание эмпирических данных вероятностными моделями, т.е. обоснованный выбор среди множества (заранее известных) моделей той, которая наилучшим (в некотором смысле) образом соответствует статистическому материалу, характеризующему реальный исследуемый объект, процесс или явление.

По виду гистограммы, значениям статистических характеристик или из других соображений может быть выдвинута гипотеза о законе распределения, которому подчиняется исследуемая случайная величина Х и этот закон описывается модельной функцией распределения

F( x; 1,2,…r),

где 1,2,…r – параметры этого распределения, которые могут быть как известными, так и неизвестными.

Большинство статистических методов исследования основывается на законе нормального распределения (непрерывные величины). В связи с этим дальнейшая обработка данных наблюдений может происходить следующим образом:

1. Предполагаем, что исследуемая величина Х имеет нормальный закон распределения N( µ, 2)

. (16)

2. Используя критерий согласия проверяем выдвинутую гипотезу.

Если гипотеза о нормальности отвергается можно применить различные преобразования случайных величин:

- логарифмирование или извлечение корня при правосторонней асимметрии распределения;

- возведение в квадрат при левосторонней асимметрии и др.

Если гипотеза о нормальности после преобразования отвергается необходимо использовать другие модели или проводить дальнейший анализ данных методами свободными от распределений.

Логическая схема построения критерия состоит из следующих шагов:

1-й шаг. Выдвигается основная (или проверяемая) гипотеза Н0 и альтернативная ей гипотеза Н1.

2-й шаг. Задается уровень значимости критерия α.

3-й шаг. Задается некоторая функция результатов наблюдения – критическая статистика

ψкр = ψ(х1, х2, ..., хn).

4-й шаг. Из статистических таблиц распределения W(ψкр ) находятся квантили уровня : α /2 и 1- α /2 или процентные точки ψ(1- α /2 )*100 и ψ α /2 *100 являющиеся соответственно нижней ψкр н и верхней ψкр в критическими точками (границами).

5-й шаг. Определяется расчетное значение критической статистики ψрасч подстановкой в ψкр конкретных выборочных значений х1, х2, ..., хn или некоторых функций от них. Если выполняется условие

ψкрн < ψрасч < ψкрв,

то гипотеза Н0 верна. В противном случае Н0 отвергается с ошибкой первого рода α.

I . Наиболее распространенным критерием согласия является критерий χ2 Пирсона, который позволяет проверять гипотезу, когда значения параметров 1,2,…r модельной функции распределения не известны.

Рассмотрим последовательность критерия согласия χ2–Пирсона на примере эмпирической функции распределения, полученной в предыдущей работе (табл. 8).

1-й шаг. Формирование основной и альтернативной гипотез

Н0: F*(X) = ,

Н1: F*(X) ≠ . (17)

Таблица 8

Частич-ные ин-тервалы

Рабочее поле для подсчета частот

Абс. частоты

nj

Плотность

частоты, ωj=nj/h

Середины интервалов

Относ. частоты,

W*= ωj/n

Накопленные частоты F*(x)=W*j h

1 – 5

5 - 9

9 - 13

13 - 17

17 - 21

21 - 25

25 - 29

\\\\\\\\\\\\\\

\\\\\\\\\\\\

\\\\\\\\\\\\

\\\\\\

\\\

\

\\

14

12

12

6

3

1

2

3,5

3

3

1,5

0,75

0,25

0,5

3

7

11

15

19

23

27

0,07

0,06

0,06

0,03

0,015

0,005

0.01

0,28

0,52

0,76

0,88

0,94

0,96

1.00

2-й шаг. Задание уровня значимости α. Пусть α = 0,05 3-й шаг. Критическая статистика имеет вид

ψкр = ,

где nj , j = – количество попаданий в каждый j-ый интервал группирования, pj – теоретическая вероятность попадания в j-ый интервал

pj = -. (18)

Здесь хj+1 и хj – соответственно верхняя и нижняя границы текущего интервала группирования, а функция распределения имеет вид

,

где 9,04 = =, 6,08 =σ*= S, 37,02 =σ*2 = S2 .

Число интервалов группирования должно удовлетворять условию L ≥ 5, количество попаданий в каждый интервал nj должно быть не менее 5. В противном случае соседние интервалы необходимо объединить в один, не забывая при этом скорректировать L. Для вычисления значений функции Fmod(x) сделаем замену

,

что позволит воспользоваться таблицей Ф(uj) функции Лапласа (табл. 1, прил.2).

Дальнейшие расчеты приведены в табл. 9.

Таблица 9

Частичные интервалы

uj

Табличные значения Ф(uj)

pj

nj

npj

(nj – npj)2

npj

Теоретичес-кая функ. распр.

Fmodj

()

-1.32

-0,66

-0,01

0,65

1,31

1,97

2,63

3,28

-0,4066

-0,2454

-0,0040

0,2422

0,4049

0,4756

0,4957

0,4994

0,1612

0,2414

0,2462

0,1627

0,0707

0,0201

0,0037

14

12

12

6

3 │

1 │ 6

2 │

8,06

12,07

11,91

8,14

3,54 │

1,01 │ 4,74

0,19 │

4,38

0

0

0,56

0,33

0,1612

0,4026

0,6488

0,8115

0,8822

0,9023

0,906

Σ

0,906

5,27

Статистика ψкр имеет распределение 2 ( L - s -1) - хи-квадрат с (L - s - 1) числом степеней свободы где s – количество параметров модельного распределения, согласие с которым проверяется. В нашем случае число степеней свободы (5-2-1) = 2. 4-й шаг. Определение верхней и нижней критических точек по таблице процентных точек 2-распределения (табл. 2, прил.2) :

ψкрв = 2 α /2.100% (2) = 7,38 ψкрн. = 2(1- α /2).100% (2)=0,05.

5-й шаг. Проверяем выполнение условия

2 (1- α /2)100% (2) < ψрасч < 2 α /2 100% (2),

0,05< 5,27 < 7,38.

Гипотеза о согласии Н0 верна с ошибкой первого рода α. Анализ табл. 2 ( прил.2) показывает, что гипотеза может быть отвергнута при α >  0,15 (наименьший уровень отклонения гипотезы Н0 ).

I I. Критерий согласия Колмогорова позволяет проверить гипотезу о согласии, когда Fmod известна полностью, т.е. известны и параметры модели . Однако, если Fmod задана с точностью до неизвестных параметров сдвига и масштаба, то применимость критерия Колмогорова корректна

Используем критерий Колмогорова для проверки гипотезы (17). Критическая статистика критерия имеет вид

ψкр = , (19)

где 1= , 2= S2, – эмпирическая функция распределения представленная в табл. 6,Fmod(X) – теоретическая функция распределения представленная в табл. 9.

По данным таблицы 10 получим расчетное значение критической статистики

ψрасч = 7,07. 0,12  0.85.

По табл. 3 ( прил.2) определяем ψкрв= 1,36. Поскольку выполняется условие ψрасч = 0,85 < ψверх= 1,36, то гипотеза о согласии Н0 верна с ошибкой первого рода α = 0,05. Данные табл. 3 ( прил.2) показывают, что гипотеза может быть отвергнута при α > 0,45.

Таблица 10.

Теоретическая функц. распределения , Fmodj

Эмпирич. функц. Распределения, F*j

0,1612

0,4026

0,6488

0,8115

0,8822

0,9023

0,906

0,28

0,52

0,76

0,88

0,94

0,96

1.00

0,12

0,12

0,11

0,07

0,06

0,06

0,09

Мах = 0,12

III. Используем преобразование для переменной Х – «число дней нетрудоспособности» вида . Построим эмпирическую функцию распределения и выполним все этапы анализа п.п.I – I I . Результаты этой работы приведены в табл. 11 – 14.

1. Критерий χ2 Пирсона.

Проверяем выполнение условия

2 (1- α /2)100% (2) < ψрасч < 2 α /2 100%,

0,05< 1,32 < 7,38.

Гипотеза о согласии Н0 верна с ошибкой первого рода α. Анализ табл. 2 ( прил.2) показывает, что гипотеза может быть отвергнута при α > 0,9

Таблица 11

Частичные интервалы

Рабочее поле для подсчета частот

Абс. частоты

nj

Середины интервалов

Накопленные частоты F*(x)=W*j h

1 – 1,61

1,61 – 2,22

2,22 –2,83

2,83 - 3,44

3,44 – 4,05

4,05 – 4,66

4,66 – 5,27

\\\\\

\\\\\\\\\

\\\\\\\\\\\\

\\\\\\\\\

\\\\\\\\\

\\\\

\\

5

9

12

9

9

4

2

1,305

1,915

2,525

3,135

3,745

4,345

4,965

0,10

0,28

0,52

0,70

0,88

0,96

1.00

Таблица 12

Числовые характеристики

Группированные данные

2,866

S2

0,957

0,978

As

0,23

Es

2,29

-0,71

Таблица 13

Частичные интервалы

uj

Табличные значения Ф(uj)

pj

nj

npj

(nj – npj)2

npj

Теоретическая функ. распр.

F*modj

-1.95

-1,31

-0,68

0,04

0,60

1,24

1,87

2,51

-0,4744

-0,4043

-0,2517

-0,0160

0,2257

0,3925

0,4693

0,4939

0,0701

0,1526

0,2357

0,2097

0,1668

0,0768

0,0246

5

9

12

9

9

4 │ 6

2 │

3,50

7,63

11,79

10,50

8,34

3,84 │

1,23 │5,07

0,64

0,25

0

0,21

0,05

0,17

0,0701

0,2227

0,4584

0,6681

0,8349

0,9117

0,9363

Σ

,9363

1,32

Таблица 14

Теоретическая функ. распр.

Fmodj

Эмпирич. функ. распр

F*j

0,0701

0,2227

0,4584

0,6681

0,8349

0,9117

0,9363

0,10

0,28

0,52

0,70

0,88

0,96

1.00

0,03

0,06

0,06

0,03

0,05

0,05

0,06

Мах = 0,06

2. Критерий согласия Колмогорова.

Поданным таблицы 3 получим расчетное значение критической статистики

ψрасч = 7,07. 0,06  0.42.

По табл. 3 ( прил.2) определяем ψкрв= 1,36. Поскольку выполняется условие ψрасч = 0,42 < ψкрв = 1,36, то гипотеза о согласии Н0 верна с ошибкой первого рода

α = 0,05. Данные табл. 3 ( прил.2) показывают, что гипотеза может быть отвергнута при α > 0,99.