Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

S&M

.pdf
Скачиваний:
10
Добавлен:
16.03.2015
Размер:
352.26 Кб
Скачать

Содержание

1Элементы математической статистики . . . . . . . . . . . . . . . 4

1.1Первичная обработка данных . . . . . . . . . . . . . . . . 4

1.2Вычисление оценок числовых характеристик статистического распределения . . . . . . . . . . . . . . . . . . . . 7

1.3Выравнивание статистического ряда . . . . . . . . . . . . 8

1.4Статистическая проверка гипотез. Критерий согласия . . 10 Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Приложения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3

для каждого интервала.

1Элементы математической статистики

Основной задачей математической статистики является описание и анализ экспериментальных данных, полученных в результате наблюдения массовых случайных явлений. В статистике множество значений, которые может принимать исследуемая случайная величина (в дальнейшем С.В.) X, называется генеральной совокупностью. Подмножество, отобранное из генеральной совокупности случайным образом (наугад), называется случайной выборкой или простой статистической совокупностью. Элементы случайной выборки обозначаются буквами x1; x2; : : : ; xn, где n - объем выборки.

Задача методов математической статистики состоит в том, чтобы по выборке, извлекая из нее максимум информации, сделать те или иные выводы о генеральной совокупности, в частности, выводы о параметрах распределения С.В. и правдоподобии гипотезы о том, что С.В. имеет тот или иной закон распределения.

1.1Первичная обработка данных

Выборка из генеральной совокупности представляет собой первичный статистический материал, подлежащий обработке и анализу. Если объем выборки достаточно велик (порядка сотен), то для придания статистическому материалу большей компактности и наглядности его подвергают дополнительной обработке, а именно: строят статистический ряд.

Для этого весь диапазон наблюдаемых значений С.В. X делят на интервалы (так называемые "разряды") и подсчитывают количество значений С.В., попавших в данный разряд. Эти величины называют частотами, их обознача-

ют mi (т.е. mi – это частота i-го разряда [x1; xi]). Очевидно, что Pk mi = n,

i=1

где n - объем выборки, k – число разрядов.

Замечание 1. Количество разрядов k при заданном объеме выборки n обычно определяют из соотношения: k ¸ 3; 32 lg n + 1. Так, например, при n = 100 получим k ¸ 8.

Замечание 2. В случае, если значение С.В. находится на границе двух разрядов, то, по договоренности, его относят либо к "левому", либо к "правому" разряду, либо к частотам обоих смежных разрядов добавляют по

1=2.

Далее числа mi делят на общее число наблюдений n и находят относи-

тельные частоты или частости разрядов Wi = mi n

4

Очевидно, что Pk Wi = 1.

i=1

Таблица, в которой приведены разряды в порядке их расположения вдоль оси абсцисс и соответствующие им частоты и частости, называется упорядоченным вариационным рядом.

Статистический ряд оформляется графически в виде гистограммы, которая строится следующим образом. По оси абсцисс откладывают разряды и на каждом из них строят прямоугольник, площадь которого равна относительной частоте или частости данного разряда. Из способа построения гистограммы следует, что высота каждого прямоугольника hi = ¢Wxi (здесь ¢длина разряда). Полная площадь гистограммы равна единице.

Пример 1.

Случайная величина X, представляющая собой ошибку измерения некоторого расстояния, задана простой статистической совокупностью (Таблица1). Составить упорядоченный вариационный ряд и построить гистограмму частостей, заполнив Таблицу 2.

Таблица 1.

Простая статистическая совокупность

i

xi

 

i

xi

 

i

xi

 

i

xi

 

i

xi

1

161

 

21

241

 

41

183

 

61

243

 

81

258

2

181

 

22

248

 

42

230

 

62

195

 

82

245

3

163

 

23

169

 

43

170

 

63

205

 

83

153

4

263

 

24

216

 

44

210

 

64

199

 

84

225

5

185

 

25

296

 

45

189

 

65

184

 

85

185

6

221

 

26

219

 

46

229

 

66

222

 

86

125

7

111

 

27

218

 

47

138

 

67

224

 

87

247

8

187

 

28

271

 

48

201

 

68

206

 

88

157

9

121

 

29

217

 

49

159

 

69

211

 

89

214

10

239

 

30

254

 

50

237

 

70

164

 

90

189

11

267

 

31

227

 

51

190

 

71

230

 

91

234

12

127

 

32

255

 

52

228

 

72

182

 

92

172

13

210

 

33

215

 

53

173

 

73

142

 

93

203

14

188

 

34

258

 

54

204

 

74

167

 

94

190

15

211

 

35

229

 

55

191

 

75

253

 

95

148

16

238

 

36

235

 

56

227

 

76

239

 

96

222

17

208

 

37

182

 

57

170

 

77

219

 

97

164

18

165

 

38

203

 

58

225

 

78

267

 

98

211

19

202

 

39

193

 

59

218

 

79

208

 

99

196

20

209

 

40

219

 

60

178

 

80

177

 

100

161

5

1)Определим размах выборки R. Для этого найдем наименьшее и наибольшее значения С.В. X:

xmin = x7 = 111; xmax = x25 = 296

и вычислим размах R = xmax ¡ xmin = 296 ¡ 111 = 185.

2)Выберем число разрядов k = 10.

3)Примем за интервал задания С.В. X такой промежуток, который содер-

жит xmin, xmax и имеет достаточно близкие к ним границы со значениями, более удобными для расчетов: x0 = 100, x10 = 300.

4)Построим упорядоченный вариационный ряд. Для этого найдем длину разряда и заполним Таблицу 2. Для контроля расчета найдем столбцовые суммы.

 

 

 

 

 

¢x =

x10 ¡ x0

=

200

= 20:

 

 

 

 

 

 

 

k

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Упорядоченный вариационный ряд

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер

Границы

Среднее

Частота

 

 

 

Частость

Высота

раз-

разряда

значение

разряда

 

 

 

разряда

i-го прямо-

ряда

(x

1

; x

)

разряда

m

 

 

 

 

 

W

i

=

mi

угольника

i

 

i

 

xi

i

 

 

 

 

 

 

 

n

гистограммы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

hi = ¢Wxi

1

100-120

 

110

1

 

 

 

 

 

0,01

 

0,0005

2

120-140

 

130

4

 

 

 

 

 

0,04

 

0,002

3

140-160

 

150

5

 

 

 

 

 

0,05

 

0,0025

4

160-180

 

170

14

 

 

 

 

 

0,14

 

0,007

5

180-200

 

190

18

 

 

 

 

 

0,18

 

0,009

6

200-220

 

210

24

 

 

 

 

 

0,24

 

0,012

7

220-240

 

230

19

 

 

 

 

 

0,19

 

0,0095

8

240-260

 

250

10

 

 

 

 

 

0,1

 

 

0,005

9

260-280

 

270

4

 

 

 

 

 

0,04

 

0,002

10

280-300

 

290

1

 

 

 

 

 

0,01

 

0,0005

 

 

 

 

 

 

P

 

 

 

 

 

P

 

 

P

 

 

 

 

 

 

10

 

 

 

 

 

10

 

 

 

10

 

 

 

 

 

 

 

mi = 100

 

 

 

Wi = 1

¢x¢ hi = 1

 

 

 

 

 

 

i=1

 

 

 

 

 

i=1

 

 

i=1

5)По результатам, полученным в Таблице 2, построим гистограмму. Для этого в прямоугольной системе координат на оси абсцисс отложим значения границ разрядов и на каждом из интервалов с номером i построим прямоугольник высоты hi (рис. 1).

6

Рис. 1.

1.2Вычисление оценок числовых характеристик статистического распределения

При большом количестве опытов статистические значения числовых характеристик С.В. вычисляют по формулам:

1 Xk

mx = n i=1 xi ¢ mi;

Dx = n1 Xk (xi ¡ mx)2 ¢ mi; i=1 q

¾x = Dx;

где mx– статистическое значение математического ожидания, Dx– статистическое значение дисперсии, ¾x– статистическое значение среднеквадратичного отклонения.

Пример 2.

Для cлучайной величины X из примера 1 найти числовые характеристики математического ожидания mx и дисперсии Dx.

7

1 X10

mx = 100 i=1 xi ¢ mi;

1 X10

Dx = 100 i=1 (xi ¡ mx)2 ¢ mi:

Для удобства вычисления численных значений характеристик заполним Таблицу 3.

Таблица 3.

Вычисление статистических значений числовых характеристик С.В.

 

 

 

 

i xi

mi

xi ¢ mi

(xi ¡ mx)2 ¢ mi

1

110

1

110

8949,18

2

130

4

520

22260,64

3

150

5

750

14905,80

4

170

14

2380

16760,24

5

190

18

3420

3836,88

6

210

24

5040

699,84

7

230

19

4370

12258,04

8

250

10

2500

20611,60

9

270

4

1080

17108,64

10

290

1

290

7293,16

iP

 

 

 

 

 

 

 

 

1P

10

xi ¢ mi

 

 

 

 

 

10

 

 

= 20460

 

(xi ¡ mx)2 ¢ mi = 124684; 00

=1

 

 

 

 

 

 

 

 

i=1

 

Тогда

 

mx =

 

¢ 20460 = 204; 6;

 

100

 

 

 

 

1

¢ 124684; 00 = 1246; 84;

 

Dx =

 

 

 

 

100

 

 

 

¾x = p

 

¼ 35; 31:

 

 

 

1246; 84

1.3Выравнивание статистического ряда

При обработке статистического материала одним из важнейших вопросов является вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения, выражающую только существенные черты статистического материала, а не случайности, связанные с недостаточным объемом экспериментальных данных. Такая задача называется задачей выравнивания (сглаживания) статистических рядов.

8

Таким образом, задача выравнивания состоит в том, чтобы подобрать теоретическую плавную кривую распределения, наилучшим образом описывающую данное статистическое распределение.

Пример 3.

Вернемся к примеру 1. Так как случайная величина X есть ошибка измерения, возникающая в результате суммирования множества независимых элементарных ошибок, то из теоретических соображений можно предположить, что С.В. X подчиняется нормальному закону. Поэтому выровняем гистограмму теоретическим нормальным законом. Принимая m = mx, D = Dx, ¾ = ¾x, запишем плотность вероятности аппроксимирующего закона:

 

 

 

¡

(x

¡

m)2

 

 

 

 

¡

(x ¡ 204; 6)2

 

 

1

 

 

 

1

 

 

2

¢

2

 

 

 

2¾2

 

 

 

 

 

 

 

 

 

(35; 31)

 

f (x) =

¾p

 

e

 

 

 

=

35; 31p

 

e

 

 

 

:

2¼

 

 

 

2¼

 

 

 

Для иллюстрации эффективности подбора найдем значения функции f (x) в точках xi (см. Приложение, Таблица 2), нанесем их на рис. 1 и соединим

плавной кривой, учитывая, что вершина кривой имеет координаты

µ 1 mx; ¾p2¼ .

Результаты расчета занесем в Таблицу 4.

Таблица 4.

Выравнивание статистического закона распределения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

x

 

t =

xi ¡ m

 

1

 

 

e¡t22

f (x

) =

1

 

e¡t22

 

 

 

 

 

 

 

 

 

 

 

i

¾

 

p2¼

¢

 

i

 

¾p2¼

¢

 

1

110

-2,6791

 

0,0110

 

0,0003

 

 

2

130

-2,1127

 

0,0428

 

0,0012

 

 

3

150

-1,5463

 

0,1207

 

0,0034

 

 

4

170

-0,9799

 

0,2468

 

0,0070

 

 

5

190

-0,4135

 

0,3663

 

0,0104

 

 

6

210

0,1529

 

0,3943

 

0,0112

 

 

7

230

0,7193

 

0,3080

 

0,0087

 

 

8

250

1,2857

 

0,1746

 

0,0049

 

 

9

270

1,8521

 

0,0718

 

0,0020

 

 

10

290

2,4185

 

0,0214

 

0,0006

 

 

9

1.4Статистическая проверка гипотез. Критерий согласия

Предположим, что данное статистическое распределение выровнено с помощью некоторой теоретической кривой f (x). Очевидно, что между статистическим распределением и теоретической кривой неизбежны расхождения. Тогда возникает вопрос о том, насколько эти расхождения существенны и связаны ли они с тем, что подобранная нами кривая плохо выравнивает данное статистическое распределение. Для ответа на этот вопрос применяют "критерий согласия".

Идея применения критериев согласия состоит в том, что на основании известного статистического материала проводится проверка гипотезы о том, что исследуемая С.В. X подчиняется некоторому определенному закону распределения (например, нормальному, показательному и т.д.).

Наиболее часто применяемым критерием согласия является "критерий Â2" Пирсона, суть которого заключается в следующем. Для проверки того, согласуются ли экспериментальные данные с гипотезой о том, что С.В. X имеет данный "теоретический" закон распределения, находят теоретические вероятности попадания случайной величины в каждый из разрядов (они обозна-

чаются pi) и вычисляют величину Â2 = Pk (mi ¡ npi)2 . Значение Â2 зависит

i=1 npi

от параметра r, который называется числом "степеней свободы" и находится как разность числа разрядов k и числа независимых условий ("связей"), наложенных на относительные частоты.

Для Â2 составлены специальные таблицы (см. Приложение, Таблица 3, Таблица 4), из которых по известным значениям Â2 и r находят вероятность p. Если эта вероятность p мала (практически меньше 0; 1), то результат опыта следует считать противоречащим выдвинутой гипотезе, и эта гипотеза отбрасывается, как неправдоподобная. Если же вероятность p сравнительно велика, то можно считать расхождения между статистическим и теоретическим распределениями несущественными и гипотезу о том, что случайная величина подчиняется данному теоретическому закону распределения, можно считать правдоподобной.

Замечание.

Вывод о "правдоподобности" гипотезы ни в коем случае не следует понимать как достоверный факт того, что гипотеза верна. Этот вывод означает только то, что гипотеза не противоречит опытным данным (не более того).

10

Пример 4.

Для рассмотренной в предыдущих примерах случайной величины X рассмотрим гипотезу о том, что она имеет нормальный закон распределения.

Тогда теоретические вероятности того, что С.В. попадает в i-й разряд

[x1 ; xi], находятся по формуле

 

 

 

 

 

 

 

 

 

 

 

 

p

 

= ©

µ

xi ¡ mx

¡

©

µ

x1 ¡ mx

;

 

i

 

¾x

 

 

 

¾x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

Z

e¡

t2

где © (x) - функция Лапласа, © (x) =

 

p

 

 

 

dt, значения которой

 

 

 

2

 

2¼

 

0

находят из таблицы (см. Приложение, Таблица 1). Результаты вычислений заносим в Таблицу 5.

Таблица 5.

Вычисление критерия согласия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

x

 

m

 

xi ¡ mx

 

©

 

xi ¡ mx

p

 

n

¢

p

 

 

(mi ¡ npi)2

 

 

 

¾x

¾x

 

 

 

 

 

 

i

i

 

 

µ

 

 

i

 

 

i

 

 

npi

0

100

-

-2,9623

 

-0,4985

 

 

 

 

 

 

 

 

 

 

 

1

120

1

-2,3959

 

-0,4917

 

0,0068

0,6763

 

0,1549

 

2

140

4

-1,8295

 

-0,4663

 

0,0254

2,5374

 

0,8431

 

3

160

5

-1,2631

 

-0,3967

 

0,0696

6,9617

 

0,5528

 

4

180

14

-0,6967

 

-0,2570

 

0,1397

13,9722

 

0,0001

 

5

200

18

-0,1303

 

-0,0518

 

0,2052

20,5172

 

0,3088

 

6

220

24

0,4361

 

 

0,1686

 

0,2205

22,0454

 

0,1733

 

7

240

19

1,0025

 

 

0,3420

 

0,1733

17,3328

 

0,1604

 

8

260

10

1,5689

 

 

0,4417

 

0,0997

9,9712

 

0,0001

 

9

280

4

2,1353

 

 

0,4836

 

0,0420

4,1965

 

0,0092

 

10

300

1

2,7017

 

 

0,4966

 

0,0129

1,2918

 

0,0659

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

Â2 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10 (mi¡npi)2 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

npi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=2,2685

 

Далее определим число степеней свободы: r = k ¡ 3 = 10 ¡ 3 = 7, где "3" -

число связей, наложенных при выборе теоретической зависимости, а именно:

Pk Wi = 1; mx = m; Dx = D. i=1

По значениям Â2 и r из таблицы (см. Приложение, Таблица 3) находим искомую вероятность: p ¼ 0; 9.

Так как p > 0; 1, то гипотезу о нормальном законе распределения данной

11

случайной величины можно считать не противоречащей опытным данным, и нормальный закон может быть принят в качестве аппроксимирующего.

Постановка задачи

Случайная величина X, являющаяся ошибкой измерения некоторого расстояния, задана простой статистистической совокупностью (Таблица 1). Необходимо получить упорядоченный вариационный ряд, построить гистограмму частостей, выровнять статистический закон теоретическим (нормальным), проверить соответствие выбора.

Порядок выполнения работы

1.Определить размах вариационного ряда. Для этого выбрать наименьшее

инаибольшее значения случайной величины (т.е. xmin и xmax) и вычислить размах R = xmax ¡ xmin.

2.Выбрать число разрядов k.

3.Принять за интервал задания случайной величины промежуток, который содержит xmin и xmax и имеет границы, достаточно близкие к ним

иявляющиеся более удобными для вычислений.

4.Найти длины разрядов ¢x и заполнить Таблицу 2. Для проверки расчетов найти столбцовые суммы (см. Пример 1).

5.Используя Таблицу 2, построить гистограмму (рис. 1).

6.Заполнить Таблицу 3 и с ее помощью вычислить статистические значения математического ожидания, дисперсии и среднеквадратичного отклонения (см. Пример 2).

7.Выровнять гистограмму теоретическим нормальным законом распределения. Принимая m = mx, ¾ = ¾x, записать плотность вероятности

аппроксимирующего закона

 

1

¡

(x ¡ m)2

 

 

2¾2

.

 

¾p

 

f (x) =

2¼

e

 

Для иллюстрации эффективности подбора найти значения f (x) в серединных точках интервалов xi, заполнить Таблицу 4, нанести точки на рис. 1, найти вершину кривой и соединить полученные точки плавной линией (см. Пример 3).

12

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]