Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский национальный исследовательский университет им. ак. С.П. Королёва (бывш. СГАУ, СамГУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

S&M

.pdf

Скачиваний:

Добавлен:

16.03.2015

Размер:

352.26 Кб

Скачать

☆

1 / 21 2 > Следующая >>>

Содержание

1Элементы математической статистики . . . . . . . . . . . . . . . 4

1.1Первичная обработка данных . . . . . . . . . . . . . . . . 4

1.2Вычисление оценок числовых характеристик статистического распределения . . . . . . . . . . . . . . . . . . . . 7

1.3Выравнивание статистического ряда . . . . . . . . . . . . 8

1.4Статистическая проверка гипотез. Критерий согласия . . 10 Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Приложения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

для каждого интервала.

1Элементы математической статистики

Основной задачей математической статистики является описание и анализ экспериментальных данных, полученных в результате наблюдения массовых случайных явлений. В статистике множество значений, которые может принимать исследуемая случайная величина (в дальнейшем С.В.) X, называется генеральной совокупностью. Подмножество, отобранное из генеральной совокупности случайным образом (наугад), называется случайной выборкой или простой статистической совокупностью. Элементы случайной выборки обозначаются буквами x1; x2; : : : ; xn, где n - объем выборки.

Задача методов математической статистики состоит в том, чтобы по выборке, извлекая из нее максимум информации, сделать те или иные выводы о генеральной совокупности, в частности, выводы о параметрах распределения С.В. и правдоподобии гипотезы о том, что С.В. имеет тот или иной закон распределения.

1.1Первичная обработка данных

Выборка из генеральной совокупности представляет собой первичный статистический материал, подлежащий обработке и анализу. Если объем выборки достаточно велик (порядка сотен), то для придания статистическому материалу большей компактности и наглядности его подвергают дополнительной обработке, а именно: строят статистический ряд.

Для этого весь диапазон наблюдаемых значений С.В. X делят на интервалы (так называемые "разряды") и подсчитывают количество значений С.В., попавших в данный разряд. Эти величины называют частотами, их обознача-

ют mi (т.е. mi – это частота i-го разряда [xi¡1; xi]). Очевидно, что Pk mi = n,

i=1

где n - объем выборки, k – число разрядов.

Замечание 1. Количество разрядов k при заданном объеме выборки n обычно определяют из соотношения: k ¸ 3; 32 lg n + 1. Так, например, при n = 100 получим k ¸ 8.

Замечание 2. В случае, если значение С.В. находится на границе двух разрядов, то, по договоренности, его относят либо к "левому", либо к "правому" разряду, либо к частотам обоих смежных разрядов добавляют по

1=2.

Далее числа mi делят на общее число наблюдений n и находят относи-

тельные частоты или частости разрядов Wi = mi n

Очевидно, что Pk Wi = 1.

i=1

Таблица, в которой приведены разряды в порядке их расположения вдоль оси абсцисс и соответствующие им частоты и частости, называется упорядоченным вариационным рядом.

Статистический ряд оформляется графически в виде гистограммы, которая строится следующим образом. По оси абсцисс откладывают разряды и на каждом из них строят прямоугольник, площадь которого равна относительной частоте или частости данного разряда. Из способа построения гистограммы следует, что высота каждого прямоугольника hi = ¢Wxi (здесь ¢x¡ длина разряда). Полная площадь гистограммы равна единице.

Пример 1.

Случайная величина X, представляющая собой ошибку измерения некоторого расстояния, задана простой статистической совокупностью (Таблица1). Составить упорядоченный вариационный ряд и построить гистограмму частостей, заполнив Таблицу 2.

Таблица 1.

Простая статистическая совокупность

i	xi	i	xi	i	xi	i	xi	i	xi
1	161	21	241	41	183	61	243	81	258
2	181	22	248	42	230	62	195	82	245
3	163	23	169	43	170	63	205	83	153
4	263	24	216	44	210	64	199	84	225
5	185	25	296	45	189	65	184	85	185
6	221	26	219	46	229	66	222	86	125
7	111	27	218	47	138	67	224	87	247
8	187	28	271	48	201	68	206	88	157
9	121	29	217	49	159	69	211	89	214
10	239	30	254	50	237	70	164	90	189
11	267	31	227	51	190	71	230	91	234
12	127	32	255	52	228	72	182	92	172
13	210	33	215	53	173	73	142	93	203
14	188	34	258	54	204	74	167	94	190
15	211	35	229	55	191	75	253	95	148
16	238	36	235	56	227	76	239	96	222
17	208	37	182	57	170	77	219	97	164
18	165	38	203	58	225	78	267	98	211
19	202	39	193	59	218	79	208	99	196
20	209	40	219	60	178	80	177	100	161

1)Определим размах выборки R. Для этого найдем наименьшее и наибольшее значения С.В. X:

xmin = x7 = 111; xmax = x25 = 296

и вычислим размах R = xmax ¡ xmin = 296 ¡ 111 = 185.

2)Выберем число разрядов k = 10.

3)Примем за интервал задания С.В. X такой промежуток, который содер-

жит xmin, xmax и имеет достаточно близкие к ним границы со значениями, более удобными для расчетов: x0 = 100, x10 = 300.

4)Построим упорядоченный вариационный ряд. Для этого найдем длину разряда и заполним Таблицу 2. Для контроля расчета найдем столбцовые суммы.

					¢x =	x10 ¡ x0		=	200		= 20:
					¢x =	k		=		10	= 20:
						k				10
Таблица 2.
Упорядоченный вариационный ряд

Номер	Границы				Среднее	Частота					Частость				Высота
раз-	разряда				значение	разряда					разряда				i-го прямо-
ряда	(x	i¡1	; x	)	разряда	m					W	i	=	mi	угольника
i		i¡1	i		xi	i						i		n	гистограммы
i					xi										гистограммы
															hi = ¢Wxi
1	100-120				110	1					0,01				0,0005
2	120-140				130	4					0,04				0,002
3	140-160				150	5					0,05				0,0025
4	160-180				170	14					0,14				0,007
5	180-200				190	18					0,18				0,009
6	200-220				210	24					0,24				0,012
7	220-240				230	19					0,19				0,0095
8	240-260				250	10					0,1				0,005
9	260-280				270	4					0,04				0,002
10	280-300				290	1					0,01				0,0005
						P					P				P
						10					10				10
							mi = 100						Wi = 1		¢x¢ hi = 1
						i=1					i=1				i=1

5)По результатам, полученным в Таблице 2, построим гистограмму. Для этого в прямоугольной системе координат на оси абсцисс отложим значения границ разрядов и на каждом из интервалов с номером i построим прямоугольник высоты hi (рис. 1).

Рис. 1.

1.2Вычисление оценок числовых характеристик статистического распределения

При большом количестве опытов статистические значения числовых характеристик С.В. вычисляют по формулам:

1 Xk

mx = n i=1 xi ¢ mi;

Dx = n1 Xk (xi ¡ mx)2 ¢ mi; i=1 q

¾x = Dx;

где mx– статистическое значение математического ожидания, Dx– статистическое значение дисперсии, ¾x– статистическое значение среднеквадратичного отклонения.

Пример 2.

Для cлучайной величины X из примера 1 найти числовые характеристики математического ожидания mx и дисперсии Dx.

1 X10

mx = 100 i=1 xi ¢ mi;

1 X10

Dx = 100 i=1 (xi ¡ mx)2 ¢ mi:

Для удобства вычисления численных значений характеристик заполним Таблицу 3.

Таблица 3.

Вычисление статистических значений числовых характеристик С.В.


i xi		mi	xi ¢ mi	(xi ¡ mx)2 ¢ mi
1	110	1	110	8949,18
2	130	4	520	22260,64
3	150	5	750	14905,80
4	170	14	2380	16760,24
5	190	18	3420	3836,88
6	210	24	5040	699,84
7	230	19	4370	12258,04
8	250	10	2500	20611,60
9	270	4	1080	17108,64
10	290	1	290	7293,16


iP								1P
10	xi ¢ mi							10
	xi ¢ mi		= 20460						(xi ¡ mx)2 ¢ mi = 124684; 00
=1								i=1
	Тогда			mx =					¢ 20460 = 204; 6;
	Тогда			mx =			100		¢ 20460 = 204; 6;
			1		¢ 124684; 00 = 1246; 84;
	Dx =		1

				100
		¾x = p								¼ 35; 31:
		¾x = p				1246; 84				¼ 35; 31:

1.3Выравнивание статистического ряда

При обработке статистического материала одним из важнейших вопросов является вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения, выражающую только существенные черты статистического материала, а не случайности, связанные с недостаточным объемом экспериментальных данных. Такая задача называется задачей выравнивания (сглаживания) статистических рядов.

Таким образом, задача выравнивания состоит в том, чтобы подобрать теоретическую плавную кривую распределения, наилучшим образом описывающую данное статистическое распределение.

Пример 3.

Вернемся к примеру 1. Так как случайная величина X есть ошибка измерения, возникающая в результате суммирования множества независимых элементарных ошибок, то из теоретических соображений можно предположить, что С.В. X подчиняется нормальному закону. Поэтому выровняем гистограмму теоретическим нормальным законом. Принимая m = mx, D = Dx, ¾ = ¾x, запишем плотность вероятности аппроксимирующего закона:

m)2

(x ¡ 204; 6)2

2¾2

(35; 31)

f (x) =

¾p

35; 31p

2¼

Для иллюстрации эффективности подбора найдем значения функции f (x) в точках xi (см. Приложение, Таблица 2), нанесем их на рис. 1 и соединим

плавной кривой, учитывая, что вершина кривой имеет координаты

µ 1 ¶ mx; ¾p2¼ .

Результаты расчета занесем в Таблицу 4.

Таблица 4.

Выравнивание статистического закона распределения


i	x		t =	xi ¡ m	1		e¡t22	f (x	) =	1		e¡t22

		i	¾		p2¼	¢		i		¾p2¼	¢
1	110		-2,6791		0,0110				0,0003
2	130		-2,1127		0,0428				0,0012
3	150		-1,5463		0,1207				0,0034
4	170		-0,9799		0,2468				0,0070
5	190		-0,4135		0,3663				0,0104
6	210		0,1529		0,3943				0,0112
7	230		0,7193		0,3080				0,0087
8	250		1,2857		0,1746				0,0049
9	270		1,8521		0,0718				0,0020
10	290		2,4185		0,0214				0,0006

1.4Статистическая проверка гипотез. Критерий согласия

Предположим, что данное статистическое распределение выровнено с помощью некоторой теоретической кривой f (x). Очевидно, что между статистическим распределением и теоретической кривой неизбежны расхождения. Тогда возникает вопрос о том, насколько эти расхождения существенны и связаны ли они с тем, что подобранная нами кривая плохо выравнивает данное статистическое распределение. Для ответа на этот вопрос применяют "критерий согласия".

Идея применения критериев согласия состоит в том, что на основании известного статистического материала проводится проверка гипотезы о том, что исследуемая С.В. X подчиняется некоторому определенному закону распределения (например, нормальному, показательному и т.д.).

Наиболее часто применяемым критерием согласия является "критерий Â2" Пирсона, суть которого заключается в следующем. Для проверки того, согласуются ли экспериментальные данные с гипотезой о том, что С.В. X имеет данный "теоретический" закон распределения, находят теоретические вероятности попадания случайной величины в каждый из разрядов (они обозна-

чаются pi) и вычисляют величину Â2 = Pk (mi ¡ npi)2 . Значение Â2 зависит

i=1 npi

от параметра r, который называется числом "степеней свободы" и находится как разность числа разрядов k и числа независимых условий ("связей"), наложенных на относительные частоты.

Для Â2 составлены специальные таблицы (см. Приложение, Таблица 3, Таблица 4), из которых по известным значениям Â2 и r находят вероятность p. Если эта вероятность p мала (практически меньше 0; 1), то результат опыта следует считать противоречащим выдвинутой гипотезе, и эта гипотеза отбрасывается, как неправдоподобная. Если же вероятность p сравнительно велика, то можно считать расхождения между статистическим и теоретическим распределениями несущественными и гипотезу о том, что случайная величина подчиняется данному теоретическому закону распределения, можно считать правдоподобной.

Замечание.

Вывод о "правдоподобности" гипотезы ни в коем случае не следует понимать как достоверный факт того, что гипотеза верна. Этот вывод означает только то, что гипотеза не противоречит опытным данным (не более того).

Пример 4.

Для рассмотренной в предыдущих примерах случайной величины X рассмотрим гипотезу о том, что она имеет нормальный закон распределения.

Тогда теоретические вероятности того, что С.В. попадает в i-й разряд

[xi¡1 ; xi], находятся по формуле

= ©

xi ¡ mx

xi¡1 ¡ mx

;

¾x

e¡

dt, значения которой

2¼

находят из таблицы (см. Приложение, Таблица 1). Результаты вычислений заносим в Таблицу 5.

Таблица 5.

Вычисление критерия согласия

i	x		m		xi ¡ mx	©		xi ¡ mx	¶	p		n	¢	p			(mi ¡ npi)2
i	x		m		¾x	©		¾x		p		n		p
		i	i		¾x	µ		¾x			i				i			npi
0	100		-	-2,9623		-0,4985
1	120		1	-2,3959		-0,4917				0,0068		0,6763					0,1549
2	140		4	-1,8295		-0,4663				0,0254		2,5374					0,8431
3	160		5	-1,2631		-0,3967				0,0696		6,9617					0,5528
4	180		14	-0,6967		-0,2570				0,1397		13,9722					0,0001
5	200		18	-0,1303		-0,0518				0,2052		20,5172					0,3088
6	220		24	0,4361			0,1686			0,2205		22,0454					0,1733
7	240		19	1,0025			0,3420			0,1733		17,3328					0,1604
8	260		10	1,5689			0,4417			0,0997		9,9712					0,0001
9	280		4	2,1353			0,4836			0,0420		4,1965					0,0092
10	300		1	2,7017			0,4966			0,0129		1,2918					0,0659
																	P	Â2 =
																=	P
																=	10 (mi¡npi)2 =
																	i=1	npi
																	=2,2685

Далее определим число степеней свободы: r = k ¡ 3 = 10 ¡ 3 = 7, где "3" -

число связей, наложенных при выборе теоретической зависимости, а именно:

Pk Wi = 1; mx = m; Dx = D. i=1

По значениям Â2 и r из таблицы (см. Приложение, Таблица 3) находим искомую вероятность: p ¼ 0; 9.

Так как p > 0; 1, то гипотезу о нормальном законе распределения данной

случайной величины можно считать не противоречащей опытным данным, и нормальный закон может быть принят в качестве аппроксимирующего.

Постановка задачи

Случайная величина X, являющаяся ошибкой измерения некоторого расстояния, задана простой статистистической совокупностью (Таблица 1). Необходимо получить упорядоченный вариационный ряд, построить гистограмму частостей, выровнять статистический закон теоретическим (нормальным), проверить соответствие выбора.

Порядок выполнения работы

1.Определить размах вариационного ряда. Для этого выбрать наименьшее

инаибольшее значения случайной величины (т.е. xmin и xmax) и вычислить размах R = xmax ¡ xmin.

2.Выбрать число разрядов k.

3.Принять за интервал задания случайной величины промежуток, который содержит xmin и xmax и имеет границы, достаточно близкие к ним

иявляющиеся более удобными для вычислений.

4.Найти длины разрядов ¢x и заполнить Таблицу 2. Для проверки расчетов найти столбцовые суммы (см. Пример 1).

5.Используя Таблицу 2, построить гистограмму (рис. 1).

6.Заполнить Таблицу 3 и с ее помощью вычислить статистические значения математического ожидания, дисперсии и среднеквадратичного отклонения (см. Пример 2).

7.Выровнять гистограмму теоретическим нормальным законом распределения. Принимая m = mx, ¾ = ¾x, записать плотность вероятности

аппроксимирующего закона

	1		¡	(x ¡ m)2
				2¾2	.
	¾p
f (x) =		2¼	e

Для иллюстрации эффективности подбора найти значения f (x) в серединных точках интервалов xi, заполнить Таблицу 4, нанести точки на рис. 1, найти вершину кривой и соединить полученные точки плавной линией (см. Пример 3).

1 / 21 2 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
07.06.2015135.17 Кб4Reklamnoe_soobsenie.doc
#
25.11.20191.54 Mб74REUB_prakt.doc
#
20.11.201956.5 Кб4rgr.docx
#
20.11.20191.25 Mб1RGR_doc.doc
#
28.03.20162.32 Mб30Russia_in_WW1_SOR_Preprint (1).pdf
#
16.03.2015352.26 Кб10S&M.pdf
#
07.06.2015124.93 Кб16SAMOREGULYaJIYa_TREN.doc
#
16.03.20155.72 Mб152Savchenko_Lektsii_Nachertatelnaya_geometriya.doc
#
07.06.2015240.64 Кб19savova_ritorics.doc
#
29.03.20161.78 Mб91SAX tenor.pdf
#
07.06.201548.64 Кб8seminari po filosofii.doc

i	xi	i	xi	i	xi	i	xi	i	xi
1	161	21	241	41	183	61	243	81	258
2	181	22	248	42	230	62	195	82	245
3	163	23	169	43	170	63	205	83	153
4	263	24	216	44	210	64	199	84	225
5	185	25	296	45	189	65	184	85	185
6	221	26	219	46	229	66	222	86	125
7	111	27	218	47	138	67	224	87	247
8	187	28	271	48	201	68	206	88	157
9	121	29	217	49	159	69	211	89	214
10	239	30	254	50	237	70	164	90	189
11	267	31	227	51	190	71	230	91	234
12	127	32	255	52	228	72	182	92	172
13	210	33	215	53	173	73	142	93	203
14	188	34	258	54	204	74	167	94	190
15	211	35	229	55	191	75	253	95	148
16	238	36	235	56	227	76	239	96	222
17	208	37	182	57	170	77	219	97	164
18	165	38	203	58	225	78	267	98	211
19	202	39	193	59	218	79	208	99	196
20	209	40	219	60	178	80	177	100	161

i	xi	i	xi	i	xi	i	xi	i	xi
1	161	21	241	41	183	61	243	81	258
2	181	22	248	42	230	62	195	82	245
3	163	23	169	43	170	63	205	83	153
4	263	24	216	44	210	64	199	84	225
5	185	25	296	45	189	65	184	85	185
6	221	26	219	46	229	66	222	86	125
7	111	27	218	47	138	67	224	87	247
8	187	28	271	48	201	68	206	88	157
9	121	29	217	49	159	69	211	89	214
10	239	30	254	50	237	70	164	90	189
11	267	31	227	51	190	71	230	91	234
12	127	32	255	52	228	72	182	92	172
13	210	33	215	53	173	73	142	93	203
14	188	34	258	54	204	74	167	94	190
15	211	35	229	55	191	75	253	95	148
16	238	36	235	56	227	76	239	96	222
17	208	37	182	57	170	77	219	97	164
18	165	38	203	58	225	78	267	98	211
19	202	39	193	59	218	79	208	99	196
20	209	40	219	60	178	80	177	100	161

i	xi	i	xi	i	xi	i	xi	i	xi
1	161	21	241	41	183	61	243	81	258
2	181	22	248	42	230	62	195	82	245
3	163	23	169	43	170	63	205	83	153
4	263	24	216	44	210	64	199	84	225
5	185	25	296	45	189	65	184	85	185
6	221	26	219	46	229	66	222	86	125
7	111	27	218	47	138	67	224	87	247
8	187	28	271	48	201	68	206	88	157
9	121	29	217	49	159	69	211	89	214
10	239	30	254	50	237	70	164	90	189
11	267	31	227	51	190	71	230	91	234
12	127	32	255	52	228	72	182	92	172
13	210	33	215	53	173	73	142	93	203
14	188	34	258	54	204	74	167	94	190
15	211	35	229	55	191	75	253	95	148
16	238	36	235	56	227	76	239	96	222
17	208	37	182	57	170	77	219	97	164
18	165	38	203	58	225	78	267	98	211
19	202	39	193	59	218	79	208	99	196
20	209	40	219	60	178	80	177	100	161