Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Дьяченко, А. Н. Интегральное исчисление функций нескольких переменных. Теория вероятностей и элементы математической статистики учебное пособие

.pdf

Скачиваний:

Добавлен:

19.10.2023

Размер:

7.54 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1916 17 18 19 > Следующая >>>

т. е.

Замечательным свойством этих законов распределения, которое и используется в статистике,'является их независимость от пара метров т и а. Единственным параметром этих законов распределе ния является число п случайных аргументов Число степеней свободы на единицу меньше, чем число аргументов. Аналитические выражения плотностей вероятностей случайных величин, распре деленных по закоцам %2 и Стьюдента, здесь не приведены, так как они довольно громоздки и на практике обычно пользуются не ана литическими выражениями, а таблицами. Заметим только, что

функции	распределения величин	%2п_ г и tn_ Y непрерывны,	плот
ность вероятности величины		на отрицательной полуоси равна
нулю, а	плотность вероятности	величины tn_ x является	четной

функцией. Вид кривых распределения (графиков плотностей веро ятности) для случайных величин, распределенных по законам %2 и Стьюдента, показан соответственно на рис. 58, а и б.

;5.11. Предельные теоремы теории вероятностей

Закон больших чисел. В § 1.4 говорилось о том, что явления, подчиненные вероятностным закономерностям, обладают следую щим свойством: при большом числе опытов ■частота события при близительно равна его вероятности. Более точно эта связь между частотами событий и вероятностями устанавливается в теоремах, получивших общее название закона больших чисел. К числу тео рем закона больших чисел относятся также теоремы, устанавли вающие связь между числовыми характеристиками случайной ве личины (такими, как математическое ожидание, дисперсия и т. п.) и их оценками, полученными по результатам наблюдения значений случайной величины в большой серии опытов. Во всех этих теоре мах выясняется, что среднее арифметическое значений случайной величины, принятых ею в серии опытов, при неограниченном уве личении числа опытов в серии утрачивает случайный характер. Первая теорема закона больших чисел была доказана в 1713 г. Бер нулли. В дальнейшем наиболее важные и полные результаты были получены Чебышевым, Марковым, Бернштейном и Хинчиным.

Из всех теорем закона больших чисел рассмотрим только две: Бернулли и Чебышева.

Сходимость по вероятности. Для формулировки теорем закона больших чисел удобно ввести понятие сходимости по вероятности.

Определение. Говорят, что при п -> с о случайная величина

сходится по вероятности к постоянному числу А , если для любого 8>>0, вероятность того, что значение случайной величины \п будет отличаться от числа А не больше, чем на е, стремится к единице при п -» о о ,

lim Р(\ 1п — А |< е ) = 1.

150

Теорема Бернулли. Предположим, что проводится последова тельность серий опытов, причем серия с номером п состоит из п опытов. Предположим также, что опыты проводятся по схеме Бер нулли, т. е. вероятность появления события А в каждом опыте по стоянна и не зависит от результатов других опытов, т. е. Р (А) = р в любом опыте, любой серии.

Обозначим через (Л) частоту появления события А в серии опытов с номером п. Число опытов в серии совпадает с номером серии, поэтому в соответствии с определением частоты события

И) = тп (А)

где тп (А) — число опытов в серии с номером п, в которых появи лось событие Л. В каждой серии опытов величина (Л) является случайной, причем закон распределения этой величины очевидно зависит от р и п. Для этой величины Бернулли доказал следующее утверждение.

Теорема. Частота р.„ (Л) события А сходится по вероятности к вероятности этого события р, т. е.

lim P (] М Л ) — р\ -< е )= 1 при любом 8>>0.

(5.121)

/ г - > СО

Теорема Чебышева. Рассмотрим последовательность серий оди наковых и независимых опытов. Пусть как и выше число опытов в каждой серии совпадает с номером серии. В каждом опыте наблю даются значения случайной величины Обозначим через Х1п зна чение £, наблюдающееся в г-м опыте серии с номером п. Тогда сред

нее арифметическое \п значений случайной величины £ наблюдаю щихся в серии с номером п, равно:

		п £=1
Очевидно	случайная	величина, распределение которой за
висит от распределения £		и числа опытов. Если дисперсия D [£ ]

случайной величины | конечна, то справедливо следующее утверж

дение, доказанное Чебышевым.			_
Теорема. Среднее арифметическое \п значений случайной вели
чины \|, наблюдавшихся в п опытах,			сходится по вероятности к ма
тематическому ожиданию М [£[ этой величины, т. е.
lim Р	2 х 1п- м [и	8	= 1 при любом s > 0 .	(5.122)
п->СО	i=i
Доказательство теорем Бернулли и Чебышева. Предварительно
докажем неравенство Чебышева:
	P (\| g - m l \| > 8 )< ^ - D [g ],			(5.123)

151

справедливое для любого е > 0 и всех случайных величин		имею
щих конечные математическое ожидание М [£.1 =	и дисперсию
D [£]. Предположим, что закон распределения	случайной	вели

чины £ задан плотностью вероятности (в случае дискретных случай

ных величин	доказательство проводится аналогично). Тогда
	-1-00	(х — m^f‘f{x)dx=	тg— 8	(х — m^)2f(x)dx-f- /
D[£] =	J	(х — m^f‘f{x)dx=	J	(х — m^)2f(x)dx-f- /
	— ОО		— СО
mg 4- 8		(х— m^)2f(x)dxJr	-f со	(x— m^)2f(x)dx.
+	f	(х— m^)2f(x)dxJr	J	(x— m^)2f(x)dx.
mg — 8			mg + s

Так как подынтегральное выражение неотрицательно, то каждый из интегралов неотрицателен, и если отбросить второй интеграл, то выражение не увеличится. Оставшиеся интегралы берутся по области, где \х— |>е, так что заменяя (х—т|)2 на е2, получаем оценку:

	Н-оо
d m :	f-(x)dx-\- J f(x)dx	(5.124)
	mg + 8

Первый интеграл в квадратных скобках равен вероятности со бытия А = — е}, второй — вероятнрсти события В = = + е). Заметим далее, что событие С = (|£ — т^\^>е}, противоположное событию {|| — т§\ < в}, состоит в выполнении одного из неравенств — е или |>/П| + е и, следовательно, является суммой событий А и В:

С = { \|£— ms\|>e) = А + В = { К т ^ г )		+ {\| > т \| + е}.
Так	как события А я В несовместные,	то Р (А) + Р (В) =
= Р (А	В), и, следовательно, выражение в квадратных скобках

равно вероятности того, что значение случайной величины будет отличаться от математического ожидания больше чем на е:

mg— 8	-foo
J	f{x)dxA- J f(x)dx = P(£,<im§ — е )+ Р (£ > m s -fe) =
—оо	mg+ е
	= P(\|g — m6\|>e).

Подставив полученное выражение в (5.124) и разделив правую и левую части на s2, получим (5.123).

Для доказательства теоремы Чебышева заметим, что поскольку рассматриваются независимые опыты, то значение случайной ве


личины £	в t-м опыте (i = 1, 2, .	, п) можно рассматривать как
значение случайной величины		имеющей такой же закон распре
деления,	что и \|, причем случайные величины		£2, . . . ,	яв-

1 п

ляются независимыми. При таком рассмотрении число — 2 X in

п ;=i

1	-	Найдем число-
будет значением случайной величины я\|з = —	2	Найдем число-

п г=1

152

вые характеристики т|>, используя свойства математического ожи дания и дисперсии:

М [гр] : М 2

2 M [ £ f] = M[£]; (5.125)

D № = — D 2 6, t==1

Событие (|ф— M [op]| < e) M [ф]|>е], поэтому

- V	2 D [Et]	D[£].	(5.126)
n 2	i = l

противоположно событию {|ф>—

Р(|ф— М [ ф ] | < е ) = 1 — Р(|ф — М№] |>е). (5.127)

Ввиду неравенства Чебышева (5.123) вычитаемое в правой ча

сти (5.127) меньше, чем — П[ф], поэтому

е 2

	Р ( \|г\|з— М [г\|5] \|		е) > 1------- Z) [гр].
						е 2
С другой стороны, вероятность любого						события	не превосходит
единицы,	так что
	1 > Р ( \| ф — М[ф] \| < е ) >				1-----—		(5.128)
						в2
Через яр обозначено среднее			арифметическое измеренных зна-
j	«	Подставляя его, а также выражение числовых ха-
чений —	2 ^ т -	Подставляя его, а также выражение числовых ха-
п	;=1			в (5.128), получим:
рактеристик ф из (5.125) и (5.126)				в (5.128), получим:
	> Р	± Ъ Х 1п- М [1 ]		> 8	>	1 -	■D№. (5.129)
Правая часть		при п -*■ о о стремится			к	1, левая часть равна 1,

следовательно, стремится к 1 и центральная часть неравенства, что доказывает теорему Чебышева.

Для доказательства теоремы Бернулли достаточно в теореме Чебышева рассмотреть случайную величину £, которая принимает значение 1, когда происходит событие Л, и 0, когда событие А не происходит.

Среднее арифметическое наблюдавшихся значений такой слу чайной величины будет равно частоте события А .

Центральная предельная теорема. Большое значение для теоре тического обоснования различных приложений теории вероятно стей имеют теоремы, выясняющие условия близости законов рас пределения различных случайных величин к тем или иным теоре тическим законам распределения. Наиболее важной теоремой ука занного типа является центральная предельная теорема. В этой

153

теореме выясняются условия, при которых закон распределения суммы

*= 2 5 ( i—1

случайных величин приближается к нормальному закону.

Одна из наиболее общих форм центральной предельной теоремы, область применения которой охватывает практически все интерес ные случаи, была доказана А. М. Ляпуновым в 1900 г. Не останав ливаясь на самых общих формах центральной предельной теоремы, сформулируем ее для случая одинаково распределенных независи мых слагаемых.

Теорема. Если	\|2, . . . ,	%п — независимые случайные вели
чины, имеющие один и тот же		закон распределения, с конечными

моментами до третьего порядка включительно, то при неограни-

П	неограни-
ченном увеличении п закон распределения суммы ф> = 2	неограни-
£=1
ченно приближается к нормальному.

Замечание. Эта теорема была доказана А. М. Ляпуновым для слагае мых, имеющих произвольные (не обязательно одинаковые) законы рас пределения, при условии, что

				п
		lim		ЦЬС= о
		п->оо
где	О; — дисперсия		= М [й ] .
	В	случае одинаково	распределенных слагаемых О; = сг, 6,- = b
и условие Ляпунова очевидно выполнено:
/	Л	—3/2 п	nb	ba- 3
		2 V	nb	ba- 3
			(па2)'3/2	0 П р и П - г - С О .
			(па2)'3/2	Vn

Центральная предельная теорема объясняет причины большого распространения нормально-распределенных величин. Закон рас пределения случайной величины близок к нормальному, если она может быть представлена в виде суммы достаточно большого числа практически произвольных независимых (или слабо зависимых) слагаемых, каждое из которых в отдельности сравнительно мало влияет на сумму. По этой причине, например, можно считать нор мальными законы распределения ошибок при измерении различных физических величин и т. п.

Г л а в а 6

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

6.1. Генеральная совокупность и выборка. Основные задачи математической статистики

Пусть требуется выяснить распределение какого-нибудь при знака среди, предметов, принадлежащих большой конечной или бесконечной совокупности. Признак может быть качественным

154

(например, каждое изделие в партии можно охарактеризовать как

стандартное и не стандартное) и	количественным, когда		исследуе
мые предметы характеризуются	значением	некоторой	величины
(например, электролампа — числом часов,		которое она	прорабо

тала до того, как перегорела, звезды — числом планет). В дальней шем будем рассматривать только количественные признаки, так как изучение качественного признака можно свести к изучению коли чественного, вводя величину, принимающую значение 1, если пред мет обладает исследуемым качеством, и 0, когда он этим качеством не обладает. Для простоты будем считать величину £, характеризую щую рассматриваемый признак, скалярной. Обозначим F (х) — долю предметов в интересующей исследователя совокупности, у которых | меньше х. Совокупность предметов, о которой хотят составить представление, в статистике называют генеральной совокупностью, а функцию F (х) — функцией распределения вероятностей вели чины \ в генеральной совокупности. Очень часто исследование всей совокупности невозможно, или связано с большими затратами. Тогда случайным образом (так что вероятность выбора любого предмета из генеральной совокупности одинакова) выбирают п предметов и только эти предметы генеральной совокупности под вергают обследованию, а на основании их обследования составляют представление о всей генеральной совокупности.

Обследуемый набор предметов называют выборкой объема п. Задачи математической статистики состоят в получении обоснован ных выводов о свойствах генеральной совокупности по известным свойствам извлеченной из нее выборки. Ниже рассмотрены следую щие типичные задачи математической* статистики:

а) установление закона распределения величины £ в генераль ной совокупности,

б) определение параметров закона распределения, когда закон распределения известен,

в) обработка результатов измерений.

Будем предполагать, что распределение вероятностей | в пред метах генеральной совокупности, оставшихся после извлечения из нее выборки, не зависит от того, какие именно предметы генераль ной совокупности попали в выборку. Это предположение, очевидно, выполняется для повторных выборок, которые составляются сле дующим образом: после того как предмет обследован и результаты обследования зарегистрированы, он опять возвращается в генераль ную совокупность и может быть выбран (в ту же выборку) снова. Для бесповторной выборки, когда обследуемые предметы обратно в генеральную совокупность не возвращаются, это предположение будет практически справедливым, если объем генеральной совокуп ности намного больше объема выборки (например, для бесконечной генеральной совокупности).

155

6.2. Описание и систематизация выборки

Для удобства обработки и описания результатов выборки вы борочные значения | (т. е. значения полученные в результате обследования предметов, составляющих выборку) прежде всего располагают в неубывающем порядке, перенумеровав соответствую щим образом члены выборки: Х х < Х 2 < . . . < Хп_ 1< Х п (неко

торые соседние значения могут быть одинаковыми). Такая после довательность выборочных значе ний, расположенных в неубываю щем порядке, называется вариа ционным рядом. Средний член ва риационного ряда называется ме дианой выборки. Если п-нечетное число, медиана равна X л+1, если

		четное, то медианы две: X
Ри с . 59	X	При дальнейшей систе
Ри с . 59		+1

матизации выборки небольшого объема иногда рассматривается дискретная случайная величина £*, возможными значениями которой являются выборочные значения £, а их вероятностями — частоты. Закон распределения случайной величины £* называется выборочным или эмпирическим законом

распределения, числовые харак				V
теристики	£* — характеристиками			vn
выборки, график функции распре				4 0 -
деления	F* (х) — кривой	накоп		30 -
ленных частот (рис. 59).				30 -
Среднее значение или математи				20 -
ческое ожидание выборки опреде				10
ляется формулой:				10	°к~1 Л_
				О	°к~1 Л_		13,6
	— 2 х {\	(6. 1)		13	13,2	Xf.13,4	13,6
	— 2 х {\	(6. 1)
	п 1=1					Рис. 60
выборочная дисперсия						Рис. 60
выборочная дисперсия
	£ )[ £ * ]= а 2 = - ! 2 ( У — I						(6.2)
		«	i=i	1
выборочный момент порядка		k
	*	»	i u *		'		(6.3)
	*	»	Н	1			v '

Пример 1. Для обследования отобраны 10 шт. последовательно отштам пованных колец шарикоподшипников. Результаты замеров высоты колец следующие:

156

Номер	опыта . . .	1	2	3	4	5	6	7	8
Высота кольца, мм 31,57; 32,61; 32,68; 32,09; 32,36; 31,75; 31,98;									32,46;
9	10
31,33;	32,46

Соответствующий вариационный ряд . . . 31,33; 31,57; 31,75; 31,98; 32,09; 32,36; 32,46; 32,46; 32,61; 32,68. Медианами являются 32,09 и

32,36. Кривая накопленных частот показана на рис. 59. £* = 32,129;

а2 = 0,193.

Для выборок большого объема распространен другой способ графического представления. Весь интервал числовой оси, в кото рый попадают выборочные значения \ делят на п (обычно 10—20) равных частей точками а0<С,а1<С_а2<^ . . . Обозначим vk число предметов выборки, для которых значения | попадают в про межуток [ak^v aky Над каждым таким промежутком на графике

строится прямоугольник высотой vk. Полученную ступенчатую фигуру называют гистограммой выборки (рис. 60). Рассматривается

случайная величина £* с возможными значениями xk= ak~1^rClk ;

каждое такое значение имеет вероятность — . Выборочным законом

распределения считается распределение |*, выборочные среднее и дисперсия находятся по формулам

i * = 4 - i s ' w	i > * ( ^ - i * ) 2	(6.4)
п ft=i	* п k=l

И т. д .

Советским математиком Гливенко доказана теорема о том, что при достаточно большом объеме выборки п и малом А = ak— ak_ x

выборочный закон распределения сколь угодно близок к закону распределения генеральной совокупности.

Правило «ложного» нуля. Для упрощения расчетов при вычис лении числовых характеристик выборки удобно воспользоваться правилом «ложного нуля». Правило это состоит в следующем.

Выбирается произвольное число а, после чего формула (6.1) для среднего значения выборки заменяется равносильной ей фор мулой

1 * = 4 - 2 ( Х , - а ) + а.	(6.5)
п i=i

Формула для выборочной дисперсии преобразуется следующим

образом:
=	1 ( X - l y = ± S (X , - a + a - t y .	(6.6)

Возводя в квадрат выражения, стоящие в скобках, преобразуем каждое слагаемое в правой части:

(Х1—а+ а — С*)2 - (Xi- a ) z + 2 (Х ,- а ) ( а - ! * ) + (а -| * )2. (6.7)

Просуммируем (6.7) по i, сгруппировав вместе сначала первые слагаемые, затем вторые и третьи. Вторые слагаемые содержат

157

общий множитель 2 (а—£*), который можно вынести за знак суммы,

2	2 (Xt- a ) (а— f) = 2 ( а - 1) £ (Xt- a ) .
1= 1	i= 1
Ввиду (6.5)
	а) = п(Ъ*—а),
поэтому	t= 1
поэтому

2 2 (Х;—а) (а —£*) = —2п (а —£*)2.

£=1

Третьи слагаемые в (6.7) одинаковы при всех i, поэтому их сумма будет равна п (а—|*)2. Таким образом,

2 № - а + а - 1 * ) 2= 2 № -
t=i	г=1

— а)2 — 2п (а— 1*)2 + п (а— £*)2.

После приведения подобных членов и подстановки получен ного выражения в (6.6) оконча тельно получаем:

° 2 = ^ 2 № - а ) 2- ( а - \| * ) 2.
*	п t=i

( 6.8)

Заметим, что формулы (6.5) и (6.8) справедливы при любом а, поэтому а подбирается таким образом, чтобы вычисление сумм в (6.5) и (6.8) оказалось воз можно более простым (в форму лах (6.5) и (6.8) можно брать не одинаковые а).

Пример 2 (продолжение примера 1). Для упрощения вычисления поло жим а = 32,1. Вычислим разности Х{—а: — 0,77; — 0,53; — 0,35;

— 0,12; — 0,01; 0,26; 0,36; 0,36; 0,51; 0,58. Сумма этих разностей равна

0,29, поэтому согласно формуле (6.5)

I* = — -0,29 + 32,1 =32,129.

Возведем в квадрат каждую разность X i — а, а затем сложив по

лученные числа, получим 1,9341. Далее находим, что (а — | * ) 2 = = 0,000851. Вычисляем выборочную дисперсию, используя формулу

ст2= — .1,9341 — 0,000851 = 0,192559 « 0,193.

ПримерЗ. В первых трех столбцах табл. 1 приведены данные результатов измерения диаметров головок 2 00 заклепок.

158

					Та б ли ц а 1
i	xi	vi	'Н	Ф 1	)
				Ф 1	)
1	13,12	2	0,010	0,007	0,003
2	13,17	1	0,015	0,022	—0,007
3	13,22	8	0,055	0,054	0,001
4	13,27	17	0,140	0,136	0,004
5	13,32	27	0,275	0,261	0,014
6	13,37	30	0,425	0,425	0,000
7	13,42	37	0,610	0,606	0,004
8	13,47	27	0,745	0,767	—0,022
9	13,52	25	0,870	0,881	—0,011
10	13,57	17	0,955	0,946	0,009
11	13,62	7	0,990	0,982	0,008
12	13,67	2	1,000	0,995	0,005

Все выборочные значения сгруппированы в 12 интервалов длиной 0,05 мм каждый. В первом столбце помещены номера интервалов г,

а. — a-_j
во втором — середины интервалов Xj = ——	------, в третьем — число
заклепок, диаметры головок которых попали	в интервал [х;—0,025,

х( + 0,025].	Гистограмма выборки показана на рис. 60. Значения
выборочного	среднего	и дисперсии,	сосчитанные по формулам (6.4),
равны:
	I* =	13,416; а2 =	0,0120.
		*

Полученный эмпирический закон распределения заменяют в том или ином отношении близкой к нему удобной аналитической функ цией. Для этой цели могут быть использованы нормальная функция распределения, кривые Пирсона и т. д. Для приближенного пред ставления выборочного распределения дискретной случайной ве личины может оказаться полезным закон распределения Пуассона с соответствующим образом выбранным параметром а. Более под робно о представлении эмпирических зависимостей аналитическими функциями будет сказано в § 6.5.

Пример 4 (продолжение примера 3). В качестве приближения кривой накопленных частот закона распределения диаметров заклепок возь мем функцию распределения для нормального закона с параметрами

m =	=	13,416, а = а* =0,109. Значения этой функции в точках
ai =	Х{ +	0,025		помещены в пятом столбце. Четвертый столбец содер
жит значения			накопленных частот, т. е. числа щ = —5— (v, 4- v2+
+ •••+		vi)-	в	200	р,(-
				последнем столбце указана разность Д; значений
и функции распределения в соответствующих точках.					и
	На рис. 61,			а и б сплошными линиями показаны гистограммы

кривая накопленных частот выборки, а пунктиром — приближающие

их функции Ф ) и / (х) = Ф.; ( £ " -~) - ^ г •

159

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1916 17 18 19 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ