Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Дьяченко, А. Н. Интегральное исчисление функций нескольких переменных. Теория вероятностей и элементы математической статистики учебное пособие

.pdf
Скачиваний:
26
Добавлен:
19.10.2023
Размер:
7.54 Mб
Скачать
т. е.

Замечательным свойством этих законов распределения, которое и используется в статистике,'является их независимость от пара­ метров т и а. Единственным параметром этих законов распределе­ ния является число п случайных аргументов Число степеней свободы на единицу меньше, чем число аргументов. Аналитические выражения плотностей вероятностей случайных величин, распре­ деленных по закоцам %2 и Стьюдента, здесь не приведены, так как они довольно громоздки и на практике обычно пользуются не ана­ литическими выражениями, а таблицами. Заметим только, что

функции

распределения величин

%2п_ г и tn_ Y непрерывны,

плот­

ность вероятности величины

на отрицательной полуоси равна

нулю, а

плотность вероятности

величины tn_ x является

четной

функцией. Вид кривых распределения (графиков плотностей веро­ ятности) для случайных величин, распределенных по законам %2 и Стьюдента, показан соответственно на рис. 58, а и б.

;5.11. Предельные теоремы теории вероятностей

Закон больших чисел. В § 1.4 говорилось о том, что явления, подчиненные вероятностным закономерностям, обладают следую­ щим свойством: при большом числе опытов ■частота события при­ близительно равна его вероятности. Более точно эта связь между частотами событий и вероятностями устанавливается в теоремах, получивших общее название закона больших чисел. К числу тео­ рем закона больших чисел относятся также теоремы, устанавли­ вающие связь между числовыми характеристиками случайной ве­ личины (такими, как математическое ожидание, дисперсия и т. п.) и их оценками, полученными по результатам наблюдения значений случайной величины в большой серии опытов. Во всех этих теоре­ мах выясняется, что среднее арифметическое значений случайной величины, принятых ею в серии опытов, при неограниченном уве­ личении числа опытов в серии утрачивает случайный характер. Первая теорема закона больших чисел была доказана в 1713 г. Бер­ нулли. В дальнейшем наиболее важные и полные результаты были получены Чебышевым, Марковым, Бернштейном и Хинчиным.

Из всех теорем закона больших чисел рассмотрим только две: Бернулли и Чебышева.

Сходимость по вероятности. Для формулировки теорем закона больших чисел удобно ввести понятие сходимости по вероятности.

Определение. Говорят, что при п -> с о случайная величина

сходится по вероятности к постоянному числу А , если для любого 8>>0, вероятность того, что значение случайной величины \п будет отличаться от числа А не больше, чем на е, стремится к единице при п о о ,

lim Р(\ 1п — А |< е ) = 1.

150

Теорема Бернулли. Предположим, что проводится последова­ тельность серий опытов, причем серия с номером п состоит из п опытов. Предположим также, что опыты проводятся по схеме Бер­ нулли, т. е. вероятность появления события А в каждом опыте по­ стоянна и не зависит от результатов других опытов, т. е. Р (А) = р в любом опыте, любой серии.

Обозначим через (Л) частоту появления события А в серии опытов с номером п. Число опытов в серии совпадает с номером серии, поэтому в соответствии с определением частоты события

И) = тп (А)

где тп (А) — число опытов в серии с номером п, в которых появи­ лось событие Л. В каждой серии опытов величина (Л) является случайной, причем закон распределения этой величины очевидно зависит от р и п. Для этой величины Бернулли доказал следующее утверждение.

Теорема. Частота р.„ (Л) события А сходится по вероятности к вероятности этого события р, т. е.

lim P (] М Л ) — р\ -< е )= 1 при любом 8>>0.

(5.121)

/ г - > СО

Теорема Чебышева. Рассмотрим последовательность серий оди­ наковых и независимых опытов. Пусть как и выше число опытов в каждой серии совпадает с номером серии. В каждом опыте наблю­ даются значения случайной величины Обозначим через Х1п зна­ чение £, наблюдающееся в г-м опыте серии с номером п. Тогда сред­

нее арифметическое \п значений случайной величины £ наблюдаю­ щихся в серии с номером п, равно:

 

 

п £=1

Очевидно

случайная

величина, распределение которой за­

висит от распределения £

и числа опытов. Если дисперсия D [£ ]

случайной величины | конечна, то справедливо следующее утверж­

дение, доказанное Чебышевым.

 

_

 

Теорема. Среднее арифметическое \п значений случайной вели­

чины |, наблюдавшихся в п опытах,

сходится по вероятности к ма­

тематическому ожиданию М [£[ этой величины, т. е.

 

lim Р

2 х 1п- м

8

= 1 при любом s > 0 .

(5.122)

п->СО

i=i

 

 

 

Доказательство теорем Бернулли и Чебышева. Предварительно

докажем неравенство Чебышева:

 

 

 

 

P (| g - m l | > 8 )< ^ - D [g ],

(5.123)

151

справедливое для любого е > 0 и всех случайных величин

имею­

щих конечные математическое ожидание М [£.1 =

и дисперсию

D [£]. Предположим, что закон распределения

случайной

вели­

чины £ задан плотностью вероятности (в случае дискретных случай­

ных величин

доказательство проводится аналогично). Тогда

 

-1-00

(х m^f‘f{x)dx=

тg— 8

m^)2f(x)dx-f- /

D[£] =

J

J

 

— ОО

 

— СО

 

mg 4- 8

m^)2f(x)dxJr

-f со

(xm^)2f(x)dx.

+

f

J

mg — 8

 

mg + s

 

Так как подынтегральное выражение неотрицательно, то каждый из интегралов неотрицателен, и если отбросить второй интеграл, то выражение не увеличится. Оставшиеся интегралы берутся по области, где — |>е, так что заменяя т|)2 на е2, получаем оценку:

 

Н-оо

 

d m :

f-(x)dx-\- J f(x)dx

(5.124)

 

mg + 8

 

Первый интеграл в квадратных скобках равен вероятности со­ бытия А = — е}, второй — вероятнрсти события В = = + е). Заметим далее, что событие С = (|£ — т^\^>е}, противоположное событию {|| — т§\ < в}, состоит в выполнении одного из неравенств — е или |>/П| + е и, следовательно, является суммой событий А и В:

С = { |£— ms|>e) = А + В = { К т ^ г )

+ {| > т | + е}.

Так

как события А я В несовместные,

то Р (А) + Р (В) =

= Р (А

В), и, следовательно, выражение в квадратных скобках

равно вероятности того, что значение случайной величины будет отличаться от математического ожидания больше чем на е:

mg— 8

-foo

J

f{x)dxA- J f(x)dx = P(£,<im§ — е )+ Р (£ > m s -fe) =

—оо

mg+ е

 

= P(|g — m6|>e).

Подставив полученное выражение в (5.124) и разделив правую и левую части на s2, получим (5.123).

Для доказательства теоремы Чебышева заметим, что поскольку рассматриваются независимые опыты, то значение случайной ве­

личины £

в t-м опыте (i = 1, 2, .

, п) можно рассматривать как

значение случайной величины

имеющей такой же закон распре­

деления,

что и |, причем случайные величины

£2, . . . ,

яв-

1 п

ляются независимыми. При таком рассмотрении число — 2 X in

п ;=i

1

-

Найдем число-

будет значением случайной величины я|з = —

2

п г=1

152

вые характеристики т|>, используя свойства математического ожи дания и дисперсии:

М [гр] : М 2

2 M [ £ f] = M[£]; (5.125)

D № = — D 2 6, t==1

Событие (|ф— M [op]| < e) M [ф]|>е], поэтому

- V

2 D [Et]

D[£].

(5.126)

n 2

i = l

 

 

противоположно событию {|ф>—

Р(|ф— М [ ф ] | < е ) = 1 — Р(|ф — М№] |>е). (5.127)

Ввиду неравенства Чебышева (5.123) вычитаемое в правой ча­

сти (5.127) меньше, чем — П[ф], поэтому

е 2

 

Р ( |г|з— М [г|5] |

е) > 1------- Z) [гр].

 

 

 

 

 

 

 

е 2

 

С другой стороны, вероятность любого

события

не превосходит

единицы,

так что

 

 

 

 

 

 

1 > Р ( | ф — М[ф] | < е ) >

1-----—

(5.128)

 

 

 

 

 

 

в2

 

Через яр обозначено среднее

арифметическое измеренных зна-

j

«

Подставляя его, а также выражение числовых ха-

чений —

2 ^ т -

п

;=1

 

 

в (5.128), получим:

рактеристик ф из (5.125) и (5.126)

 

> Р

± Ъ Х 1п- М [1 ]

> 8

>

1 -

■D№. (5.129)

Правая часть

при п -*■ о о стремится

к

1, левая часть равна 1,

следовательно, стремится к 1 и центральная часть неравенства, что доказывает теорему Чебышева.

Для доказательства теоремы Бернулли достаточно в теореме Чебышева рассмотреть случайную величину £, которая принимает значение 1, когда происходит событие Л, и 0, когда событие А не происходит.

Среднее арифметическое наблюдавшихся значений такой слу­ чайной величины будет равно частоте события А .

Центральная предельная теорема. Большое значение для теоре­ тического обоснования различных приложений теории вероятно­ стей имеют теоремы, выясняющие условия близости законов рас­ пределения различных случайных величин к тем или иным теоре­ тическим законам распределения. Наиболее важной теоремой ука­ занного типа является центральная предельная теорема. В этой

153

теореме выясняются условия, при которых закон распределения суммы

п

*= 2 5 ( i—1

случайных величин приближается к нормальному закону.

Одна из наиболее общих форм центральной предельной теоремы, область применения которой охватывает практически все интерес­ ные случаи, была доказана А. М. Ляпуновым в 1900 г. Не останав­ ливаясь на самых общих формах центральной предельной теоремы, сформулируем ее для случая одинаково распределенных независи­ мых слагаемых.

Теорема. Если

|2, . . . ,

%п независимые случайные вели­

чины, имеющие один и тот же

закон распределения, с конечными

моментами до третьего порядка включительно, то при неограни-

П

неограни-

ченном увеличении п закон распределения суммы ф> = 2

£=1

 

ченно приближается к нормальному.

 

Замечание. Эта теорема была доказана А. М. Ляпуновым для слагае­ мых, имеющих произвольные (не обязательно одинаковые) законы рас­ пределения, при условии, что

 

 

 

 

п

 

 

lim

 

ЦЬС= о

 

 

п->оо

 

 

где

О; — дисперсия

= М [й ] .

 

В

случае одинаково

распределенных слагаемых О; = сг, 6,- = b

и условие Ляпунова очевидно выполнено:

/

Л

—3/2 п

nb

ba- 3

 

 

2 V

 

 

(па2)'3/2

0 П р и П - г - С О .

 

 

Vn

Центральная предельная теорема объясняет причины большого распространения нормально-распределенных величин. Закон рас­ пределения случайной величины близок к нормальному, если она может быть представлена в виде суммы достаточно большого числа практически произвольных независимых (или слабо зависимых) слагаемых, каждое из которых в отдельности сравнительно мало влияет на сумму. По этой причине, например, можно считать нор­ мальными законы распределения ошибок при измерении различных физических величин и т. п.

Г л а в а 6

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

6.1. Генеральная совокупность и выборка. Основные задачи математической статистики

Пусть требуется выяснить распределение какого-нибудь при­ знака среди, предметов, принадлежащих большой конечной или бесконечной совокупности. Признак может быть качественным

154

(например, каждое изделие в партии можно охарактеризовать как

стандартное и не стандартное) и

количественным, когда

исследуе­

мые предметы характеризуются

значением

некоторой

величины

(например, электролампа — числом часов,

которое она

прорабо­

тала до того, как перегорела, звезды — числом планет). В дальней­ шем будем рассматривать только количественные признаки, так как изучение качественного признака можно свести к изучению коли­ чественного, вводя величину, принимающую значение 1, если пред­ мет обладает исследуемым качеством, и 0, когда он этим качеством не обладает. Для простоты будем считать величину £, характеризую­ щую рассматриваемый признак, скалярной. Обозначим F (х) — долю предметов в интересующей исследователя совокупности, у которых | меньше х. Совокупность предметов, о которой хотят составить представление, в статистике называют генеральной совокупностью, а функцию F (х) — функцией распределения вероятностей вели­ чины \ в генеральной совокупности. Очень часто исследование всей совокупности невозможно, или связано с большими затратами. Тогда случайным образом (так что вероятность выбора любого предмета из генеральной совокупности одинакова) выбирают п предметов и только эти предметы генеральной совокупности под­ вергают обследованию, а на основании их обследования составляют представление о всей генеральной совокупности.

Обследуемый набор предметов называют выборкой объема п. Задачи математической статистики состоят в получении обоснован­ ных выводов о свойствах генеральной совокупности по известным свойствам извлеченной из нее выборки. Ниже рассмотрены следую­ щие типичные задачи математической* статистики:

а) установление закона распределения величины £ в генераль­ ной совокупности,

б) определение параметров закона распределения, когда закон распределения известен,

в) обработка результатов измерений.

Будем предполагать, что распределение вероятностей | в пред­ метах генеральной совокупности, оставшихся после извлечения из нее выборки, не зависит от того, какие именно предметы генераль­ ной совокупности попали в выборку. Это предположение, очевидно, выполняется для повторных выборок, которые составляются сле­ дующим образом: после того как предмет обследован и результаты обследования зарегистрированы, он опять возвращается в генераль­ ную совокупность и может быть выбран (в ту же выборку) снова. Для бесповторной выборки, когда обследуемые предметы обратно в генеральную совокупность не возвращаются, это предположение будет практически справедливым, если объем генеральной совокуп­ ности намного больше объема выборки (например, для бесконечной генеральной совокупности).

155

6.2. Описание и систематизация выборки

Для удобства обработки и описания результатов выборки вы­ борочные значения | (т. е. значения полученные в результате обследования предметов, составляющих выборку) прежде всего располагают в неубывающем порядке, перенумеровав соответствую­ щим образом члены выборки: Х х < Х 2 < . . . < Хп_ 1< Х п (неко­

торые соседние значения могут быть одинаковыми). Такая после­ довательность выборочных значе­ ний, расположенных в неубываю­ щем порядке, называется вариа­ ционным рядом. Средний член ва­ риационного ряда называется ме­ дианой выборки. Если п-нечетное число, медиана равна X л+1, если

 

 

четное, то медианы две: X

Ри с . 59

X

При дальнейшей систе­

 

+1

матизации выборки небольшого объема иногда рассматривается дискретная случайная величина £*, возможными значениями которой являются выборочные значения £, а их вероятностями — частоты. Закон распределения случайной величины £* называется выборочным или эмпирическим законом

распределения, числовые харак­

V

 

 

 

теристики

£* — характеристиками

vn

 

 

 

выборки, график функции распре­

4 0 -

 

 

 

деления

F* (х) — кривой

накоп­

30 -

 

 

 

ленных частот (рис. 59).

 

 

 

 

 

Среднее значение или математи­

20 -

 

 

 

ческое ожидание выборки опреде­

10

 

 

 

ляется формулой:

 

 

°к~1 Л_

 

 

 

 

 

О

13,6

 

2 х {\

(6. 1)

13

13,2

Xf.13,4

 

 

 

 

 

 

п 1=1

 

 

 

 

Рис. 60

 

выборочная дисперсия

 

 

 

 

 

 

 

 

 

 

 

 

£ )[ £ * ]= а 2 = - ! 2 ( У — I

 

 

(6.2)

 

 

«

i=i

1

 

 

 

выборочный момент порядка

k

 

 

 

 

 

 

*

»

i u *

'

 

(6.3)

 

Н

1

 

 

v '

Пример 1. Для обследования отобраны 10 шт. последовательно отштам­ пованных колец шарикоподшипников. Результаты замеров высоты колец следующие:

156

Номер

опыта . . .

1

2

3

4

5

6

7

8

Высота кольца, мм 31,57; 32,61; 32,68; 32,09; 32,36; 31,75; 31,98;

32,46;

9

10

 

 

 

 

 

 

 

 

31,33;

32,46

 

 

 

 

 

 

 

 

Соответствующий вариационный ряд . . . 31,33; 31,57; 31,75; 31,98; 32,09; 32,36; 32,46; 32,46; 32,61; 32,68. Медианами являются 32,09 и

32,36. Кривая накопленных частот показана на рис. 59. £* = 32,129;

а2 = 0,193.

*

Для выборок большого объема распространен другой способ графического представления. Весь интервал числовой оси, в кото­ рый попадают выборочные значения \ делят на п (обычно 10—20) равных частей точками а0<С,а1<С_а2<^ . . . Обозначим vk число предметов выборки, для которых значения | попадают в про­ межуток [ak^v aky Над каждым таким промежутком на графике

строится прямоугольник высотой vk. Полученную ступенчатую фигуру называют гистограммой выборки (рис. 60). Рассматривается

случайная величина £* с возможными значениями xk= ak~1^rClk ;

каждое такое значение имеет вероятность — . Выборочным законом

распределения считается распределение |*, выборочные среднее и дисперсия находятся по формулам

i * = 4 - i s ' w

i > * ( ^ - i * ) 2

(6.4)

п ft=i

* п k=l

 

И т. д .

Советским математиком Гливенко доказана теорема о том, что при достаточно большом объеме выборки п и малом А = akak_ x

выборочный закон распределения сколь угодно близок к закону распределения генеральной совокупности.

Правило «ложного» нуля. Для упрощения расчетов при вычис­ лении числовых характеристик выборки удобно воспользоваться правилом «ложного нуля». Правило это состоит в следующем.

Выбирается произвольное число а, после чего формула (6.1) для среднего значения выборки заменяется равносильной ей фор­ мулой

1 * = 4 - 2 ( Х , - а ) + а.

(6.5)

п i=i

 

Формула для выборочной дисперсии преобразуется следующим

образом:

 

 

=

1 ( X - l y = ± S (X , - a + a - t y .

(6.6)

Возводя в квадрат выражения, стоящие в скобках, преобразуем каждое слагаемое в правой части:

(Х1—а+ а — С*)2 - (Xi- a ) z + 2 (Х ,- а ) ( а - ! * ) + (а -| * )2. (6.7)

Просуммируем (6.7) по i, сгруппировав вместе сначала первые слагаемые, затем вторые и третьи. Вторые слагаемые содержат

157

общий множитель 2 —£*), который можно вынести за знак суммы,

2

2 (Xt- a ) (а— f*) = 2 ( а - 1*) £ (Xt- a ) .

1= 1

i= 1

Ввиду (6.5)

 

 

а) = п(Ъ*—а),

поэтому

t= 1

 

2 2 (Х;—а) (а —£*) = —2п (а —£*)2.

£=1

Третьи слагаемые в (6.7) одинаковы при всех i, поэтому их сумма будет равна п —|*)2. Таким образом,

2 № - а + а - 1 * ) 2= 2 № -

t=i

г=1

— а)2 — 2п (а— 1*)2 + п (а— £*)2.

После приведения подобных членов и подстановки получен­ ного выражения в (6.6) оконча­ тельно получаем:

° 2 = ^ 2 № - а ) 2- ( а - | * ) 2.

*

п t=i

( 6.8)

Заметим, что формулы (6.5) и (6.8) справедливы при любом а, поэтому а подбирается таким образом, чтобы вычисление сумм в (6.5) и (6.8) оказалось воз­ можно более простым (в форму­ лах (6.5) и (6.8) можно брать не одинаковые а).

Пример 2 (продолжение примера 1). Для упрощения вычисления поло­ жим а = 32,1. Вычислим разности Х{а: — 0,77; — 0,53; — 0,35;

— 0,12; — 0,01; 0,26; 0,36; 0,36; 0,51; 0,58. Сумма этих разностей равна

0,29, поэтому согласно формуле (6.5)

I* = — -0,29 + 32,1 =32,129.

10

Возведем в квадрат каждую разность X i а, а затем сложив по­

лученные числа, получим 1,9341. Далее находим, что | * ) 2 = = 0,000851. Вычисляем выборочную дисперсию, используя формулу

ст2= — .1,9341 — 0,000851 = 0,192559 « 0,193.

10

ПримерЗ. В первых трех столбцах табл. 1 приведены данные результатов измерения диаметров головок 2 00 заклепок.

158

 

 

 

 

 

Та б ли ц а 1

i

xi

vi

Ф 1

)

 

 

 

 

1

13,12

2

0,010

0,007

0,003

2

13,17

1

0,015

0,022

—0,007

3

13,22

8

0,055

0,054

0,001

4

13,27

17

0,140

0,136

0,004

5

13,32

27

0,275

0,261

0,014

6

13,37

30

0,425

0,425

0,000

7

13,42

37

0,610

0,606

0,004

8

13,47

27

0,745

0,767

—0,022

9

13,52

25

0,870

0,881

—0,011

10

13,57

17

0,955

0,946

0,009

11

13,62

7

0,990

0,982

0,008

12

13,67

2

1,000

0,995

0,005

Все выборочные значения сгруппированы в 12 интервалов длиной 0,05 мм каждый. В первом столбце помещены номера интервалов г,

а. — a-_j

во втором — середины интервалов Xj = ——

------, в третьем — число

заклепок, диаметры головок которых попали

в интервал [х;—0,025,

х( + 0,025].

Гистограмма выборки показана на рис. 60. Значения

выборочного

среднего

и дисперсии,

сосчитанные по формулам (6.4),

равны:

 

 

 

 

I* =

13,416; а2 =

0,0120.

 

 

*

 

Полученный эмпирический закон распределения заменяют в том или ином отношении близкой к нему удобной аналитической функ­ цией. Для этой цели могут быть использованы нормальная функция распределения, кривые Пирсона и т. д. Для приближенного пред­ ставления выборочного распределения дискретной случайной ве­ личины может оказаться полезным закон распределения Пуассона с соответствующим образом выбранным параметром а. Более под­ робно о представлении эмпирических зависимостей аналитическими функциями будет сказано в § 6.5.

Пример 4 (продолжение примера 3). В качестве приближения кривой накопленных частот закона распределения диаметров заклепок возь­ мем функцию распределения для нормального закона с параметрами

m =

=

13,416, а = а* =0,109. Значения этой функции в точках

ai =

Х{ +

0,025

помещены в пятом столбце. Четвертый столбец содер­

жит значения

накопленных частот, т. е. числа щ = —5— (v, 4- v2+

+ •••+

vi)-

в

200

р,(-

последнем столбце указана разность Д; значений

и функции распределения в соответствующих точках.

и

 

На рис. 61,

а и б сплошными линиями показаны гистограммы

кривая накопленных частот выборки, а пунктиром — приближающие

их функции Ф ) и / (х) = Ф.; ( £ " -~) - ^ г •

159

Соседние файлы в папке книги из ГПНТБ