книги из ГПНТБ / Дьяченко, А. Н. Интегральное исчисление функций нескольких переменных. Теория вероятностей и элементы математической статистики учебное пособие
.pdfЗамечательным свойством этих законов распределения, которое и используется в статистике,'является их независимость от пара метров т и а. Единственным параметром этих законов распределе ния является число п случайных аргументов Число степеней свободы на единицу меньше, чем число аргументов. Аналитические выражения плотностей вероятностей случайных величин, распре деленных по закоцам %2 и Стьюдента, здесь не приведены, так как они довольно громоздки и на практике обычно пользуются не ана литическими выражениями, а таблицами. Заметим только, что
функции |
распределения величин |
%2п_ г и tn_ Y непрерывны, |
плот |
ность вероятности величины |
на отрицательной полуоси равна |
||
нулю, а |
плотность вероятности |
величины tn_ x является |
четной |
функцией. Вид кривых распределения (графиков плотностей веро ятности) для случайных величин, распределенных по законам %2 и Стьюдента, показан соответственно на рис. 58, а и б.
;5.11. Предельные теоремы теории вероятностей
Закон больших чисел. В § 1.4 говорилось о том, что явления, подчиненные вероятностным закономерностям, обладают следую щим свойством: при большом числе опытов ■частота события при близительно равна его вероятности. Более точно эта связь между частотами событий и вероятностями устанавливается в теоремах, получивших общее название закона больших чисел. К числу тео рем закона больших чисел относятся также теоремы, устанавли вающие связь между числовыми характеристиками случайной ве личины (такими, как математическое ожидание, дисперсия и т. п.) и их оценками, полученными по результатам наблюдения значений случайной величины в большой серии опытов. Во всех этих теоре мах выясняется, что среднее арифметическое значений случайной величины, принятых ею в серии опытов, при неограниченном уве личении числа опытов в серии утрачивает случайный характер. Первая теорема закона больших чисел была доказана в 1713 г. Бер нулли. В дальнейшем наиболее важные и полные результаты были получены Чебышевым, Марковым, Бернштейном и Хинчиным.
Из всех теорем закона больших чисел рассмотрим только две: Бернулли и Чебышева.
Сходимость по вероятности. Для формулировки теорем закона больших чисел удобно ввести понятие сходимости по вероятности.
Определение. Говорят, что при п -> с о случайная величина
сходится по вероятности к постоянному числу А , если для любого 8>>0, вероятность того, что значение случайной величины \п будет отличаться от числа А не больше, чем на е, стремится к единице при п -» о о ,
lim Р(\ 1п — А |< е ) = 1.
150
Теорема Бернулли. Предположим, что проводится последова тельность серий опытов, причем серия с номером п состоит из п опытов. Предположим также, что опыты проводятся по схеме Бер нулли, т. е. вероятность появления события А в каждом опыте по стоянна и не зависит от результатов других опытов, т. е. Р (А) = р в любом опыте, любой серии.
Обозначим через (Л) частоту появления события А в серии опытов с номером п. Число опытов в серии совпадает с номером серии, поэтому в соответствии с определением частоты события
И) = тп (А)
где тп (А) — число опытов в серии с номером п, в которых появи лось событие Л. В каждой серии опытов величина (Л) является случайной, причем закон распределения этой величины очевидно зависит от р и п. Для этой величины Бернулли доказал следующее утверждение.
Теорема. Частота р.„ (Л) события А сходится по вероятности к вероятности этого события р, т. е.
lim P (] М Л ) — р\ -< е )= 1 при любом 8>>0. |
(5.121) |
/ г - > СО
Теорема Чебышева. Рассмотрим последовательность серий оди наковых и независимых опытов. Пусть как и выше число опытов в каждой серии совпадает с номером серии. В каждом опыте наблю даются значения случайной величины Обозначим через Х1п зна чение £, наблюдающееся в г-м опыте серии с номером п. Тогда сред
нее арифметическое \п значений случайной величины £ наблюдаю щихся в серии с номером п, равно:
|
|
п £=1 |
Очевидно |
случайная |
величина, распределение которой за |
висит от распределения £ |
и числа опытов. Если дисперсия D [£ ] |
случайной величины | конечна, то справедливо следующее утверж
дение, доказанное Чебышевым. |
|
_ |
|
|
Теорема. Среднее арифметическое \п значений случайной вели |
||||
чины |, наблюдавшихся в п опытах, |
сходится по вероятности к ма |
|||
тематическому ожиданию М [£[ этой величины, т. е. |
|
|||
lim Р |
2 х 1п- м [и |
8 |
= 1 при любом s > 0 . |
(5.122) |
п->СО |
i=i |
|
|
|
Доказательство теорем Бернулли и Чебышева. Предварительно |
||||
докажем неравенство Чебышева: |
|
|
|
|
|
P (| g - m l | > 8 )< ^ - D [g ], |
(5.123) |
151
справедливое для любого е > 0 и всех случайных величин |
имею |
|
щих конечные математическое ожидание М [£.1 = |
и дисперсию |
|
D [£]. Предположим, что закон распределения |
случайной |
вели |
чины £ задан плотностью вероятности (в случае дискретных случай
ных величин |
доказательство проводится аналогично). Тогда |
|||
|
-1-00 |
(х — m^f‘f{x)dx= |
тg— 8 |
(х — m^)2f(x)dx-f- / |
D[£] = |
J |
J |
||
|
— ОО |
|
— СО |
|
mg 4- 8 |
(х— m^)2f(x)dxJr |
-f со |
(x— m^)2f(x)dx. |
|
+ |
f |
J |
||
mg — 8 |
|
mg + s |
|
Так как подынтегральное выражение неотрицательно, то каждый из интегралов неотрицателен, и если отбросить второй интеграл, то выражение не увеличится. Оставшиеся интегралы берутся по области, где \х— |>е, так что заменяя (х—т|)2 на е2, получаем оценку:
|
Н-оо |
|
d m : |
f-(x)dx-\- J f(x)dx |
(5.124) |
|
mg + 8 |
|
Первый интеграл в квадратных скобках равен вероятности со бытия А = — е}, второй — вероятнрсти события В = = + е). Заметим далее, что событие С = (|£ — т^\^>е}, противоположное событию {|| — т§\ < в}, состоит в выполнении одного из неравенств — е или |>/П| + е и, следовательно, является суммой событий А и В:
С = { |£— ms|>e) = А + В = { К т ^ г ) |
+ {| > т | + е}. |
|
Так |
как события А я В несовместные, |
то Р (А) + Р (В) = |
= Р (А |
В), и, следовательно, выражение в квадратных скобках |
равно вероятности того, что значение случайной величины будет отличаться от математического ожидания больше чем на е:
mg— 8 |
-foo |
J |
f{x)dxA- J f(x)dx = P(£,<im§ — е )+ Р (£ > m s -fe) = |
—оо |
mg+ е |
|
= P(|g — m6|>e). |
Подставив полученное выражение в (5.124) и разделив правую и левую части на s2, получим (5.123).
Для доказательства теоремы Чебышева заметим, что поскольку рассматриваются независимые опыты, то значение случайной ве
личины £ |
в t-м опыте (i = 1, 2, . |
, п) можно рассматривать как |
||
значение случайной величины |
имеющей такой же закон распре |
|||
деления, |
что и |, причем случайные величины |
£2, . . . , |
яв- |
1 п
ляются независимыми. При таком рассмотрении число — 2 X in
п ;=i
1 |
- |
Найдем число- |
будет значением случайной величины я|з = — |
2 |
п г=1
152
вые характеристики т|>, используя свойства математического ожи дания и дисперсии:
М [гр] : М 2 |
2 M [ £ f] = M[£]; (5.125) |
D № = — D 2 6, t==1
Событие (|ф— M [op]| < e) M [ф]|>е], поэтому
- V |
2 D [Et] |
D[£]. |
(5.126) |
n 2 |
i = l |
|
|
противоположно событию {|ф>—
Р(|ф— М [ ф ] | < е ) = 1 — Р(|ф — М№] |>е). (5.127)
Ввиду неравенства Чебышева (5.123) вычитаемое в правой ча
сти (5.127) меньше, чем — П[ф], поэтому
е 2
|
Р ( |г|з— М [г|5] | |
е) > 1------- Z) [гр]. |
|
||||
|
|
|
|
|
|
е 2 |
|
С другой стороны, вероятность любого |
события |
не превосходит |
|||||
единицы, |
так что |
|
|
|
|
|
|
|
1 > Р ( | ф — М[ф] | < е ) > |
1-----— |
(5.128) |
||||
|
|
|
|
|
|
в2 |
|
Через яр обозначено среднее |
арифметическое измеренных зна- |
||||||
j |
« |
Подставляя его, а также выражение числовых ха- |
|||||
чений — |
2 ^ т - |
||||||
п |
;=1 |
|
|
в (5.128), получим: |
|||
рактеристик ф из (5.125) и (5.126) |
|||||||
|
> Р |
± Ъ Х 1п- М [1 ] |
> 8 |
> |
1 - |
■D№. (5.129) |
|
Правая часть |
при п -*■ о о стремится |
к |
1, левая часть равна 1, |
следовательно, стремится к 1 и центральная часть неравенства, что доказывает теорему Чебышева.
Для доказательства теоремы Бернулли достаточно в теореме Чебышева рассмотреть случайную величину £, которая принимает значение 1, когда происходит событие Л, и 0, когда событие А не происходит.
Среднее арифметическое наблюдавшихся значений такой слу чайной величины будет равно частоте события А .
Центральная предельная теорема. Большое значение для теоре тического обоснования различных приложений теории вероятно стей имеют теоремы, выясняющие условия близости законов рас пределения различных случайных величин к тем или иным теоре тическим законам распределения. Наиболее важной теоремой ука занного типа является центральная предельная теорема. В этой
153
теореме выясняются условия, при которых закон распределения суммы
п
*= 2 5 ( i—1
случайных величин приближается к нормальному закону.
Одна из наиболее общих форм центральной предельной теоремы, область применения которой охватывает практически все интерес ные случаи, была доказана А. М. Ляпуновым в 1900 г. Не останав ливаясь на самых общих формах центральной предельной теоремы, сформулируем ее для случая одинаково распределенных независи мых слагаемых.
Теорема. Если |
|2, . . . , |
%п — независимые случайные вели |
чины, имеющие один и тот же |
закон распределения, с конечными |
моментами до третьего порядка включительно, то при неограни-
П |
неограни- |
ченном увеличении п закон распределения суммы ф> = 2 |
|
£=1 |
|
ченно приближается к нормальному. |
|
Замечание. Эта теорема была доказана А. М. Ляпуновым для слагае мых, имеющих произвольные (не обязательно одинаковые) законы рас пределения, при условии, что
|
|
|
|
п |
|
|
lim |
|
ЦЬС= о |
|
|
п->оо |
|
|
где |
О; — дисперсия |
= М [й ] . |
||
|
В |
случае одинаково |
распределенных слагаемых О; = сг, 6,- = b |
|
и условие Ляпунова очевидно выполнено: |
||||
/ |
Л |
—3/2 п |
nb |
ba- 3 |
|
|
2 V |
||
|
|
(па2)'3/2 |
0 П р и П - г - С О . |
|
|
|
Vn |
Центральная предельная теорема объясняет причины большого распространения нормально-распределенных величин. Закон рас пределения случайной величины близок к нормальному, если она может быть представлена в виде суммы достаточно большого числа практически произвольных независимых (или слабо зависимых) слагаемых, каждое из которых в отдельности сравнительно мало влияет на сумму. По этой причине, например, можно считать нор мальными законы распределения ошибок при измерении различных физических величин и т. п.
Г л а в а 6
ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
6.1. Генеральная совокупность и выборка. Основные задачи математической статистики
Пусть требуется выяснить распределение какого-нибудь при знака среди, предметов, принадлежащих большой конечной или бесконечной совокупности. Признак может быть качественным
154
(например, каждое изделие в партии можно охарактеризовать как
стандартное и не стандартное) и |
количественным, когда |
исследуе |
|
мые предметы характеризуются |
значением |
некоторой |
величины |
(например, электролампа — числом часов, |
которое она |
прорабо |
тала до того, как перегорела, звезды — числом планет). В дальней шем будем рассматривать только количественные признаки, так как изучение качественного признака можно свести к изучению коли чественного, вводя величину, принимающую значение 1, если пред мет обладает исследуемым качеством, и 0, когда он этим качеством не обладает. Для простоты будем считать величину £, характеризую щую рассматриваемый признак, скалярной. Обозначим F (х) — долю предметов в интересующей исследователя совокупности, у которых | меньше х. Совокупность предметов, о которой хотят составить представление, в статистике называют генеральной совокупностью, а функцию F (х) — функцией распределения вероятностей вели чины \ в генеральной совокупности. Очень часто исследование всей совокупности невозможно, или связано с большими затратами. Тогда случайным образом (так что вероятность выбора любого предмета из генеральной совокупности одинакова) выбирают п предметов и только эти предметы генеральной совокупности под вергают обследованию, а на основании их обследования составляют представление о всей генеральной совокупности.
Обследуемый набор предметов называют выборкой объема п. Задачи математической статистики состоят в получении обоснован ных выводов о свойствах генеральной совокупности по известным свойствам извлеченной из нее выборки. Ниже рассмотрены следую щие типичные задачи математической* статистики:
а) установление закона распределения величины £ в генераль ной совокупности,
б) определение параметров закона распределения, когда закон распределения известен,
в) обработка результатов измерений.
Будем предполагать, что распределение вероятностей | в пред метах генеральной совокупности, оставшихся после извлечения из нее выборки, не зависит от того, какие именно предметы генераль ной совокупности попали в выборку. Это предположение, очевидно, выполняется для повторных выборок, которые составляются сле дующим образом: после того как предмет обследован и результаты обследования зарегистрированы, он опять возвращается в генераль ную совокупность и может быть выбран (в ту же выборку) снова. Для бесповторной выборки, когда обследуемые предметы обратно в генеральную совокупность не возвращаются, это предположение будет практически справедливым, если объем генеральной совокуп ности намного больше объема выборки (например, для бесконечной генеральной совокупности).
155
6.2. Описание и систематизация выборки
Для удобства обработки и описания результатов выборки вы борочные значения | (т. е. значения полученные в результате обследования предметов, составляющих выборку) прежде всего располагают в неубывающем порядке, перенумеровав соответствую щим образом члены выборки: Х х < Х 2 < . . . < Хп_ 1< Х п (неко
торые соседние значения могут быть одинаковыми). Такая после довательность выборочных значе ний, расположенных в неубываю щем порядке, называется вариа ционным рядом. Средний член ва риационного ряда называется ме дианой выборки. Если п-нечетное число, медиана равна X л+1, если
|
|
четное, то медианы две: X |
Ри с . 59 |
X |
При дальнейшей систе |
|
+1 |
матизации выборки небольшого объема иногда рассматривается дискретная случайная величина £*, возможными значениями которой являются выборочные значения £, а их вероятностями — частоты. Закон распределения случайной величины £* называется выборочным или эмпирическим законом
распределения, числовые харак |
V |
|
|
|
|||
теристики |
£* — характеристиками |
vn |
|
|
|
||
выборки, график функции распре |
4 0 - |
|
|
|
|||
деления |
F* (х) — кривой |
накоп |
30 - |
|
|
|
|
ленных частот (рис. 59). |
|
|
|
|
|
||
Среднее значение или математи |
20 - |
|
|
|
|||
ческое ожидание выборки опреде |
10 |
|
|
|
|||
ляется формулой: |
|
|
°к~1 Л_ |
|
|||
|
|
|
|
О |
13,6 |
||
|
— 2 х {\ |
(6. 1) |
13 |
13,2 |
Xf.13,4 |
||
|
|
|
|
|
|||
|
п 1=1 |
|
|
|
|
Рис. 60 |
|
выборочная дисперсия |
|
|
|
|
|
||
|
|
|
|
|
|
||
|
£ )[ £ * ]= а 2 = - ! 2 ( У — I |
|
|
(6.2) |
|||
|
|
« |
i=i |
1 |
|
|
|
выборочный момент порядка |
k |
|
|
|
|
|
|
|
* |
» |
i u * |
' |
|
(6.3) |
|
|
Н |
1 |
|
|
v ' |
Пример 1. Для обследования отобраны 10 шт. последовательно отштам пованных колец шарикоподшипников. Результаты замеров высоты колец следующие:
156
Номер |
опыта . . . |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Высота кольца, мм 31,57; 32,61; 32,68; 32,09; 32,36; 31,75; 31,98; |
32,46; |
||||||||
9 |
10 |
|
|
|
|
|
|
|
|
31,33; |
32,46 |
|
|
|
|
|
|
|
|
Соответствующий вариационный ряд . . . 31,33; 31,57; 31,75; 31,98; 32,09; 32,36; 32,46; 32,46; 32,61; 32,68. Медианами являются 32,09 и
32,36. Кривая накопленных частот показана на рис. 59. £* = 32,129;
а2 = 0,193.
*
Для выборок большого объема распространен другой способ графического представления. Весь интервал числовой оси, в кото рый попадают выборочные значения \ делят на п (обычно 10—20) равных частей точками а0<С,а1<С_а2<^ . . . Обозначим vk число предметов выборки, для которых значения | попадают в про межуток [ak^v aky Над каждым таким промежутком на графике
строится прямоугольник высотой vk. Полученную ступенчатую фигуру называют гистограммой выборки (рис. 60). Рассматривается
случайная величина £* с возможными значениями xk= ak~1^rClk ;
каждое такое значение имеет вероятность — . Выборочным законом
распределения считается распределение |*, выборочные среднее и дисперсия находятся по формулам
i * = 4 - i s ' w |
i > * ( ^ - i * ) 2 |
(6.4) |
п ft=i |
* п k=l |
|
И т. д .
Советским математиком Гливенко доказана теорема о том, что при достаточно большом объеме выборки п и малом А = ak— ak_ x
выборочный закон распределения сколь угодно близок к закону распределения генеральной совокупности.
Правило «ложного» нуля. Для упрощения расчетов при вычис лении числовых характеристик выборки удобно воспользоваться правилом «ложного нуля». Правило это состоит в следующем.
Выбирается произвольное число а, после чего формула (6.1) для среднего значения выборки заменяется равносильной ей фор мулой
1 * = 4 - 2 ( Х , - а ) + а. |
(6.5) |
п i=i |
|
Формула для выборочной дисперсии преобразуется следующим
образом: |
|
|
= |
1 ( X - l y = ± S (X , - a + a - t y . |
(6.6) |
Возводя в квадрат выражения, стоящие в скобках, преобразуем каждое слагаемое в правой части:
(Х1—а+ а — С*)2 - (Xi- a ) z + 2 (Х ,- а ) ( а - ! * ) + (а -| * )2. (6.7)
Просуммируем (6.7) по i, сгруппировав вместе сначала первые слагаемые, затем вторые и третьи. Вторые слагаемые содержат
157
общий множитель 2 (а—£*), который можно вынести за знак суммы,
2 |
2 (Xt- a ) (а— f*) = 2 ( а - 1*) £ (Xt- a ) . |
1= 1 |
i= 1 |
Ввиду (6.5) |
|
|
а) = п(Ъ*—а), |
поэтому |
t= 1 |
|
2 2 (Х;—а) (а —£*) = —2п (а —£*)2.
£=1
Третьи слагаемые в (6.7) одинаковы при всех i, поэтому их сумма будет равна п (а—|*)2. Таким образом,
2 № - а + а - 1 * ) 2= 2 № - |
|
t=i |
г=1 |
— а)2 — 2п (а— 1*)2 + п (а— £*)2.
После приведения подобных членов и подстановки получен ного выражения в (6.6) оконча тельно получаем:
° 2 = ^ 2 № - а ) 2- ( а - | * ) 2. |
|
* |
п t=i |
( 6.8)
Заметим, что формулы (6.5) и (6.8) справедливы при любом а, поэтому а подбирается таким образом, чтобы вычисление сумм в (6.5) и (6.8) оказалось воз можно более простым (в форму лах (6.5) и (6.8) можно брать не одинаковые а).
Пример 2 (продолжение примера 1). Для упрощения вычисления поло жим а = 32,1. Вычислим разности Х{—а: — 0,77; — 0,53; — 0,35;
— 0,12; — 0,01; 0,26; 0,36; 0,36; 0,51; 0,58. Сумма этих разностей равна
0,29, поэтому согласно формуле (6.5)
I* = — -0,29 + 32,1 =32,129.
10
Возведем в квадрат каждую разность X i — а, а затем сложив по
лученные числа, получим 1,9341. Далее находим, что (а — | * ) 2 = = 0,000851. Вычисляем выборочную дисперсию, используя формулу
ст2= — .1,9341 — 0,000851 = 0,192559 « 0,193.
10
ПримерЗ. В первых трех столбцах табл. 1 приведены данные результатов измерения диаметров головок 2 00 заклепок.
158
|
|
|
|
|
Та б ли ц а 1 |
i |
xi |
vi |
'Н |
Ф 1 |
) |
|
|
|
|
||
1 |
13,12 |
2 |
0,010 |
0,007 |
0,003 |
2 |
13,17 |
1 |
0,015 |
0,022 |
—0,007 |
3 |
13,22 |
8 |
0,055 |
0,054 |
0,001 |
4 |
13,27 |
17 |
0,140 |
0,136 |
0,004 |
5 |
13,32 |
27 |
0,275 |
0,261 |
0,014 |
6 |
13,37 |
30 |
0,425 |
0,425 |
0,000 |
7 |
13,42 |
37 |
0,610 |
0,606 |
0,004 |
8 |
13,47 |
27 |
0,745 |
0,767 |
—0,022 |
9 |
13,52 |
25 |
0,870 |
0,881 |
—0,011 |
10 |
13,57 |
17 |
0,955 |
0,946 |
0,009 |
11 |
13,62 |
7 |
0,990 |
0,982 |
0,008 |
12 |
13,67 |
2 |
1,000 |
0,995 |
0,005 |
Все выборочные значения сгруппированы в 12 интервалов длиной 0,05 мм каждый. В первом столбце помещены номера интервалов г,
а. — a-_j |
|
во втором — середины интервалов Xj = —— |
------, в третьем — число |
заклепок, диаметры головок которых попали |
в интервал [х;—0,025, |
х( + 0,025]. |
Гистограмма выборки показана на рис. 60. Значения |
||
выборочного |
среднего |
и дисперсии, |
сосчитанные по формулам (6.4), |
равны: |
|
|
|
|
I* = |
13,416; а2 = |
0,0120. |
|
|
* |
|
Полученный эмпирический закон распределения заменяют в том или ином отношении близкой к нему удобной аналитической функ цией. Для этой цели могут быть использованы нормальная функция распределения, кривые Пирсона и т. д. Для приближенного пред ставления выборочного распределения дискретной случайной ве личины может оказаться полезным закон распределения Пуассона с соответствующим образом выбранным параметром а. Более под робно о представлении эмпирических зависимостей аналитическими функциями будет сказано в § 6.5.
Пример 4 (продолжение примера 3). В качестве приближения кривой накопленных частот закона распределения диаметров заклепок возь мем функцию распределения для нормального закона с параметрами
m = |
= |
13,416, а = а* =0,109. Значения этой функции в точках |
|||
ai = |
Х{ + |
0,025 |
помещены в пятом столбце. Четвертый столбец содер |
||
жит значения |
накопленных частот, т. е. числа щ = —5— (v, 4- v2+ |
||||
+ •••+ |
vi)- |
в |
200 |
р,(- |
|
последнем столбце указана разность Д; значений |
|||||
и функции распределения в соответствующих точках. |
и |
||||
|
На рис. 61, |
а и б сплошными линиями показаны гистограммы |
кривая накопленных частот выборки, а пунктиром — приближающие
их функции Ф ) и / (х) = Ф.; ( £ " -~) - ^ г •
159