SalimovRB_matematika_gl_1-20_2011_web
.pdfЗдесь под знаком интеграла мы взяли переменную t, чтобы её не путать с
верхним переменным пределом x. |
Но в интервале ak , ak 1 |
функция f x |
по- |
||||||||||||
стоянна и равна hk . Поэтому |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
x |
|
p |
|
x ak . |
|
|
|
|
|
|
|
|
|
|
|
hk dt |
k |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
a |
|
ak 1 ak |
|
|
|
|
||
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
Подставив это выражение в предыдущую формулу, получим |
|
||||||||||||||
F* (x) F* (ak ) |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
pk* (x ak ) /(ak 1 |
ak ), |
ak |
x ak 1, k 1, |
2, |
..., . |
(7) |
|
|||||
В (7) положим x ak 1, тогда |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
F a |
k 1 |
F a |
p , |
k 1, 2, |
..., |
. (8) |
|
|
||
|
|
|
|
|
|
|
k |
k |
|
|
|
|
|
|
|
Примем F * (a1 ) 0. |
Согласно (8) соответственно будем иметь |
|
|||||||||||||
F * (a2 ) p1*, |
|
|
F* (a3 ) p1* p2*, |
|
|
…, |
|
F* (ak 1 ) p1* p2* ... pk* , |
|||||||
F* (a |
1 |
) p* p* ... p* |
1. |
|
|
|
|
|
|
|
|
|
|
||
|
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Для x a1, |
когда |
f x 0, |
по формуле Ньютона–Лейбница получим |
|
|||||||||||
|
|
|
|
|
|
F x F ak x |
|
f t dt 0. |
|
|
|||||
|
|
|
|
|
|
|
|
|
a1 |
|
|
|
|
||
Так как F a1 0, |
то F x 0 |
для всех x a1. |
Аналогично получим, |
что |
|||||||||||
F x 1 для всех x a 1 . |
|
|
|
|
|
|
|
|
|
|
Рис. 203
Как видно из предыдущего и, в частности, из (7), график функции состоит из прямолинейных участков. В самом деле, в интервале ak x ak 1
рассматриваемая |
функция |
имеет |
уравнение |
y F x |
или |
y F* (ak ) pk* (x ak ) /(ak 1 ak ). Но последнее есть уравнение прямой. |
Записав |
||||
формулу (7) для k 1, 2, ..., , |
убедимся в том, что начало последующего от- |
||||
|
|
381 |
|
|
5354.ru |
|
|
|
|
|
резка графика совпадает с концом предыдущего, и график функции F x
имеет вид, показанный на рис. 203.
Построенная функция F x называется статистической (эмпирической) функцией распределения рассматриваемой непрерывной случайной величины
X .
Пусть f x , F x – соответственно искомые плотность и функция рас-
пределения изучаемой непрерывной случайной величины X . Покажем, что в качестве этих функций можно приближенно взять только что построенные функции f * x и F* x . В самом деле, по определению плотности распреде-
ления
f x lim P x X x x .
x 0 x
При малых x дробь под знаком предела будет мало отличаться от своего
предела f x , т. е. |
f x P x X x x / x. Запишем это соотношение для |
||||||||||||||||
интервала |
ak , ak 1 , |
считая, |
что |
его длина |
|
мала, |
т. е. положим |
x ak , |
|||||||||
x x ak 1. |
Тогда |
x ak 1 ak , |
и |
предыдущая |
формула |
примет |
вид |
||||||||||
f ak |
P ak |
ak 1 |
. |
В силу малости интервала ak , ak 1 приближенно можно |
|||||||||||||
|
|
||||||||||||||||
|
ak 1 ak |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
принять, что в этом интервале |
f x |
изменяется мало и равна |
f ak . Тогда за- |
||||||||||||||
пишем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f x |
P ak X ak 1 |
, ak |
x ak 1. (9) |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
ak 1 ak |
|
|
|
|
|
|
|
|
|
|||
Но, как мы знаем, P ak X ak 1 |
– вероятность попадания X в интервал |
||||||||||||||||
ak , ak 1 – мало отличается от |
pk – относительной частоты попадания X в ин- |
||||||||||||||||
тервал при большом числе значений |
X , попавших в этот интервал. Значит, |
||||||||||||||||
числители дробей в правых частях формул f |
|
x a |
p |
|
, ak |
x ak 1, |
и (9) |
||||||||||
|
|
a |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k 1 |
|
k |
|
|
приближенно равны, но их знаменатели одинаковы, следовательно, дроби
приближенно равны: f x f x , ak x ak 1, k 1, 2, |
..., . Кроме того, мы |
||||||
считаем, |
что lim f x 0. |
Поэтому можно принять, что |
f x 0 в интервалах |
||||
|
|
x |
|
|
|
|
|
a 1, |
и |
, a1 . Но |
f x 0 в указанных интервалах. Таким образом, |
||||
f x f |
x |
для |
всех x. |
Следовательно, |
F(x) F* (x) C const, так |
как эти |
|
функции |
имеют |
равные производные |
F x f x |
f x F x , |
причем |
||
|
|
|
|
382 |
|
|
5354.ru |
|
|
|
|
|
|
|
F x 0 при |
x a1 . Кроме того, |
lim F x 0, значит, в предыдущей формуле |
|
|
x |
нужно взять C 0. Отсюда F (x) F* (x) для всех x.
§2. Точечные оценки математического ожидания и дисперсии непрерывной случайной величины
Для дискретной случайной величины X математическое ожидание и дисперсия определяются следующими формулами (см. формулы (17) и (18) гла-
вы 19):
n |
n |
|
mx M X xi pi , |
D X xi mx 2 pi . |
(10) |
i 1 |
i 1 |
|
Пусть X – непрерывная случайная величина, закон распределения который мы ищем, в частности, ищем ее математическое ожидание и дисперсию. С этой целью проведем n испытаний (измерений) и составим таблицу 1 измеренных значений X . По этой экспериментально полученной таблице значений
X , зная числа x1, x2 , ..., xi , ..., |
|
xn , вычислим следующие два числа |
||||||||
|
|
|
|
|
|
|
1 |
n |
|
|
|
|
|
|
|
X |
xi , |
(11) |
|||
|
|
m |
x M |
|||||||
|
|
|
|
|
|
|
n |
i 1 |
|
|
|
|
X 1 |
|
n |
|
|
|
|
||
|
|
xi |
|
x 2 . |
(12) |
|||||
D |
m |
|||||||||
|
|
|
n |
|
i 1 |
|
|
|
|
Соотношения (11), (12) получаются из (10), если в (10) вероятности pi значений xi заменить на число 1/ n – относительную частоту каждого
из этих значений.
Число mx называется статистическим средним, а D X – статистиче-
ской дисперсией величины X . Вместе эти числа называются точечными оценками математического ожидания M(X)=mx и дисперсии D(X) рассматривае-
мой случайной величины.
Эти термины применяется в связи с тем, что при больших значениях n числа mx , D X соответственно можно приближенно принять за искомые ис-
тинные математическое ожидание и дисперсию рассматриваемой случайной величины, поскольку при увеличении числа n величины mx , D X сходятся
по вероятности к истинному математическому ожиданию mx и истинной дисперсии D X соответственно (см. об этом параграф 4). При дополнительных достаточно грубых предположениях возможность замены mx , D X со-
383
5354.ru
ответственно на mx , D X для больших значений n можно обосновать также
следующим образом.
От таблицы 1 перейдем к таблице 2. Отметим, что при этом в интервал
ak , ak 1 |
таблицы 2 попадет mk значений X и относительная частота попада- |
||
ний X |
в этот интервал будет равна |
pk* mk / n. |
В силу малости интервала |
ak , ak 1 |
приближенно будем считать, |
что все mk |
значений X , попавших в |
этот интервал, друг к другу близки и мало отличаются от середины интервала
xk (ak ak 1 ) / 2. |
Приближенно считаем, |
что все значения X , |
попавшие в ин- |
|||||||||||||||||||
тервал ak , ak 1 |
, равны между собой и равны xk , и это значение величина X |
|||||||||||||||||||||
принимает |
mk |
раз (т. е. от таблицы 2 переходим к таблице 3, считая, |
что |
|||||||||||||||||||
k 1, 2, ..., |
). Поэтому в правой части формулы (11) сумма значений X , |
по- |
||||||||||||||||||||
павших в интервал ak , ak 1 , |
приближенно равна mk xk |
и указанную формулу |
||||||||||||||||||||
теперь можно записать в виде |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
m |
x |
1 |
m x m x |
|
... m x |
|
m1 x |
m2 |
x |
... m x |
|
|||||||||
|
|
|
n |
1 1 |
2 |
|
2 |
|
|
|
|
|
|
n 1 |
n |
2 |
n |
|
|
|||
|
|
|
|
|
|
|
|
|
|
p x |
p x |
2 |
... p x |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
1 1 |
2 |
|
|
|
|
|
|
|
|||
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
x pk xk . |
|
|
|
(13) |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
k 1 |
|
|
|
|
|
|
|
|
|
|
|
Рассуждая аналогично, запишем формулу (12) следующим образом: |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xk |
|
x 2 |
pk . |
|
|
(14) |
|
|
||||||
|
|
|
|
|
D |
m |
|
|
|
|
k1
Сдругой стороны, математическое ожидание рассматриваемой непре-
рывной случайной величины определяется формулой (см. (19) главы 19)
|
|
mx M X xf x dx, |
(15) |
|
|
где f x – плотность распределения вероятностей. Несобственный инте-
грал в этой формуле запишем в виде суммы интегралов, взятых по интервалам ;a1 , a1;a2 , a2 ;a3 , ..., a ;a 1 , a 1; (законность такого представления вытекает из соответствующего свойства определённых интегралов, согласно которому определённый интеграл можно представить как сумму определённых интегралов по частям интервала, на которые он разбит, если учесть,
что несобственный интеграл есть предел определённого интеграла xf x dx,
384
5354.ru
Пусть – заданное положительное число, близкое к единице и меньшее ее. Обычно берут 0,997 (как это делается в правиле трёх сигм). Нужно найти такое положительное число , чтобы с вероятностью можно было утверждать, что истинное математическое ожидание mx попадает в интервалmx ; mx , то есть mx mx mx , следовательно, выполняется неравенство mx mx , и mx от mx отличается на величину, меньшую, чем . В
дальнейшем поясним, какой смысл вкладывается в последнее утверждение. В этом есть необходимость, так как mx и mx не являются случайными величинами и нельзя говорить о вероятности выполнения указанного неравенства.
|
|
Число |
|
называется доверительной вероятностью, интервал |
||
|
m |
x ; |
m |
x |
– доверительным. |
|
|
|
Пусть над X |
проводятся испытания сериями по n испытаний, в каждой |
серии получается своя таблица 1 со своими значениями для X , при этом полагаем, что число n достаточно большое ( n 50 ). Например, в одной серии это будут значения x1, x2 , ..., xn . В другой серии будут x11, x21 , ..., x1n . В следующей
серии в таблице 1 мы получим другие числа x12 , x22 , ..., xn2 . Поэтому появляющиеся в первых испытаниях серий числа x1, x11, x12 , ... можно рассматривать как значения некоторой случайной величины X1. Появляющиеся во вторых испытаниях числа x2 , x21 , x22 , ... будем рассматривать как значения другой случайной величины X 2 . Наконец, xn , xn1 , xn2 , ... будем рассматривать как значения некоторой величины X n . Из них образуем новую случайную величину (среднее арифметическое исходных)
|
|
x ( X1 X 2 ... X n ) / n. |
(17) |
M |
Случайные величины в числителе правой части этой формулы в каждой серии принимает значения из некоторой таблицы 1, поэтому число mx , опре-
делённое по формуле (11), есть одно из возможных значений M x . Замечая, что значение случайной величины Xi есть значение X в i–м испытании каждой
серии, |
будем считать, что только |
что введённые случайные величины |
||
X1, ..., |
X n имеют один и тот же закон распределения, совпадающий с иско- |
|||
мым |
законом распределения |
изучаемой величины |
X , |
тогда |
M Xi |
M X mx , i 1, ..., n, и их дисперсии D Xi D X , i 1, ..., |
n. |
Запишем |
математическое ожидание величины M x , используя свойства математического ожидания:
386
5354.ru
|
|
|
X |
X |
2 |
... X |
n |
|
|
M X |
M X |
... M X |
|
|
|
|
|
|
|
|
|
||||||||||||
M M x M |
1 |
|
|
|
|
|
1 |
2 |
n |
|
n mx |
/ n mx . |
||||
|
|
|
n |
|
|
n |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Итак, |
|
|
M M |
x mx . |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
(18) |
|
|
|
Аналогично запишем дисперсию случайной величины M x , при этом
учтём, что при вынесении за знак дисперсии постоянная величина |
1 |
возво- |
||||
|
|
|
|
|
n |
|
дится в квадрат: |
|
|
|
|||
D M |
x D X / n. |
(19) |
|
|
||
|
|
|
представляет собой сумму |
|||
Так как согласно (17) случайная величина M |
x |
большого числа n случайных величин с одним и тем же законом распределения, то по теореме Ляпунова для случайной величины M x будем иметь закон распределения, мало отличающийся от нормального. Таким образом, плот-
|
|
|
|
|
x приближенно определяется формулой |
|||||
ность распределения вероятностей M |
||||||||||
|
f x ( 2 ) 1 exp[ (x a)2 /(2 2 )]. |
|||||||||
Здесь a и 2 |
|
|
|
|
|
|
x , по- |
|||
– математическое ожидание и дисперсия величины M |
||||||||||
этому согласно (18) и (19) |
|
|
|
|||||||
|
a M M |
x mx , |
(20) |
|
|
|||||
где mx , D X |
2 D M |
x D X / n, |
(21) |
|
|
|||||
– искомые математическое ожидание и дисперсия изучае- |
||||||||||
мой величины X . |
|
|
|
с указанным нормальным за- |
||||||
Для случайной величины M |
x |
коном распределения запишем вероятность попадания её в интервал ; через функцию Лапласа (см. §5 главы 19):
|
|
|
a |
|
a |
|
|||
|
|
|
|||||||
P M x |
|
|
|
|
. |
(22) |
|||
|
|
||||||||
|
|
|
|
|
|
|
|||
Формулу (22) запишем для интервала mx ;mx , |
где – введённое |
выше число. Для этого в (22) положим mx , mx , учтём (20), (21) и получим
P mx M |
x mx / |
D X / n / |
D X / n . |
||
В силу нечётности x будем иметь |
|
|
|
||
P mx M |
x mx 2 / |
D X / n . |
(23) |
387
5354.ru
Теперь к обеим частям неравенства mx M x mx прибавим mx M x , домножим на 1 и получим M x mx M x . Это неравенство равносильно
предыдущему, поэтому неравенство в левой части (23) заменим на последнее неравенство. Тогда будем иметь
P Mx mx Mx 2 / D X / n . (24)
Потребуем, чтобы вероятность в левой части этого неравенства была равна – указанному выше числу:
P M |
|
|
x . |
(25) |
x mx M |
||||
Но тогда правая часть формулы (24) |
тоже равна . Значит, |
/ D X / n / 2. Зная число / 2, из таблиц значений для функций Лапласа x найдём значение аргумента функции
|
/ D X / n A. |
|
(26) |
где A – число, найденное нами из таблиц. Если в (26) известно значение |
|||
дисперсии D X , |
найдём . Но если |
D X |
неизвестно, то это число в (26) |
приближенно заменим на число D X , определяемое формулой (12), и тогда
из (26) найдём приближенно искомое число . Итак, пусть хотя бы приближенно число найдено. Теперь обратимся к (25). Согласно (25) вероятность события M x mx M x равна , например, равна 0,997, т. е. числу, близ-
кому к единице. Следовательно, это неравенство, как правило, выполнится,
так как вероятность очень близка к единице. Но |
m |
x |
есть одно из возможных |
|||||
|
|
x . Это означает, что неравенство |
|
|||||
значений M |
|
|||||||
|
|
m |
x mx |
m |
x |
(27) |
||
включается в неравенство в левой части (25): |
|
M x mx M x .
Вэтом смысле понимается выполнение неравенства (27) с вероятностью
. Определив число , входящее в (27), оценим погрешность, возникающую
при замене mx на mx формулы (11).
Существует интервальная оценка для математического ожидания изучаемой случайной величины X с нормальным законом при неизвестной дисперсии D X , полученная без использования D X . Эту оценку не приводим.
Аналогичную интервальную оценку можно получить и для дисперсии D X . Если X – случайная величина с нормальным законом распределения, то, вы-
388
5354.ru
возможное значение M x , величину M x также будем называть точечной оцен-
кой неизвестного математического ожидания mx M ( X ). Аналогично Dx будем называть точечной оценкой неизвестной дисперсии
но выше, M x сходится по вероятности к оцениваемой величине
оценку называют состоятельной. |
|
|
x также является состоятельной оценкой |
||
|
D |
||||
дисперсии D X . Как мы видели |
M ( |
|
x ) mx , т.е. математическое ожидание |
||
M |
точечной оценки M x равно оцениваему параметру mx . Такую оценку назы-
вают несмещенной (она выбирается с целью избежать систематических ошибок в сторону завышения или занижения).
По аналогии с выражением для |
|
x |
введем в рассмотрение случайную ве- |
|
D |
||||
личину |
( X i M x )2 |
, |
||
S 2 1 |
||||
|
|
|
n |
|
n 1 i 1
для которой указанное в конце §2 число s2 есть возможное значение, назовем её также точечной оценкой неизвестной дисперсии D X . Непосред-
ственный подсчет показывает, что математическое ожидание
M (S 2 ) D( X ), следовательсно, S2 – несмещенная оценка. Нетрудно проверить, что Dx не является несмещенной оценкой.
Несмещенная оценка называется эффективной, если её дисперсия является наименьшей по сравнению с дисперсиями других несмещенных оценок. Можно показать, что, если случайная величина X имеет нормальный закон распределения, то оценка M x является эффективной.
§5. Проверка статистических гипотез
Некоторые свойства изучаемой вероятностной модели, касающиеся законов распределения случайных величин, параметров распределения часто формулируются в виде гипотез. Эти гипотезы подвергаются статистической проверке, при которой используются опытные данные (выборка) и различные статистические критерии. Одним из основных понятий статистической проверки гипотез является понятие критерия проверки.
Критерием проверки D называется некоторый статистический показатель, являющийся числовой мерой отклонения, различия между выборочным распределением и гипотетическим распределением, относительно которого предполагается, что подлежащая проверке гипотеза верна (ниже будет рас-
390
5354.ru