Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

SalimovRB_matematika_gl_1-20_2011_web

.pdf
Скачиваний:
42
Добавлен:
12.05.2015
Размер:
3.88 Mб
Скачать
F x

Здесь под знаком интеграла мы взяли переменную t, чтобы её не путать с

верхним переменным пределом x.

Но в интервале ak , ak 1

функция f x

по-

стоянна и равна hk . Поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

p

 

x ak .

 

 

 

 

 

 

 

 

 

 

hk dt

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

ak 1 ak

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

Подставив это выражение в предыдущую формулу, получим

 

F* (x) F* (ak )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pk* (x ak ) /(ak 1

ak ),

ak

x ak 1, k 1,

2,

..., .

(7)

 

В (7) положим x ak 1, тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

F a

k 1

F a

p ,

k 1, 2,

...,

. (8)

 

 

 

 

 

 

 

 

 

k

k

 

 

 

 

 

 

Примем F * (a1 ) 0.

Согласно (8) соответственно будем иметь

 

F * (a2 ) p1*,

 

 

F* (a3 ) p1* p2*,

 

 

…,

 

F* (ak 1 ) p1* p2* ... pk* ,

F* (a

1

) p* p* ... p*

1.

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

Для x a1,

когда

f x 0,

по формуле Ньютона–Лейбница получим

 

 

 

 

 

 

 

F x F ak x

 

f t dt 0.

 

 

 

 

 

 

 

 

 

 

 

a1

 

 

 

 

Так как F a1 0,

то F x 0

для всех x a1.

Аналогично получим,

что

F x 1 для всех x a 1 .

 

 

 

 

 

 

 

 

 

 

Рис. 203

Как видно из предыдущего и, в частности, из (7), график функции состоит из прямолинейных участков. В самом деле, в интервале ak x ak 1

рассматриваемая

функция

имеет

уравнение

y F x

или

y F* (ak ) pk* (x ak ) /(ak 1 ak ). Но последнее есть уравнение прямой.

Записав

формулу (7) для k 1, 2, ..., ,

убедимся в том, что начало последующего от-

 

 

381

 

 

5354.ru

 

 

 

 

 

резка графика совпадает с концом предыдущего, и график функции F x

имеет вид, показанный на рис. 203.

Построенная функция F x называется статистической (эмпирической) функцией распределения рассматриваемой непрерывной случайной величины

X .

Пусть f x , F x – соответственно искомые плотность и функция рас-

пределения изучаемой непрерывной случайной величины X . Покажем, что в качестве этих функций можно приближенно взять только что построенные функции f * x и F* x . В самом деле, по определению плотности распреде-

ления

f x lim P x X x x .

x 0 x

При малых x дробь под знаком предела будет мало отличаться от своего

предела f x , т. е.

f x P x X x x / x. Запишем это соотношение для

интервала

ak , ak 1 ,

считая,

что

его длина

 

мала,

т. е. положим

x ak ,

x x ak 1.

Тогда

x ak 1 ak ,

и

предыдущая

формула

примет

вид

f ak

P ak

ak 1

.

В силу малости интервала ak , ak 1 приближенно можно

 

 

 

ak 1 ak

 

 

 

 

 

 

 

 

 

 

 

 

 

 

принять, что в этом интервале

f x

изменяется мало и равна

f ak . Тогда за-

пишем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f x

P ak X ak 1

, ak

x ak 1. (9)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ak 1 ak

 

 

 

 

 

 

 

 

 

Но, как мы знаем, P ak X ak 1

– вероятность попадания X в интервал

ak , ak 1 – мало отличается от

pk – относительной частоты попадания X в ин-

тервал при большом числе значений

X , попавших в этот интервал. Значит,

числители дробей в правых частях формул f

 

x a

p

 

, ak

x ak 1,

и (9)

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k 1

 

k

 

 

приближенно равны, но их знаменатели одинаковы, следовательно, дроби

приближенно равны: f x f x , ak x ak 1, k 1, 2,

..., . Кроме того, мы

считаем,

что lim f x 0.

Поэтому можно принять, что

f x 0 в интервалах

 

 

x

 

 

 

 

 

a 1,

и

, a1 . Но

f x 0 в указанных интервалах. Таким образом,

f x f

x

для

всех x.

Следовательно,

F(x) F* (x) C const, так

как эти

функции

имеют

равные производные

F x f x

f x F x ,

причем

 

 

 

 

382

 

 

5354.ru

 

 

 

 

 

 

 

F x 0 при

x a1 . Кроме того,

lim F x 0, значит, в предыдущей формуле

 

 

x

нужно взять C 0. Отсюда F (x) F* (x) для всех x.

§2. Точечные оценки математического ожидания и дисперсии непрерывной случайной величины

Для дискретной случайной величины X математическое ожидание и дисперсия определяются следующими формулами (см. формулы (17) и (18) гла-

вы 19):

n

n

 

mx M X xi pi ,

D X xi mx 2 pi .

(10)

i 1

i 1

 

Пусть X – непрерывная случайная величина, закон распределения который мы ищем, в частности, ищем ее математическое ожидание и дисперсию. С этой целью проведем n испытаний (измерений) и составим таблицу 1 измеренных значений X . По этой экспериментально полученной таблице значений

X , зная числа x1, x2 , ..., xi , ...,

 

xn , вычислим следующие два числа

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

X

xi ,

(11)

 

 

m

x M

 

 

 

 

 

 

 

n

i 1

 

 

 

X 1

 

n

 

 

 

 

 

 

xi

 

x 2 .

(12)

D

m

 

 

 

n

 

i 1

 

 

 

 

Соотношения (11), (12) получаются из (10), если в (10) вероятности pi значений xi заменить на число 1/ n – относительную частоту каждого

из этих значений.

Число mx называется статистическим средним, а D X статистиче-

ской дисперсией величины X . Вместе эти числа называются точечными оценками математического ожидания M(X)=mx и дисперсии D(X) рассматривае-

мой случайной величины.

Эти термины применяется в связи с тем, что при больших значениях n числа mx , D X соответственно можно приближенно принять за искомые ис-

тинные математическое ожидание и дисперсию рассматриваемой случайной величины, поскольку при увеличении числа n величины mx , D X сходятся

по вероятности к истинному математическому ожиданию mx и истинной дисперсии D X соответственно (см. об этом параграф 4). При дополнительных достаточно грубых предположениях возможность замены mx , D X со-

383

5354.ru

ответственно на mx , D X для больших значений n можно обосновать также

следующим образом.

От таблицы 1 перейдем к таблице 2. Отметим, что при этом в интервал

ak , ak 1

таблицы 2 попадет mk значений X и относительная частота попада-

ний X

в этот интервал будет равна

pk* mk / n.

В силу малости интервала

ak , ak 1

приближенно будем считать,

что все mk

значений X , попавших в

этот интервал, друг к другу близки и мало отличаются от середины интервала

xk (ak ak 1 ) / 2.

Приближенно считаем,

что все значения X ,

попавшие в ин-

тервал ak , ak 1

, равны между собой и равны xk , и это значение величина X

принимает

mk

раз (т. е. от таблицы 2 переходим к таблице 3, считая,

что

k 1, 2, ...,

). Поэтому в правой части формулы (11) сумма значений X ,

по-

павших в интервал ak , ak 1 ,

приближенно равна mk xk

и указанную формулу

теперь можно записать в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

x

1

m x m x

 

... m x

 

m1 x

m2

x

... m x

 

 

 

 

n

1 1

2

 

2

 

 

 

 

 

 

n 1

n

2

n

 

 

 

 

 

 

 

 

 

 

 

 

p x

p x

2

... p x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 1

2

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

x pk xk .

 

 

 

(13)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k 1

 

 

 

 

 

 

 

 

 

 

 

Рассуждая аналогично, запишем формулу (12) следующим образом:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xk

 

x 2

pk .

 

 

(14)

 

 

 

 

 

 

 

D

m

 

 

 

 

k1

Сдругой стороны, математическое ожидание рассматриваемой непре-

рывной случайной величины определяется формулой (см. (19) главы 19)

 

 

mx M X xf x dx,

(15)

 

 

где f x – плотность распределения вероятностей. Несобственный инте-

грал в этой формуле запишем в виде суммы интегралов, взятых по интервалам ;a1 , a1;a2 , a2 ;a3 , ..., a ;a 1 , a 1; (законность такого представления вытекает из соответствующего свойства определённых интегралов, согласно которому определённый интеграл можно представить как сумму определённых интегралов по частям интервала, на которые он разбит, если учесть,

что несобственный интеграл есть предел определённого интеграла xf x dx,

384

5354.ru

когда , произвольным образом). Таким образом, формула (15) может быть записана так:

 

a1

 

ak 1

 

 

 

mx

xf x dx

xf x dx xf x dx.(16)

 

 

 

k 1

a

a

 

 

 

 

 

k

1

 

 

Предположим, что

xf (x) 0

настолько быстро при

x и

x , что

первый и последний интегралы формулы (16) приближенно равны нулю. Остаётся рассмотреть в этой формуле интегралы, взятые по интервалам таблицы 2. В интервале ak , ak 1 приближенно будем считать, что x xk – сере-

дине интервала. Кроме того, как уже отмечалось выше, в этом интервале справедливо приближённое равенство

f x f x pk /(ak 1 ak ).

Значит,

xf x x p /(a

a ),

a x a

k 1

k k k 1

k

k

Поэтому

ak 1

ak

и (16) примет вид mx

xf x dx xk ak 1pk ak ak 1 ak xk pk

xk pk . Сравнив полученное соотношение с (13),

k 1

видим, что

m

x

mx .

 

 

 

 

 

– чис-

 

Аналогично можно показать, что истинная дисперсия D( X )

 

( X )

 

D

лу, найденному по формуле (12).

 

 

 

 

 

 

 

Нередко

в

качестве оценки дисперсии вместо

 

 

( X ) берут

число

 

D

 

 

n

 

 

 

 

 

 

 

1

n

 

 

 

 

 

 

s2

 

 

( X )

 

 

(xi mx )2 , называемое исправленной

дисперсией

(ясно,

 

D

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

n 1 i 1

 

 

 

 

 

 

что при больших значениях n эти числа близки).

§3. Интервальная оценка математического ожидания непрерывной случайной величины

Пусть X – изучаемая непрерывная случайная величина. Над ней проведём n испытаний (измерений) и составим таблицу 1. Зная числа этой таблицы, по формулам (11), (12) найдём статистическое среднее mx и статистиче-

скую дисперсию D( X ) . Нужно оценить, насколько найденное число mx отличается от истинного математического ожидания M ( X ) mx .

385

5354.ru

Пусть – заданное положительное число, близкое к единице и меньшее ее. Обычно берут 0,997 (как это делается в правиле трёх сигм). Нужно найти такое положительное число , чтобы с вероятностью можно было утверждать, что истинное математическое ожидание mx попадает в интервалmx ; mx , то есть mx mx mx , следовательно, выполняется неравенство mx mx , и mx от mx отличается на величину, меньшую, чем . В

дальнейшем поясним, какой смысл вкладывается в последнее утверждение. В этом есть необходимость, так как mx и mx не являются случайными величинами и нельзя говорить о вероятности выполнения указанного неравенства.

 

 

Число

 

называется доверительной вероятностью, интервал

 

m

x ;

m

x

доверительным.

 

 

Пусть над X

проводятся испытания сериями по n испытаний, в каждой

серии получается своя таблица 1 со своими значениями для X , при этом полагаем, что число n достаточно большое ( n 50 ). Например, в одной серии это будут значения x1, x2 , ..., xn . В другой серии будут x11, x21 , ..., x1n . В следующей

серии в таблице 1 мы получим другие числа x12 , x22 , ..., xn2 . Поэтому появляющиеся в первых испытаниях серий числа x1, x11, x12 , ... можно рассматривать как значения некоторой случайной величины X1. Появляющиеся во вторых испытаниях числа x2 , x21 , x22 , ... будем рассматривать как значения другой случайной величины X 2 . Наконец, xn , xn1 , xn2 , ... будем рассматривать как значения некоторой величины X n . Из них образуем новую случайную величину (среднее арифметическое исходных)

 

 

x ( X1 X 2 ... X n ) / n.

(17)

M

Случайные величины в числителе правой части этой формулы в каждой серии принимает значения из некоторой таблицы 1, поэтому число mx , опре-

делённое по формуле (11), есть одно из возможных значений M x . Замечая, что значение случайной величины Xi есть значение X в i–м испытании каждой

серии,

будем считать, что только

что введённые случайные величины

X1, ...,

X n имеют один и тот же закон распределения, совпадающий с иско-

мым

законом распределения

изучаемой величины

X ,

тогда

M Xi

M X mx , i 1, ..., n, и их дисперсии D Xi D X , i 1, ...,

n.

Запишем

математическое ожидание величины M x , используя свойства математического ожидания:

386

5354.ru

 

 

 

X

X

2

... X

n

 

 

M X

M X

... M X

 

 

 

 

 

 

 

 

M M x M

1

 

 

 

 

 

1

2

n

 

n mx

/ n mx .

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак,

 

 

M M

x mx .

 

 

 

 

 

 

 

 

 

 

 

 

 

(18)

 

 

 

Аналогично запишем дисперсию случайной величины M x , при этом

учтём, что при вынесении за знак дисперсии постоянная величина

1

возво-

 

 

 

 

 

n

 

дится в квадрат:

 

 

 

D M

x D X / n.

(19)

 

 

 

 

 

представляет собой сумму

Так как согласно (17) случайная величина M

x

большого числа n случайных величин с одним и тем же законом распределения, то по теореме Ляпунова для случайной величины M x будем иметь закон распределения, мало отличающийся от нормального. Таким образом, плот-

 

 

 

 

 

x приближенно определяется формулой

ность распределения вероятностей M

 

f x ( 2 ) 1 exp[ (x a)2 /(2 2 )].

Здесь a и 2

 

 

 

 

 

 

x , по-

– математическое ожидание и дисперсия величины M

этому согласно (18) и (19)

 

 

 

 

a M M

x mx ,

(20)

 

 

где mx , D X

2 D M

x D X / n,

(21)

 

 

– искомые математическое ожидание и дисперсия изучае-

мой величины X .

 

 

 

с указанным нормальным за-

Для случайной величины M

x

коном распределения запишем вероятность попадания её в интервал ; через функцию Лапласа (см. §5 главы 19):

 

 

 

a

 

a

 

 

 

 

P M x

 

 

 

 

.

(22)

 

 

 

 

 

 

 

 

 

Формулу (22) запишем для интервала mx ;mx ,

где – введённое

выше число. Для этого в (22) положим mx , mx , учтём (20), (21) и получим

P mx M

x mx /

D X / n /

D X / n .

В силу нечётности x будем иметь

 

 

 

P mx M

x mx 2 /

D X / n .

(23)

387

5354.ru

Теперь к обеим частям неравенства mx M x mx прибавим mx M x , домножим на 1 и получим M x mx M x . Это неравенство равносильно

предыдущему, поэтому неравенство в левой части (23) заменим на последнее неравенство. Тогда будем иметь

P Mx mx Mx 2 / D X / n . (24)

Потребуем, чтобы вероятность в левой части этого неравенства была равна – указанному выше числу:

P M

 

 

x .

(25)

x mx M

Но тогда правая часть формулы (24)

тоже равна . Значит,

/ D X / n / 2. Зная число / 2, из таблиц значений для функций Лапласа x найдём значение аргумента функции

 

/ D X / n A.

 

(26)

где A – число, найденное нами из таблиц. Если в (26) известно значение

дисперсии D X ,

найдём . Но если

D X

неизвестно, то это число в (26)

приближенно заменим на число D X , определяемое формулой (12), и тогда

из (26) найдём приближенно искомое число . Итак, пусть хотя бы приближенно число найдено. Теперь обратимся к (25). Согласно (25) вероятность события M x mx M x равна , например, равна 0,997, т. е. числу, близ-

кому к единице. Следовательно, это неравенство, как правило, выполнится,

так как вероятность очень близка к единице. Но

m

x

есть одно из возможных

 

 

x . Это означает, что неравенство

 

значений M

 

 

 

m

x mx

m

x

(27)

включается в неравенство в левой части (25):

 

M x mx M x .

Вэтом смысле понимается выполнение неравенства (27) с вероятностью

. Определив число , входящее в (27), оценим погрешность, возникающую

при замене mx на mx формулы (11).

Существует интервальная оценка для математического ожидания изучаемой случайной величины X с нормальным законом при неизвестной дисперсии D X , полученная без использования D X . Эту оценку не приводим.

Аналогичную интервальную оценку можно получить и для дисперсии D X . Если X – случайная величина с нормальным законом распределения, то, вы-

388

5354.ru

числив по формулам (11), (12) величины mx и D X – приближённые значения соответственно истинного математического ожидания mx и истинной дисперсии D X случайной величины X – непосредственно найдем прибли-

жённо закон распределения этой случайной величины. Интервальные оценки для mx , D X позволяют оценить допускаемую, как правило, при этом по-

грешность.

Пример. Произведено 36 испытаний над величиной X . По данным выборки найдены mx 10, 78, D X 0, 064. Требуется построить доверительный

интервал для математического ожидания mx , соответствующий доверительной вероятности 0,8.

Вычисляем

 

 

X 0, 253;

 

 

X

n 0, 253 6 0,042. По

формуле

 

D

D

2 n /

 

 

 

имеем

0,042 0, 4.

Из

таблиц значений

функции

D

 

Лапласа найдем значение аргумента 0,042 1, 28,

соответствующее значению

0,4 функции; 1, 28 0, 042 0, 054.

Итак, доверительный интервал для заданной вероятности 0,8 будет

mx 0, 054 mx mx 0, 054, т. е. 10, 726 mx 10,834.

§4. О сходимости по вероятности статистического среднего и статистической дисперсии.

Состоятельные, несмещенные и эффективные оценки

Пусть X – случайная величина, закон распределения которой отыскивается. Поступив, как в §2, найдем mx, D X . Введем в рассмотрение случайные

величины X1, X2 ,..., Xn , означающие то же, что и в §3, по отношению к X .

Среднее арифметическое

этих

 

 

x ( X1 X 2 ... X n ) / n,

ее

M

M ( Xi ) M (X ), i 1, 2,..., n )

M (M x ) M (X1 ) M

Согласно теореме Чебышева M x

величин есть случайная величина математическое ожидание (при

(X 2 ) M (X n ) M (X ) mx . n

сходится по вероятности к M M x mx .

 

 

 

1

n

 

Введя в рассмотрение случайную величину

 

x

( X i

 

x )2 ,

можно пока-

D

M

 

 

 

n i 1

 

зать, что она сходится по вероятности к дисперсии D X . Поскольку mx есть

389

5354.ru

mx , такую
D X . Как показа-

возможное значение M x , величину M x также будем называть точечной оцен-

кой неизвестного математического ожидания mx M ( X ). Аналогично Dx будем называть точечной оценкой неизвестной дисперсии

но выше, M x сходится по вероятности к оцениваемой величине

оценку называют состоятельной.

 

 

x также является состоятельной оценкой

 

D

дисперсии D X . Как мы видели

M (

 

x ) mx , т.е. математическое ожидание

M

точечной оценки M x равно оцениваему параметру mx . Такую оценку назы-

вают несмещенной (она выбирается с целью избежать систематических ошибок в сторону завышения или занижения).

По аналогии с выражением для

 

x

введем в рассмотрение случайную ве-

D

личину

( X i M x )2

,

S 2 1

 

 

 

n

 

n 1 i 1

для которой указанное в конце §2 число s2 есть возможное значение, назовем её также точечной оценкой неизвестной дисперсии D X . Непосред-

ственный подсчет показывает, что математическое ожидание

M (S 2 ) D( X ), следовательсно, S2 – несмещенная оценка. Нетрудно проверить, что Dx не является несмещенной оценкой.

Несмещенная оценка называется эффективной, если её дисперсия является наименьшей по сравнению с дисперсиями других несмещенных оценок. Можно показать, что, если случайная величина X имеет нормальный закон распределения, то оценка M x является эффективной.

§5. Проверка статистических гипотез

Некоторые свойства изучаемой вероятностной модели, касающиеся законов распределения случайных величин, параметров распределения часто формулируются в виде гипотез. Эти гипотезы подвергаются статистической проверке, при которой используются опытные данные (выборка) и различные статистические критерии. Одним из основных понятий статистической проверки гипотез является понятие критерия проверки.

Критерием проверки D называется некоторый статистический показатель, являющийся числовой мерой отклонения, различия между выборочным распределением и гипотетическим распределением, относительно которого предполагается, что подлежащая проверке гипотеза верна (ниже будет рас-

390

5354.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]