Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

SalimovRB_matematika_gl_1-20_2011_web

.pdf
Скачиваний:
42
Добавлен:
12.05.2015
Размер:
3.88 Mб
Скачать

группу и являются противоположными, поэтому сумма их вероятностей равна единице. Тогда

P X M X 1 P X M X . (23)

В исходной таблице одни значения X удовлетворяют условию xi mx , а другие – условию xi mx . Будем считать, что в этой таблице значения X

расположены так, что первые k значений удовлетворяют первому неравенству, а остальные удовлетворяют второму, т. е.

 

x1 mx

 

,

 

 

x2 mx

 

, ...,

 

 

xk mx

 

.

(24)

 

 

 

 

 

 

 

 

xk 1 mx

 

,

 

 

xk 2 mx

 

,

...,

 

xn mx

 

. (25)

 

 

 

 

 

 

 

 

Событие

 

X M X

 

 

произойдет в случае, когда X примет какое-либо

 

 

значение, входящее в неравенства (25). Значит, рассматриваемое событие означает, что X примет или значение xk 1 , или xk 2 , …, или xn . Итак, рассмат-

риваемое событие представляет собой сумму только что перечисленных несовместных событий. Поэтому его вероятность равна сумме вероятностей этих событий:

P(| X M ( X ) | ) pk 1 pk 2 pn .

(26)

Правую часть формулы (21) уменьшим следующим образом: отбросим там все квадраты разностей, удовлетворяющих неравенствам (24), а квадраты остальных разностей, удовлетворяющих неравенствам (25), заменим мень-

шими или

равными числам 2 .

Теперь из

(21) следует, что

D X 2 pk 1

pk 2 ... pn . Согласно (26)

получим D X 2 P

 

X M X

 

.

 

 

Это неравенство умножим на отрицательное число 2 ,

при этом знак нера-

венства изменится на обратный. Затем к обеим частям неравенства прибавим по единице, тогда получим

1 P X M X 1 D X / 2 .

P

 

Левая часть

последнего неравенства согласно формуле (23) равна

 

X M X

 

.

Пришли к неравенству (22). Теорема доказана.

 

 

Неравенство Чебышева имеет большое теоретическое значение, но при практическом применении может привести к результатам, не представляющим интерес. Например, если в формуле (22) D X 2 2 , то правая часть (22)

будет равна 1, а в левой части стоит вероятность, которая всегда больше или равна нулю, т. е. неравенство в данном случае ничего нового не даёт.

371

5354.ru

§9. Теорема Чебышева

Если X1, X2 , ..., Xn – независимые случайные величины, дисперсии которых не превышают некоторого положительного числа C, то каким бы малым положительное число ни было, выполняется равенство

 

 

 

 

 

 

X

1

X

2

... X

n

 

M X

1

 

M X

2

... M

X

n

 

 

 

 

1. (27)

 

 

 

 

 

 

 

 

 

 

lim

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство.

 

Рассмотрим

 

новую

 

 

 

случайную

величину

 

 

( X1 X 2

... X n ) / n,

 

которая

представляет

 

собой

среднеарифметическое

X

 

 

исходных случайных величин. Запишем математическое ожидание этой величины. Учтём, что за знак математического ожидания можем вынести 1/ n, тогда M X (1/ n)M X1 X2 ... Xn . Но, как мы знаем, математическое ожида-

ние суммы случайных величин равно сумме математических ожиданий слагаемых величин, поэтому M X (M X1 M X2 ... M Xn ) / n. Аналогично запишем дисперсию X , учитывая, что при вынесении за знак дисперсии множителя 1/ n он возводится в квадрат:

D X [D X1 D X2 ... D Xn ]/ n2. (28)

По условию теоремы дисперсия каждой из случайных величин не превосходит C, т. е. D X1 C, D X2 C, ..., D Xn C. Сложив все эти неравенства, получим D X1 D X2 ... D Xn nC. Из последнего неравенства и формулы (28) получим

D X

C / n .

(29)

Это неравенство умножим на отрицательное число 2 , после этого к обеим частям прибавим по единице, получим

1 D X

/ 2 1 C /( 2n).

(30)

Для введённой величины X запишем неравенство Чебышева (22):

P X M X 1 D X / 2.

Правая часть последнего неравенства согласно (30) больше или равна 1 C /( 2n). Итак, P X M X 1 C /( 2n). Но вероятность в левой части

этого неравенства, как и любая вероятность вообще, не больше единицы, поэтому 1 P X M X 1 C /( 2n). В последнем соотношении перейдём к

пределу, когда n , и учтём, что предел левой части равен единице. Предел правой части тоже равен единице. Таким образом, вероятность в записанном

372

5354.ru

неравенстве заключена между величинами, имеющими при n один и тот

же предел, равный единице. Поэтому предел

указанной

вероятности при

n тоже

равен единице, согласно

теореме 13 главы 4.

Итак,

lim P

 

 

 

M

 

 

 

 

1. Подставив сюда выражения для X

 

 

 

 

получим

 

 

 

 

 

 

 

 

X

X

 

 

 

и M ( X

),

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нужное равенство (27).

Из теоремы Чебышева следует, что при больших значениях n значение случайной величины X – среднеарифметического исходных случайных величин – как правило будет мало отличаться от M ( X ) – определённого числа, которое вычисляется и представляет собой среднеарифметическое математических ожиданий исходных величин, так как вероятность выполнения неравенства в формуле (27) при малом будет мало отличаться от 1, и это неравенство как правило будет выполняться. Таким образом, указанная случайная величина как правило принимает значение, мало отличающиеся от известного числа, иначе говоря, эта случайная величина перестаёт носить случайный характер.

Теорема Чебышева имеет большое практическое значение. Она лежит в основе известного в статистике так называемого выборочного метода, когда о всей совокупности объектов судят по небольшой его части. Например, о качестве всей массы зерна судят по небольшой его пробе, составленной из зёрен, взятых из различных мест массы зерна. Хотя проба зерна по массе небольшая, но она содержит большое число зёрен. Согласно теореме Чебышева при большом n можно о всей массе зерна судить по качеству взятой пробы.

Замечание. Если для любого малого числа 0 выполняется соотношение

(27), то говорят, что случайная величина

X1 X 2 ... X n

сходится по вероят-

n

 

M X1 M X2

... M Xn

 

 

ности к числу

.

 

 

n

 

 

 

 

 

 

 

 

Это не означает, что содержашееся в формуле (27) неравенство всегда для всех значений X1, X 2 , , X n будет выполняться, если n – достаточно большое

число. При достаточно большом n вероятность указанного неравенства будет близка к единице, поэтому указанное неравенство, как правило, будет выполняться, но могут быть и исключения.

373

5354.ru

X1, X2 , ..., X n
– незави-
X1 X 2 ... X n
X2 , ..., Xn .

§10. Теорема Бернулли, центральная предельная теорема Ляпунова

Теорема Бернулли. Пусть проводится n одинаковых испытаний, в каждом из которых может появиться событие A или нет, причём вероятность появления события A во всех испытаниях одинакова и равна p – известному числу. Пусть m – число появлений события A, а m / n – относительная частота появлений события A при n проведённых одинаковых испытаниях.

Тогда lim P m / n p 1, каким бы малым положительное число ни было.

n

Доказательство. Пусть X1 – число появлений события A при первом испытании, X 2 – число появлений события A при втором испытании, и т. д., X n

– число появлений события A при n -м испытании. Случайная величина X1 принимает значения: x1,1 1, если при первом же испытании событие A появляется (вероятность этого значения равна p ); x1,2 0, если событие A не появляется в первом испытании (вероятность появления этого значения равна

q 1 p ). Поэтому математическое ожидание M X1 1 p 0 q p,

дисперсия

D X1 pq. Аналогично для всех остальных случайных величин

X 2 ,

..., X n

имеем M X1 M X2 ... M Xn p,

D X1

D 2 ... D Xn pq.

Для

рассматриваемых случайных величин

X1, X2 , ...,

Xn выполнены все условия

теоремы Чебышева, причём

 

 

 

 

M X1 M X2 ... M Xn np.

(31)

 

 

 

Если при первом испытании событие A произойдет, X1 примет значение единица, и если событие A не произойдет при первом испытании, то X1 примет значение нуль. Аналогично ведут себя и Поэтому, если при n испытаниях событие A произойдет m раз, то из величин X1, X2 , ..., Xn m величин примут значение единица, а остальные будут равны нулю. Это означает, что сумма примет значение, равное m. Подставим m вместо

указанной суммы в формулу (27), учтем в ней соотношение (31) и получим требуемое.

Центральная предельная теорема Ляпунова. Если

симые случайные величины с одним и тем же законом распределения с математическим ожиданием m и дисперсией 2 , то при неограниченном увели-

374

5354.ru

чении числа n случайных величин закон распределения суммы X1 X2 ...

Xn

будет сколь угодно близок к нормальному.

 

Теорема принимается без доказательства.

Практическое значение этой теоремы поясним на примере. Пусть рассматривается некоторая случайная величина, зависящая от множества факторов, каждый из них даёт свою составляющую рассматриваемой случайной величины. Согласно теореме Ляпунова, если все указанные составляющие имеют один и тот же закон распределения, то рассматриваемая случайная величина будет иметь закон распределения, мало отличающийся от нормального, если число составляющих случайную величину достаточно велико. Таким образом, эта теорема объясняет, почему на практике нормальное распределение встречается очень часто.

Теоремы Чебышева, Бернулли носят название закона больших чисел.

375

5354.ru

ГЛАВА 20. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

В результате наблюдений и регистрации массовых случайных событий (случайных величин) получаются статистические данные, к ним относятся, в частности, и результаты измерений тех или иных величин, которые всегда содержат случайные ошибки, т. е. являются значениями случайных величин. Одной из задач математической статистики является определение приближенных законов распределения рассматриваемых случайных величин и оценка параметров законов распределения этих случайных величин на основе статистических данных, т е. на основе наблюдений, испытаний.

Любое статистическое обследование начинается с наблюдения (измерения) выборки - части объектов исследуемой совокупности, так как сплошное обследование требует больших материальных затрат. Вся обследуемая совокупность называется генеральной совокупностью. Чтобы по данным выборки можно было достаточно уверенно судить о всей совокупности, необходимо, чтобы данные выборки правильно её представляли. Этого можно достигнуть, организовав эксперимент так, чтобы вероятность выбора была одинакова для всех элементов совокупности. Выборку в таком случае называют представи-

тельной.

§1. Простой статистический ряд. Статистическая функция распределения. Статистический ряд. Гистограмма

Пусть X – непрерывная случайная величина, закон распределения которой нужно найти. Например, нужно найти её функцию распределения F x . С

этой целью проводят серию испытаний, измерений, причём в каждом из них появляется и замеряется значение X . Результаты этих испытаний оформляются в виде таблицы, в первой строке которой записывается номер испытания

(измерения), а во второй строке – значение xi

измеренной величины X в i

испытании.

 

 

 

 

 

 

 

 

 

Таблица 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

№ испыта-

1

2

 

 

i

n

 

 

ния

 

 

 

 

 

 

 

 

 

 

Значения X

x1

x2

 

 

 

xi

xn

 

 

 

 

376

 

 

 

 

 

5354.ru

 

 

 

 

 

 

 

 

 

 

X x,

Эту таблицу называют простым статистическим рядом или выборкой.

Множество всех возможных значений X назовем генеральной совокупностью. Будем считать для простоты, что в этой таблице все измеренные значения x1, x2 , ..., xn различные. Здесь при обработке данных таблицы 1 будем разли-

чать два случая и соответственно им будем проводить обработку таблицы 1. Случай 1. Число измерений n в таблице 1, т. е. число измеренных значений X , не очень велико, например, от 10 до 20. В этом случае на основании таблицы 1 строят так называемую статистическую (выборочную) функцию распределения, обозначаемую F X и равную P X x – относительной ча-

стоте появления события т. е. числу появлений этого события, делённому на число n проведённых измерений. Появление события X x означает, что рассматриваемая величина приняла значение, меньшее x , поэтому число таких значений таблицы 1 равно числу появлений события X x. Итак,

F x P X

x

(1)

 

 

 

 

 

для

любого

фиксированного

x. Для того, чтобы построить функцию

F x ,

поступим следующим образом: из чисел x ,

x

, ...,

x

n

таблицы 1 выбе-

 

 

 

1

2

 

 

 

рем наименьшее и обозначим его x1, далее из оставшихся n 1 чисел таблицы 1 снова выберем наименьшее и обозначим его x2 . Продолжив процесс, расположим числа таблицы 1, стоящие во второй строке, в виде последовательно-

сти возрастающих чисел x1, x2 , ...,

xn . Далее поступим так. При x x1 в табли-

це 1 нет значений, меньших x,

поэтому P X x 0. При x1 x x2 в таблице 1

имеется лишь одно значение

x1,

меньшее x, поэтому P X x 1 n. При

x2 x x3 в таблице 1 имеются два значения x1, x2 , меньшие x, следовательно,

P X x 2 n,

и т.

д. Аналогично для интервала

xi x xi 1

будем иметь

P X x i n.

При

xn x все значения таблицы

1 меньше

x, поэтому

P X x n 1.

 

 

 

 

 

n

 

 

 

 

 

Теперь с учётом (1) можно записать

 

 

 

F x 0

при

x x1 ,

 

 

 

F x 1/ n

при

x1 x x2 ,

 

 

 

F x 2 / n

при

x2 x x3, ,

(2)

 

 

………………………………………

 

 

 

F x i / n

при

xi x xi 1, ,

 

 

 

……………………………………

 

 

 

377

5354.ru

 

n .

F x 1

при xn x.

 

 

 

График функции F x на плос-

 

 

кости Oxy имеет вид, указанный на

 

 

рис. 201. Как показывает формула

 

 

(2), график этой функции F x пред-

 

 

ставляет собой прерывистую линию,

 

 

состоящую из прямолинейных участ-

 

 

ков, лежащих на прямых параллель-

 

 

ных оси Ox и стоящих друг от друга

 

 

на расстоянии, равном 1/ n.

 

Рис. 201

Пусть F x есть функция распре-

 

деления рассматриваемой случайной величи-

 

 

ны X . Мы знаем, что F x P X x – вероятность попадания X в интервал , x . Запишем ее так:

F x P X x .

(3)

Покажем, что построенная статистическая функция распределения F x может быть взята приблизительно в качестве функции распределения F x . Вначале отметим, как изменяется график функции F x с увеличением числа n измерений таблицы 1. С увеличением n разрывы графика, равные 1/ n, уменьшаются. Кроме того, с увеличением n в интервалах xi x xi 1 появляются новые значения x, т. е. эти интервалы измельчаются, следовательно, длины конечных отрезков, составляющих график функции F x , также уменьшаются. Таким образом, график функций F x стремится к сплошной

линии.

Рассмотрим событие X x. Для любого фиксированного x вероятность этого события обозначим P X x p. Относительную частоту этого события

при n одинаковых испытаниях обозначим P X x m / n. Будем считать, что

для события X x выполняются условия теоремы Бернулли о повторных испытаниях. Тогда согласно теореме Бернулли, каким бы малым ни было число

0, вероятность выполнения неравенства

 

m / n p

 

, т. е. неравенства

 

 

P X x P X x , будет сколь угодно близка к единице, если число n

испытаний будет достаточно велико, так как вероятность этого неравенства стремится к единице при Это означает, что относительная частота

378

5354.ru

P X x , как правило, будет мало отличаться от вероятности P X x . Тогда согласно (1) и (3) F x будет мало отличаться от F x для любого фиксиро-

ванного x.

Случай 2. Когда число измерений в таблице 1, а следовательно, число значений X второй строки этой таблицы достаточно велико, например, несколько десятков или даже сотен, таблица становится трудно обозримой и анализ её затрудняется. В этом случае поступают иначе: весь интервал значений, внутри которого находятся значения X , разбивают на частичные интервалы (a1, a2 ), (a2 , a3 ), ..., (a , a 1 ). Число интервалов обычно берут от 10 до

20. Значения X таблицы 1, совпадающие с числами a2 , a3 , , a , будем относить к левому интервалу. Подсчитаем число значений X , попавших в указанные частичные интервалы. Пусть m1 – число значений X в таблице 1, попав-

ших в интервал a1, a2 ,

m2 – число значений

X , попавших в a2 , a3 ,...,

m

число значений X , попавших в интервал a , a 1 . Очевидно

 

 

m1 m2

... m

n.

(4)

 

Пусть

 

 

 

 

 

mk

/ n pk* ,

k 1, 2,

..., .

(5)

 

Ясно, что pk есть относительная частота попадания X в интервал ak , ak 1 .

В силу (5) имеем p1 p2 ... p (m1 m2 ... m ) / n. Отсюда с учетом (4)

 

 

 

 

 

 

 

p1

p2 ... p pk 1.

(6)

 

k 1

Теперь от таблицы 1 перейдем к другой таблице – таблице 2, в первой строке которой записаны частичные интервалы, во второй строке – значения

mk – число попаданий X

в интервале

ak , ak 1 , k 1,

2,

..., . В последней

строке стоят относительные частоты pk для всех k 1, 2,

...,

 

.

Таблица 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Частич-

 

 

 

 

 

 

 

 

 

 

 

ные ин-

(a1 , a2 )

(a2 , a3 )

 

 

(ak , ak 1 )

 

 

(a , a 1 )

 

 

тервалы

 

 

 

 

 

 

 

 

 

 

 

mk

m1

m2

 

 

mk

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pk

p1

p2

 

 

pk

 

 

 

p

 

Эту

 

 

 

 

 

 

 

 

таблицу называют статистическим рядом (группировкой.)

 

 

 

379

 

 

 

 

 

 

5354.ru

 

 

 

 

 

 

 

 

 

 

 

Таблицу 2 иллюстрируют геометрически. Для этого на оси Ox плоскости Oxy показывают частичные интервалы таблицы 2 и на них как на основаниях

строят прямоугольники с площадью

pk* , высоты

которых равны

hk pk* /(ak 1 ak ). Это построение выполним

для всех k 1,

2, ..., . Получим

фигуру, составленную из прямоугольников, которая называется гистограммой (см. рис. 202). Ясно, что площадь гистограммы равна, согласно (6),

p p

... p 1.

 

 

 

1

2

 

 

 

 

 

Иногда от таблицы 2 переходят к табли-

 

це 3 следующим образом. Середину интер-

 

вала

 

ak , ak 1

обозначают

xk (ak 1 ak ) / 2 .

 

Предполагая, что интервал ak , ak 1 по длине

 

мал,

считают,

что все mk значений X ,

по-

 

павших в интервал ak , ak 1 , мало отличают-

 

ся друг от друга и приблизительно равны xk .

 

Таким

образом, величина

X значение

xk

Рис. 202

принимает mk раз. Сказанное относится ко

всем частичным интервалам таблицы 2. Таблицу 3 получают из таблицы 2 заменой первой строки – частичных интервалов – на соответствующее значение xk , k 1, 2, ..., .

Таблица 3

 

x1

x2

 

xk

x

 

 

 

 

 

 

mk

m1

m2

 

mk

m

 

 

 

 

 

 

pk

p1

p2

 

pk

p

Пусть

f x

 

 

верхних оснований

есть функция, график которой состоит из

прямоугольников

гистограммы, то есть

f

 

x hk

 

p

 

при ak x ak 1

 

 

 

k

 

 

a

 

a

 

 

 

 

 

 

 

 

k 1

k

 

 

 

 

 

 

 

 

 

для любого k 1,

2,

..., . Кроме того, положим f x 0 при

x a1 и x a 1.

По только что построенной функции

 

f x найдём всюду на оси Ox

функцию

F x ,

для которой F* (x) f * (x).

Так как в интервале ak x ak 1

функция

f x

непрерывна, можно применить в этом интервале формулу

Ньютона – Лейбница. В результате получим

x

f t dt F x F ak , ak x ak 1, k 1, 2, ..., .

ak

380

5354.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]