Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

теория вероятностей

.pdf
Скачиваний:
196
Добавлен:
11.05.2015
Размер:
3.26 Mб
Скачать

51

Почему нормальный закон распределения является одним из важнейших в теории вероятностей и математической статистике? Объяснение этому дает центральная предельная теорема. Согласно ей сумма большого количества независимых случайных величин, каждая из которых оказывает незначительное влияние на всю сумму, распределена приблизительно по нормальному закону. А почти все явления случайного характера, встречающиеся на практике, представляют собой результат наложения множества отдельных влияний: тепловое движение электронов в проводнике, атмосферные помехи, волны в океане — слагаются под воздействием многих случайных возмущений. Поэтому независимо от вида плотности вероятностей отдельных составляющих (а часто они и неизвестны) можно ожидать, что плотность распределения наблюдаемого возмущения будет нормальной. Центральная предельная теорема дает математическое обоснование этому предположению, а эксперименты практически всегда подтверждают его правильность.

Теорема (центральная предельная теорема). Пусть X1, X 2 , ..., X n , ... независимые одинаково распределенные случайные величины с математическим ожиданием m и конечной дисперсией σ2. Тогда при неограниченном увели-

 

1

 

n

 

 

чении n закон распределения случайной величины

 

 

 

 

не-

 

 

Xi n m

 

nσ i=1

 

 

ограниченно приближается к стандартному нормальному закону.

Таким образом, рассматривая сумму независимых одинаково распределенных случайных величин, мы можем считать ее распределенной приблизи-

тельно по нормальному закону N (n m, n σ).

Следствия из центральной предельной теоремы (теоремы МуавраЛапласа) позволяют применять нормальный закон распределения к частоте (относительной частоте) события, наблюдавшегося в серии из n независимых опытов. Пусть Х — число успехов, наблюдавшихся в серии n испытаний Бернулли (частота успехов). Величину Х можно рассматривать как сумму

n

X = Xi независимых случайных величин Xi , принимающих значение 1,

i=1

если в i-ом испытании наблюдался успех, и 0 — в противном случае. Случайные величины Xi независимы и одинаково распределены (по закону Бернул-

ли) с математическим ожиданием р (вероятность успеха) и дисперсией p (1 p). Тогда случайную величину Х можно считать распределенной при-

близительно нормально с параметрами a = np и σ = np(1 p). Это позво-

ляет рассчитывать вероятности, связанные с частотой, по формулам (4.1)

и (4.2).

52

Эти формулы применимы и к относительной частоте p , которую при большом числе опытов можно считать распределенной приближенно по нор-

мальному закону: p

 

 

p (1 p)

 

~ N p,

 

.

 

 

 

n

 

 

 

 

 

Пример 2. Подлежат исследованию 400 проб руды. Вероятность промышленного содержания металла в каждой пробе для всех проб одинакова и равна 0.8. Найти вероятность того, что доля проб с промышленным содержанием металла отклонится от вероятности промышленного содержания металла в каждой пробе не более, чем на 0.05.

Решение. Математической моделью задачи является схема из n = 400 испытаний Бернулли с вероятностью успеха p = 0.8. Доля проб с промыш-

ленным содержанием металла — это относительная частота успехов p (количество успехов, деленное на количество испытаний). В задаче требуется определить вероятность отклонения частоты p от ее математического ожи-

дания M ( p ) = p на заданную величину ε = 0.05, т.е.

P( p p < 0.05) = ?

Считая случайную величину p

распределенной нормально с парамет-

рами a = p = 0.8

и σ =

p(1 p) =

0.8 0.2 = 0.02, применим формулу

(4.2):

 

 

 

 

 

n

 

 

400

 

 

 

 

 

 

0.05

 

 

P(

 

p

 

p

 

 

 

 

 

 

 

 

 

< 0.05)

= 2Φ

 

 

= 2Φ(2.5) = 2 0.494 = 0.988.

 

 

0.02

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вероятность того, что доля проб с промышленным содержанием металла отклонится от вероятности промышленного содержания металла в каждой пробе не более, чем на 0.05, составляет 0.988.

Проиллюстрируем решение задачи графически. Мы рассматривали нормально распределенную случайную величину p ~ N (0.8, 0.02) . Применяя формулу (4.2), мы преобразовали p к стандартной нормальной величине

z = p 0.8 ~ N (0,1), график плотности которой симметричен относительно

0.02

оси ординат, а точка z = 0 соответствует p = 0.8. Площадь заштрихованной области составляет 98.8 % от всей площади под кривой плотности распре-

 

53

 

 

деления, а интервал (–2.5; 2.5) для случайной величины z соответствует интер-

валу (0.8–0.05; 0.8+0.05) для случайной величины

p (рис. 4.2).

 

 

ϕ(z)

 

 

 

98.8 %

 

 

-2.5

0

2.5

zz

Рис. 4.2. Доля проб с заданным отклонением

 

4.3. Распределения математической статистики

4.3.1. Стандартное нормальное распределение

Рассмотрим случайную величину Х, распределенную по закону N (a, σ). Стандартное нормальное распределение U ~ N( 0,1) получим с

помощью преобразования

U =

X a

.

В статистике квантиль порядка р для

 

σ

 

 

 

 

 

этого распределения называется также правосторонней критической точкой uкр, соответствующей вероятности α =1 p (рис. 4.3, а). Доля площади,

лежащая правее точки uкр составляет 100 α % (в качестве αрассматрива-

ются обычно малые вероятности 0.05, 0.01 и т.п.). Как найти критическую точку, пользуясь таблицами функции Лапласа (приложение 1)? Значение

функции Лапласа Φ(x) равно площади под кривой плотности стандартного распределения на промежутке (0; x) (рис. 4.3, б). Поэтому значение критической точки uкр, соответствующее заданному α, находится из уравнения

Φ(uкр) = 12 −α (рис. 4.3, в).

Пример 1. Пользуясь таблицей значений функции Лапласа, найти критическую точку, соответствующую вероятности α = 0.05.

Критическая точка uкр является границей, правее которой лежит 5 % площади под кривой плотности стандартного нормального распределения.

2k ).
χ(2k)
K ~ χ(2k )

 

 

 

 

 

54

 

 

 

 

 

Значит площадь под этой кривой на интервале

(0; uкр)

составляет

45 % и в

таблице

значений

функции

Лапласа

(приложение

1)

ищем

значение

Φ(x) = 0.45. Это значение достигается при x =1.65, т.е.

критическая точка

uкр =1.65 (с точностью до 0.01).

 

 

 

 

 

 

 

 

 

 

 

Φ(x)

 

 

Φ(uкр)

 

 

 

 

 

 

 

1 − α

 

 

 

 

 

 

 

 

 

 

 

α =1 p

 

 

 

 

 

2

α

 

 

р

 

 

 

 

 

 

р

 

 

 

 

 

р

 

 

 

0

uкр

 

0

x

 

 

0

uкр

 

 

а

 

 

б

 

 

 

 

в

 

Рис. 4.3. Иллюстрация к работе с таблицами Лапласа: а) критическая точка,

 

соответствующая вероятности α; б) значение функции Лапласа;

 

в) связь между критической точкой и значением функции Лапласа

4.3.2. Распределение «хи-квадрат»

Пусть U1,U2 , ...,Uk — независимые стандартные нормальные величи-

ны. Распределение случайной величины K =U12 +U22 +... +Uk2 называется распределением «хи-квадрат» с k степенями свободы (пишут ). Это

унимодальное распределение с положительной асимметрией и следующими характеристиками: мода M = k 2, математическое ожидание m = k, дис-

персия D = 2k (рис. 4.4). При достаточно большом значении параметра k распределение имеет приближенно нормальное распределение с пара-

метрами N (k,

При решении задач математической статистики используются критические точки χ(2k) , зависящие от заданной вероятности α и числа сте-

пеней свободы k (приложение 2). Критическая точка

χкр2 = χ2 (k; α) являет-

ся границей области, правее которой лежит 100 α

% площади под кривой

плотности распределения. Вероятность того, что значение случайной величи-

ны K ~ χ(2k ) при испытаниях попадет правее точки χкр2

, не превышает α:

P(K ≥ χкр2 ) ≤ α. Например, для случайной величины

K ~ χ(220) зададим

вероятность α = 0.05. По таблице критических точек распределения «хи-

 

 

 

55

 

 

 

квадрат»

(приложение 2) находим χкр2 = χ2 (20,0.05) = 31.4. Значит вероят-

ность этой случайной величине K принять значение, большее 31.4, меньше

0.05 (рис. 4.4).

 

 

 

f

χ

2 (z)

 

 

 

 

 

 

k = 4

 

 

 

 

 

 

 

 

 

 

 

 

k =10

 

 

 

 

 

 

 

k = 20

 

α = 0.05

 

 

 

 

 

 

 

 

0

 

χкр2

= 31.4

z

 

 

Рис. 4.4. График плотности распределения

χ(2k) при различных значениях

 

 

 

числа степеней свободы k

 

 

4.3.3. Распределение Стьюдента

Пусть U и K — независимые случайные величины, причем U имеет стандартное нормальное распределение N (0,1), а K — распределение χ(2k) с k

степенями свободы. Распределение величины T = U называется распреде-

K

k

лением Стьюдента с k степенями свободы. График плотности этого распределения симметричен относительно оси ординат и напоминает график плотности стандартного нормального распределения (рис. 4.5), но отличается более «массивными хвостами» (т.е. значения плотности распределения Стьюдента мед-

леннее убывают при удалении от начала координат).

 

Математическое

ожидание

распределения

Стьюдента

M (T ) = 0, дисперсия D(T ) =1+

2

(k > 2), и для значений

k > 30 рас-

k 2

 

 

 

 

 

пределение Стьюдента практически не отличается от стандартного нормального.

56

f (x)

0

х

Рис. 4.5. Графики плотности нормального распределения (пунктир) и распределения Стьюдента (сплошная линия)

Критические точки распределения Стьюдента (приложение 3) могут быть односторонними (рис.4.6, а) и двусторонними (рис. 4.6, б).

 

fT (x)

 

 

 

α

0

tкр

x

 

а

 

α

 

 

fT (x)

α

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

tкр

0

 

tкр

 

 

 

 

 

б

 

 

Рис. 4.6. Односторонняя (а) и двусторонняя (б) критическая точка tкр распределения Стьюдента

Например, для случайной величины Х, распределенной по закону Стьюдента с k = 9 степенями свободы при α = 0.05 находим по таблице (приложение 3) одностороннюю критическую точку tкр = t(k, α) = t(9;0.05) =1.83.

Это означает, что при испытаниях вероятность наблюдать значение этой случайной величины, большее tкр =1.83, меньшее α = 0.05 :

P(X > tкр) < α,

т.е. площадь под кривой плотности распределения, лежащая правее критической точки, составляет 100 α % от всей площади (рис. 4.6, а).

Двусторонняя критическая точка обозначается tкр = t(k, α) и для нее

P( X > tкр) = α,

 

 

 

 

 

57

 

 

 

 

 

 

 

т.е. величина α равна вероятности наблюдать значение случайной величины

Х вне интервала (tкр;tкр) (рис. 4.6, б).

 

 

 

 

 

 

 

4.3.4. Распределение Фишера

 

 

 

 

 

 

 

 

Пусть K1 и

K 2 независимые случайные величины, распределенные по

закону

χ2 с числом степеней свободы

k и

k

2

соответственно. Распределе-

ние случайной величины

 

 

1

 

 

 

 

 

 

K1

k1

 

 

 

 

 

 

 

 

 

 

F =

 

 

 

 

 

 

 

 

 

 

 

K2

k2

 

 

 

 

 

 

называется распределением Фишера с

k1 и k2

степенями свободы. Распреде-

ление

не является симметричным, его математическое ожидание близко к

единице M (F) =

k2

2

, k2 > 2 (рис. 4.7).

 

 

 

 

 

 

 

 

k2

 

 

 

 

 

 

 

 

 

 

f F (x)

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

x

 

 

 

Рис. 4.7. Плотность распределения Фишера для типичных

 

 

 

 

 

значений параметров

k1 и k2

 

 

 

Критические точки распределения Фишера (приложение 4) имеют

следующий смысл. Если Х — случайная величина, распределенная по закону

Фишера с параметрами

 

k1 и k2 ( X ~ F(k1, k2 )) , и задана вероятность

α,

то при проведении наблюдений вероятность получить значение случайной

величины Х, лежащее правее критической точки

Fкр = F(k1, k2 ; α)

меньше

α: P( X > Fкр) < α.

 

 

 

 

 

 

 

 

 

 

Например,

пусть

 

X ~ F(8,10)

и

α = 0.01.

Критическая

точка

Fкр = F(8,10; 0.01) = 5.06, т.е. вероятность получить значение Х, большее

5.06, меньше 0.01. В среднем в 99 случаях из 100 будем наблюдать значения, меньшие 5.06.

58

5.СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

5.1.Точечная оценка и ее свойства

Распределение случайной величины (распределение генеральной совокупности) характеризуется обычно рядом числовых характеристик: для нор-

мального распределения N (a, σ) — это математическое ожидание a и сред-

нее квадратическое отклонение

σ;

для равномерного распределения

R(a, b) — это границы интервала

[a;b],

в котором наблюдаются значения

этой случайной величины. Такие числовые характеристики, как правило, неизвестные, называются параметрами генеральной совокупности. Оценка параметра — соответствующая числовая характеристика, рассчитанная по выборке. Когда оценка определяется одним числом, она называется точечной оценкой.

Пусть закон распределения генеральной совокупности Х известен с точностью до параметра θ. Построим точечную оценку параметра θ по выборке

x1, x2 , ..., xn как значение некоторой функции θ = θ (x1, x2 , ..., xn ). Напри-

мер, среднее арифметическое выборочных значений служит оценкой математического ожидания. Так как выборочные значения случайны, то эту функцию

можно рассматривать как случайную величину θ = θ ( X1, X 2 , ..., X n ), где X1, X 2 , ..., X n — независимые статистические копии случайной величины Х.

Какими свойствами должна обладать случайная величина θ, чтобы полученная оценка была «хорошей»?

Желательным требованием к оценке является отсутствие систематической ошибки, т.е. при многократном использовании вместо параметра θ его

 

 

оценки θ среднее значение ошибки приближения

θ ≈ θ равно нулю — это

свойство несмещенности оценки.

 

Определение. Оценка θ называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра:

M (θ) = θ.

 

 

 

1

n

Выборочное среднее арифметическое X =

 

Xi является несме-

 

 

 

n i=1

щенной оценкой математического ожидания, а

выборочная дисперсия

 

 

 

 

 

 

59

 

 

 

1

n

 

 

 

 

D =

( Xi

 

)2 — смещенная оценка генеральной дисперсии D. Не-

X

 

 

n i=1

 

 

 

 

смещенной оценкой генеральной дисперсии является оценка

 

 

 

 

 

1

n

 

 

 

 

S 2 =

( Xi

 

)2.

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

n 1 i=1

Второе требование к оценке — ее состоятельность — означает улучшение оценки с увеличением объема выборки.

Определение. Оценка θ ( X1, X 2 , ..., X n ) называется состоятельной, если она сходится по вероятности к оцениваемому параметру θ при n → ∞:

P

θ →θ.

n→∞

Сходимость по вероятности означает, что при большом объеме выборки вероятность больших отклонений оценки от истинного значения мала.

Третье требование позволяет выбрать лучшую оценку из нескольких оценок одного и того же параметра.

Определение. Несмещенная оценка является эффективной, если она имеет наименьшую среди всех несмещенных оценок дисперсию.

Это означает, что эффективная оценка обладает минимальным рассеиванием относительно истинного значения параметра. Заметим, что эффективная оценка существует не всегда, но из двух оценок обычно можно выбрать более эффективную, т.е. с меньшей дисперсией. Например, для неизвестного пара-

метра a нормальной генеральной совокупности N (a, σ) в качестве несме-

щенной оценки можно взять и выборочное среднее арифметическое, и выборочную медиану. Но дисперсия выборочной медианы примерно в 1.6 раза больше, чем дисперсия среднего арифметического. Поэтому более эффективной оценкой является выборочное среднее арифметическое.

5.2. Интервальное оценивание параметров распределения

5.2.1. Доверительный интервал и доверительная вероятность

Рассчитанная по выборке точечная оценка θ параметра θ является приближенным значением θ . Насколько велико отклонение этого приближения от истинного значения? Можно ли доверять этой оценке? Мерой нашего доверия оценке будем считать вероятность γ того, что погрешность оценки

| θ−θ| не превысит заданной точности ε:

 

 

 

 

 

 

 

 

= γ.

(5.1)

P

| θ−θ|< ε

 

 

 

 

 

60

 

 

 

Это равенство иначе можно записать так: P(θ−ε < θ < θ+ε) = γ, т.е.

 

 

γ «накрывает»

интервал вида (θ−ε; θ+ε) с заранее заданной вероятностью

истинное значение параметра θ. При этом заранее выбранная вероятность γ

называется доверительной вероятностью (или надежностью), а сам интер-

вал (θ−ε; θ+ε) доверительным интервалом (или интервальной оцен-

кой) для параметра θ.

На практике выбирают доверительную вероятность γ из достаточно

близких к единице значений γ = 0.9, γ = 0.95, γ = 0.99

и т.д. Затем по выбо-

 

 

рочным данным находят точечную оценку θ и точность оценки ε. После

 

 

этого определяют границы доверительного интервала (θ−ε; θ+ε) .

Поступая таким образом, мы будем ошибаться при многократном проведении испытаний примерно в (1 − γ) 100 % случаев. Например, если γ = 0.997, то ошибочное решение будет приниматься примерно 3 раза на

1000 опытов.

Отметим, что чем уже доверительный интервал для оценки неизвестного параметра, тем лучше. Длина доверительного интервала существенно зависит от объема выборки n (уменьшается с ростом n) и от величины доверительной вероятности γ (увеличивается с приближением γ к единице).

5.2.2. Интервальное оценивание центра генеральной совокупности

Рассмотрим вначале случай, когда выборка объема n извлечена из нормальной генеральной совокупности X ~ N (a, σ) с неизвестным параметром a и известным σ. Параметр a является математическим ожиданием (генеральным средним) случайной величины Х. В качестве точечной оценки пара-

метра a возьмем выборочное среднее:

 

a = x. Для уточнения приближенного

равенства

a x построим доверительный интервал, накрывающий параметр

a с заданной доверительной вероятностью γ.

Если выборка объема n извлекается из нормальной генеральной сово-

 

 

 

 

1

n

купности

N (a, σ), то статистика

 

=

Xi имеет нормальное распреде-

X

 

 

 

 

 

n i=1