Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТВиМС.Малярец.Егоршин 22.12.12

.pdf
Скачиваний:
10
Добавлен:
11.06.2015
Размер:
6.76 Mб
Скачать

Требуется найти вероятность события А:

p(A) = p(H1)p(A|H1) + p(H2)p(A|H2) + p(H3)p(A|H3).

9. Сформулируйте теорему Байеса.

Теорема (формула) Байеса оценивает относительные вклады каждого члена в формуле полной вероятности:

pH

p A |H

 

 

 

pH

2

p A |H

2

 

 

 

pH

3

p A |H

3

 

 

 

1

 

1

pH

 

| A ,

 

 

 

pH

 

| A ,

 

 

 

pH

 

| A .

p

A

1

 

 

p

A

 

2

 

 

p

A

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10. Поясните, что такое дискретная случайная величина, как задается закон ее распределения.

Понятие «случайная величина» является исходным неопределяемым понятием, которое (как и понятие «случайное событие») демонстрируется только на примерах. Если все возможные значения случайной величины можно заранее перечислить, то такую случайную величину называют дискретной. У непрерывной случайной величины значения заполняют сплошь некоторый интервал. Соответствие между отдельными значениями случайной величины и вероятностью их появления называют законом распределения данной случайной величины. Закон распределения дискретной случайной величины может быть задан в табличной форме в виде ряда распределения, где каждому возможному значению случайной величины поставлена в соответствие вероятность его появления. Сумма этих вероятностей равна единице, так как все возможные значения случайной величины составляют полную группу несовместных событий.

11. Что такое математическое ожидание, как оно вычисляется?

Математическое ожидание – это среднее значение случайной величины; центр, вокруг которого группируются отдельные значения случайной величины; среднее взвешенное, где «весами» являются вероятности появления отдельных значений случайной величины; центр тяжести полигона распределения (для дискретной величины) или центр тяжести фигуры, ограниченной графиком плотности вероятности (для непрерывной величины).

Для дискретной случайной величины математическое ожидание вычисляется как сумма произведений значений случайной величины на их вероятности:

261

k

 

k

a M x

xi pi , где

pi 1.

i 1

i

1

Для непрерывной случайной величины дискретная сумма заменяется на интеграл:

a M x

xf x dx , где

f x dx 1.

Здесь f(x) – дифференциальная функция распределения (плотность вероятности).

12. Что такое дисперсия, как она вычисляется?

Дисперсия – мера разброса, мера изменчивости, мера рассеяния значений случайной величины вокруг центра – математического ожидания. Вычисляется по формуле:

D(x) = М(x - a)2 = М(х2) – М2(х).

Дисперсия постоянной равна нулю.

13. Что такое среднее квадратическое отклонение?

Корень квадратный из дисперсии называется средним квадратическим отклонением, или стандартным отклонением (но не стандартной ошибкой!).

Обозначение:

 

 

 

x

D x .

 

 

Размерность дисперсии равна квадрату размерности случайной величины. Это не удобно. Хотелось бы в качестве меры изменчивости ввести средний размер отклонений, но характеристика М(x – a) 0 оказалась равной нулю из-за разных знаков отклонений (так называемое нулевое, или центральное, свойство математического ожидания). Именно поэтому дисперсия введена как среднее квадратов отклонений. Стандартное отклонение х действительно есть среднее отклонение, но не среднее арифметическое, а среднее квадратичное, что и отражено в его названии. На практике несколько длинное название среднее квадратическое отклонение постепенно заменили на более энергичное стандартное отклонение и, к сожалению, на стандартную ошибку, а это уже не правильно. В зарубежной литературе четко разделяют два понятия: Standard Deviation

262

(это х) и Standard Error (

 

x

 

– совсем другая характеристика). В отечественной

 

 

 

n

научной литературе характеристика x

 

x

 

называется ошибкой среднего.

 

 

 

n

 

 

 

 

 

 

 

 

14. Перечислите свойства математического ожидания.

Свойства математического ожидания совпадают со свойствами обычного среднего:

1.

Математическое ожидания постоян-

1.

Среднее постоянной равно этой

ной равно этой постоянной

постоянной

 

 

 

 

 

2.

Постоянный множитель можно вынес-

2.

Постоянный множитель можно

ти за знак математического ожидания

вынести за знак среднего

 

 

 

 

3.

Математическое ожидание суммы

3.

Среднее значение суммы величин

случайных величин равно сумме их ма-

равно сумме их средних

тематических ожиданий

 

 

 

 

 

 

 

4.

Математическое ожидание случайных

4.

Сумма отклонений от среднего

отклонений равно нулю: М(x – a) 0

равна нулю:

xi x 0

 

 

 

 

 

15. Перечислите свойства дисперсии.

1.Дисперсия постоянной равна нулю.

2.При вынесении постоянного множителя за знак дисперсии множитель возводится в квадрат.

3.Дисперсия суммы независимых случайных величин равна сумме их дисперсий.

4.Дисперсия суммы двух случайных величин равна сумме их дисперсий

плюс удвоенная ковариация: D(x + y) = D(x) + D(y) + 2 xy . Ковариация – сме-

шанный центральный момент xy = М(х – a)(y – b), где a = M(x), b = M(y). Для независимых случайных величин ковариация равна нулю.

16. Перечислите характеристики случайных величин. Что такое коэффициент ассиметрии и коэффициент эксцесса?

Для описания положения, рассеяния и формы распределения используют так называемые моменты распределения: m1 = M(x), m2 = M(x2), m3 = M(x3), m4 = M(x4). Заметим, что момент 1-го порядка есть основная характеристика положения – математическое ожидание m1 = M(x) = а. Кроме этого, введены центральные моменты распределения: 1 = M(x – а), 2 = M(x – а)2, 3 = M(x – а)3,

4 = M(x – а)4. Первый центральный момент всегда равен нулю (центральное

263

свойство математического ожидания); второй центральный момент есть основная характеристика разброса – дисперсия 2 = M(x – а)2 = ( х)2 . Моменты 2-го и 4-го порядков имеют размерности куба и четвертой степени от размера исходной величины, поэтому применяют еще безразмерные нормированные или

стандартизированные моменты распределения:

3

3

A ,

4

4

. Норми-

3

4

 

 

 

 

 

 

 

 

 

 

x

 

 

x

 

рованный момент 3-го порядка называется коэффициентом асимметрии; если А = 0 – распределение симметричное, при А > 0 – скошено влево, при А < 0 – скошено вправо. Нормированный момент 4-го порядка называется коэффициентом плосковершинности, или игольчатости, или же коэффициентом эксцесса. В отечественной литературе принято вычитать тройку из 4-го нормированного момента Е = 4 – 3, тогда Е = 0 соответствует стандартная «нормальная» форма распределения, Е < 0 – плосковершинная, Е > 0 – игольчатая форма распределения. Наличие игольчатости трактуется как результат смеси двух случайных величин с одинаковыми центрами, но с разными дисперсиями (например, смесь продукции мастера и ученика).

17. Сформулируйте правило «3-х сигм».

Случайные отклонения, большие 3-х х, маловероятны. На практике такие отклонения обычно считаются выбросами и появление их объясняют наличием грубых ошибок в записи чисел. Правило «3-х сигм» основано на неравенстве Чебышева:

 

 

 

1

,

P

x - a

t x

1

t 2

 

 

 

 

 

откуда при t = 3 следует, что Р(|x – a|

3 x) > 1 – 1/9 > 0,89. Иными словами, с

уровнем доверия, не меньшим 90 %, можно утверждать, что случайные отклонения |x – a| не превышают 3 x .

18. Сформулируйте задачу о повторении одородных независимых испытаний, приведите ее другие названия.

Производится n испытаний, в каждом из которых событие А может появиться с вероятностью р, которая не зависит ни от номера испытания, ни от того, сколько раз появилось событие А до этого испытания. Тогда вероятность появления m успехов Pn(m) определяется по формуле Бернулли:

264

P m C m pm 1 p n m

n!

 

pmqn m .

 

 

 

 

n

n

m! n

m !

 

 

Другие названия этой проблемы – задача Бернулли, распределение Бернулли, биномиальный закон распределения. При увеличении числа испытаний распределение Бернулли приближается к некой стандартной форме – распределению Лапласа или к нормальному закону Гаусса. Характеристики распределения Бернулли: M(m) = np, D(m) = npq.

19. Приведите асимптотическую формулу Пуассона и укажите область применения этого распределения. Что такое рекуррентная формула?

Для n > 30 производить расчеты по формуле Бернулли становится затруднительным из-за слишком больших величин факториалов, поэтому используют асимптотические формулы Пуассона и Лапласа, которые становятся все более и более точными с увеличением n (именно в тех случаях, когда расчеты по исходной формуле Бернулли практически невозможны).

Формула Пуассона применяется для больших n > 30 и малых р < 0,05, таких, что < 5 (поэтому распределение Пуассона применяется для изучения распределения числа редких событий). Если обозначить a = np, то формула Пуассона приобретает вид:

P m e a am . m!

Характеристики распределения Пуассона: M(m) = а, D(m) = а. Вычисления вероятностей P(m) распределения Пуассона удобно произво-

дить по рекуррентной (возвратной) формуле:

P m P m 1ma , где Р(0) = е–а .

При увеличении параметра а распределение Пуассона приближается к некой стандартной форме – распределению Лапласа (или к нормальному распределению Гаусса).

20. Сформулируйте локальную и интегральную теоремы Лапласа, сравните распределение Лапласа с нормальным законом Гаусса.

Для n > 30, 5, nq 5 распределение Бернулли практически точно аппроксимируется асимптотической формулой Лапласа:

265

 

 

 

 

 

 

 

 

 

 

 

m

a 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

2

m

 

 

 

tm

 

 

 

 

 

 

 

Pn m

 

 

 

 

 

e

 

2

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

m

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m a

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

t 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e 2 .

где t

 

, a M m np,

 

 

 

npq ,

 

t

 

 

 

m

m

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эта аппроксимация называется локальной теоремой Лапласа. Вероятность попадания случайной величины m в интервал [m1 , m2] мож-

но записать как разность значений интегральной функции Лапласа на краях этого интервала:

P m1 m m2

tm

2

tm ,

 

 

1

 

 

t

1

 

t

 

s 2

 

 

 

 

e 2 ds .

где

t

s ds

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

0

 

0

 

 

 

Это утверждение называется интегральной теоремой Лапласа.

Для нормального закона распределения Гаусса имеем похожие выражения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

a 2

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

2

x

 

tx

 

 

 

 

f

x

 

 

 

 

 

 

 

 

e

 

2

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

x

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x a

 

 

 

 

1

 

 

 

 

t 2

 

 

 

 

 

 

где t

 

, a M x ,

t

 

 

 

e

2 ;

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P x1 m x2

tx

2

tx

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

t

 

 

1

 

 

t

 

s 2

 

 

 

 

 

 

 

 

 

 

e 2 ds .

 

 

 

 

где t

s ds

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

0

 

 

 

0

 

 

 

 

 

 

 

Сходство очень большое, но есть и различия. Распределение Лапласа

дискретное и Pn m

 

 

 

 

 

 

tm

 

– вероятность; нормальное распределение непре-

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рывное и

f x

 

tx

 

 

 

– плотность вероятности. В распределении Лапласа ха-

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рактеристики а и

 

 

m

связаны между собой, причем 0 < m < а; в нормальном

распределении а может быть каким угодно, хоть нулем, хоть отрицательным.

266

21. Перечислите особенности дифференциальной и интегральной функций Лапласа. Является ли интегральная функция Лапласа интегральной функцией распределени Лапласа?

Дифференциальная функция Лапласа (t) четная (–t) = (t), поэтому таблицы этой функции составлены только для неотрицательных значений аргумента t 0.

Функция (t) строго положительная и имеет горизонтальную асимптоту – ось абсцисс, поэтому таблицы составлены только для 0 t 4, для больших значений аргумента функция практически равна нулю. Единственный экстремум –

максимум max = (0) при t =0.

Площадь под дифференциальной кривой равна единице, площадь фигуры на интервале [–3; 3] равна 0,997; на интервале [–2; 2] – 0,954.

Интегральная функция Лапласа Ф(t) нечетная Ф(–t) = –Ф(t), поэтому таблицы этой функции составлены только для неотрицательных значений аргумента t 0.

Функция Ф(t) строго возрастает и имеет горизонтальную асимптоту –

Фmax = 0,5, поэтому таблицы составлены только для 0

t

4, для больших зна-

чений аргумента функция практически равна 0,5.

 

 

По определению интегральная функция распределения есть вероятность

того, что случайная величина примет значение

не

меньше заданного:

F(m) = P(X m).

 

 

Согласно интегральной теореме Лапласа имеем

F(m) = Ф(tm) + 0,5; то

есть интегральная функция распределения Лапласа F(m) отличается от интегральной функции Лапласа Ф(tm) постоянным слагаемым 0,5.

22. Сформулируйте три формы интегральной теоремы Лапласа.

В качестве первой формы теоремы примем общую формулу для вычисления вероятности попадания случайной величины в заданные интервалы:

P m1 m m2

tm

2

tm .

 

 

1

Вторая форма предназначена для вычисления вероятности попадания случайной величины в интервалы, симметричные относительно центра:

Р(|m – a| t m) = 2Ф(t); Р(|m – np| t npq ) = 2Ф(t).

267

Третью форму интегральной теоремы получим, разделив на n обе части неравенства |m - np| t npq :

P

 

 

m

p

 

t

 

 

pq

 

2

 

 

t ;

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

m

p

 

 

2

 

 

 

 

n

.

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

pq

23. Перечислите

задачи,

 

которые

решаются с помощью

третьей формы интегральной теоремы Лапласа.

1. Заданы параметры распределения n, p и погрешность утверждения:

m

p

.

 

n

 

 

Найти уровень доверия Р этого утверждения.

2. Заданы параметры распределения n, p и уровень доверия Р утверждения:

m

p

.

 

n

 

 

Найти погрешность .

3. Заданы параметр р, уровень доверия P и погрешность утверждения:

m

p

.

 

n

 

 

При каких значениях n это утверждение выполняется с заданным уровнем доверия?

24. Как по результатам статистических испытаний делаются заключения о величине параметров распределения?

Это еще одна задача на применение третьей формы интегральной теоремы Лапласа. Заданы m, n, P. Какие значения параметра р согласуются с утверждением:

P

m

p

t

 

pq

 

2 t P ?

n

n

 

 

 

 

 

 

Из соотношения 2Ф(t) = Р находят t и получают квадратичное неравенство:

268

 

m

p

 

2

t

2

p 1 p

,

 

 

 

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

откуда определяются границы p1 p

p2

допустимых значений параметра р.

25. Что такое функция распределения, каковы ее свойства и график, каковы ее особенности для дискретной случайной величины?

Функция распределения (или интегральная функция распределения) –

вероятность того, что случайная величина X примет значение, не меньшее заданного х:

 

 

 

F(x) = P(X x).

 

 

Для дискретной случайной величины эта функция называется кумулятой

и

представляет

собой

функцию

накопленных

вероятностей F(xj) =

= p1 + p2 + … + pj .

Между

соседними

значениями

дискретной величины

xi

x < xi+1 кумулята сохраняет постоянное значение F(xi). График кумуляты

ступенчатый.

 

 

 

 

 

Функция распределения непрерывной случайной величины непрерывная.

 

Функция распределения неубывающая, большим значениям случайной

величины соответствуют не меньшие значения функции распределения: (x1 < x2) (F(x1) F(x2)).

Функция распределения изменяется от 0 до 1: F(– ) = 0, F( ) = 1. Интегральная теорема. Вероятность попадания случайной величины в

полуоткрытый интервал x1 < x x2 равна разности значений интегральной функ-

ции распределения на краях этого интервала: P(x1 < x

x2) = F(x2) – F(x1).

Для непрерывной случайной величины

можно также записать

P(x1 x x2) = F(x2) – F(x1).

 

26. Что такое функция плотности вероятности, каковы ее свойства и график?

Плотность вероятности – это отношение вероятности попадания случайной величины в малый интервал к длине этого интервала:

f x lim

 

P x X

x x

F x .

 

 

x

x

0

 

 

Функция плотности вероятности f(x) оказалась равной производной от функции распределения F(x), поэтому функцию f(x) называют также дифферен-

269

циальной функцией распределения. Наоборот, функция распределения F(x) выражается как интеграл от функции плотности вероятности

 

x

F x

f s ds ,

поэтому функцию F(x) называют также интегральной функцией распределения.

Функция плотности вероятности неотрицательная f(x) 0.

Площадь под дифференциальной кривой равна единице. Площадь под частью дифференциальной кривой на интервале (х1 , х2) равна вероятности попадания случайной величины в этот интервал P(x1 x x2).

27. Как вычисляются основные характеристики непрерывной случайной величины?

Поскольку почти все основные характеристики случайной величины выражаются через оператор математического ожидания, достаточно вывести формулу для расчета математического ожидания непрерывной случайной величины:

M x

x p x

lim

x P x x x

x

lim

x f x x

x f x dx

 

x

x

0

 

x

0

 

 

 

 

 

 

 

 

Остальные моменты распределения рассчитываются аналогично, например:

M x2 x2 f x dx .

28. Что такое квантили? Перечислите их разновидности.

Для непрерывной случайной величины в качестве дополнительных характеристик используются так называемые квантили, к которым относятся медиана, квартили, децили и процентили. Квантили делят фигуру под дифференциальной кривой на равновеликие части, или же они делят интервал изменения (варьирования) случайной величины на равновероятные части.

Медиана делит интервал варьирования на две части с вероятностью 50 % попадания случайной величины в каждую часть.

Квартили делят интервал варьирования на четыре части с вероятностью 25 % попадания случайной величины в каждую часть.

Децили делят интервал варьирования на десять частей с вероятностью 10 % попадания случайной величины в каждую часть.

270