Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Конспект часть 1 (1)

.pdf
Скачиваний:
14
Добавлен:
07.03.2015
Размер:
397.42 Кб
Скачать

f(x)

 

 

 

 

x0= 30,6

 

 

 

 

0,4

 

 

n= 0,8

 

 

 

x0= 3

 

 

 

 

 

0,2

 

 

 

 

0

 

 

 

x

 

 

 

 

0

5

10

15

20

f(x)

 

 

 

 

0,4

 

 

n= 1

 

0,3

 

 

 

 

 

x0= 3

 

0,2

 

 

 

 

0,1

 

 

 

x

0

 

 

 

 

 

 

 

0

5

10

15

20

f(x)

 

 

 

 

0,3

 

 

 

 

0,2

 

 

n= 1,6

 

 

 

 

x0= 3

 

0,1

 

 

 

x

0

 

 

 

 

 

 

 

0

5

10

15

20

f(x)

 

 

 

 

0,08

 

 

 

 

0,06

 

 

n= 1,6

 

0,04

 

 

x0= 10

 

 

 

 

 

0,02

 

 

 

x

0

 

 

 

 

 

 

 

0

5

10

15

20

Рис.6. График плотности распределения

Вейбулла.

 

 

 

 

33

Лекция 7. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ДИСКРЕТНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН.

Для дискретных величин существует только функция распределения, так как

производная от функции распределения не определена. Наиболее общим случа- ем дискретного распределения является биноминальное распределение.

Пусть производится n независимых опытов, в каждом из которых событие А может появиться, либо нет. Вероятность появления события А во всех опытах по-

стоянна и равна p. В качестве дискретной случайной величины X будем рассмат- ривать количество появления события А в этих опытах. Вероятность появления события ровно m раз равна

 

p (m) = Cmpm (1p)nm .

(4.13)

 

n

 

n

 

Здесь Cnm число сочетаний m элементов из n,

 

Cnm =

n!

.

 

m!(n

m)!

 

 

 

 

Случайная величина с таким распределением называется биноминальной

случайной величиной, а ее распределение - биноминальным. Параметрами рас- пределения являются вероятность появления событий в одном опыте р и количе- ство опытов n.

Математическое ожидание этого распределения

M(m) = n p ,

(4.14)

дисперсия

 

D(m) = n p (1p) .

(4.15)

Такое распределение имеет, например, число отказавших однотипных невос-

станавливаемых изделий в течение фиксированного интервала работы.

При n → ∞ биноминальный закон сходится к нормальному с параметрами m = np, σ = n p (1p) .

При малых вероятностях p < 0,1 и большом количестве опытов, n > 10 бино- минальное распределение сводится к распределению Пуассона, которое также называется законом редких событий.

Вероятность того, что случайная положительная целая величина X примет значение m, равна

p(m) =

λm

e− λ .

(4.16)

 

m!

 

 

34

Параметром распределения является величина λ>0. Математическое ожида-

ние и дисперсия равны:

mx = λ, Dx = λ .

(4.17)

При больших значениях n > 50 распределение Пуассона приближается к нор- мальному распределению.

Закон Пуассона представляет устойчивое распределение, т. е. сумма случай-

ных величин, каждая из которых имеет распределение Пуассона, также распреде- лена по этому закону.

В статистике используются и другие распределения дискретных случайных величин. При необходимости сведения о них можно найти в справочной литерату- ре.

35

Лекция 8. СТАТИСТИЧЕСКИЕ ВЫВОДЫ

Никакая математическая теория не изучает непосредственно вещи, с которы-

ми сталкиваемся на опыте. Математическая теория всецело принадлежит к обла- сти понятий и оперирует с чисто абстрактными объектами. Однако теория служит

моделью некоторой группы явлений реального мира. Абстрактные объекты тео- рии имеют своих двойников в реальном мире. Для того, чтобы такая модель была практически полезной, должна существовать некоторая согласованность между

выводами теории и наблюдаемыми в опытах явлениями.

Во многих случаях задача проверки согласованности теории с опытом, т.е.

адекватности модели, описывающей исследуемые явления, производится следу- ющим образом: по математической модели рассчитываются некоторые характе- ристики процесса, затем проводятся опыты на реальном объекте и эксперимен- тально определяются те же характеристики. После этого эти данные сопоставля-

ются и по их согласованности судят, правильно ли отражают данная теория и ма- тематическая модель течение реального процесса.

Очевидно, что полного совпадения результатов может не быть. Во-первых,

математические модели отображают только основные черты явления, не рас- сматривая второстепенных. Во-вторых, результаты экспериментальной проверки также отягощены случайными ошибками, вызванными погрешностью приборов, нестационарностью режима, при котором проводились измерения и т.д. Во всяком статистическом распределении неизбежно присутствие элементов случайности. Число наблюдений ограничено, случайным является то, что произведены именно

такие опыты и получены именно такие результаты. Только при очень большом

числе наблюдений эти элементы случайности сглаживаются и случайное в полной мере проявляет свою закономерность. По этим причинам вопрос об оценке адек- ватности сводится к вопросу, расхождение экспериментальных и теоретических результатов является значимым, т.е. существует действительное различие между ними, или несовпадение данных можно объяснить только влиянием второстепен- ных случайных факторов.

Фактически перед проверкой адекватности выдвигается некоторая гипотеза о соответствии опытных данных некоторому теоретическому закону. В дальнейшем

эта гипотеза должна быть или принята, или отвергнута.

Для проверки статистических гипотез используются критерии значимости. Идея применения критериев заключается в следующем. На основании данного

36

статистического материала необходимо проверить гипотезу о том, что случайная

величина Х подчиняется определенному закону распределения. Эта гипотеза

называется нулевой и обозначается как H0. Гипотеза о том, что случайная вели- чина распределена не по рассматриваемому закону, называется альтернативной и обозначается как H1. В результате анализа наблюдаемых реализаций случайной

величины X мы должны принять гипотезу H0 и отвергнуть H1 или принять H1 и от- вергнуть H0.

Для того, чтобы принять или отвергнуть данную гипотезу, рассмотрим некото-

рую величину U, характеризующую степень расхождения теоретического и стати- стического распределений. Величина U может быть выбрана различными спосо-

бами. Например, в качестве U можно взять сумму абсолютных значений расхож- дений теоретического и статистического распределений, сумму квадратов откло- нений, сумму квадратов отклонений с некоторыми весовыми коэффициентами, сумму отклонений четвертой степени или наибольшее значение отклонений. До- пустим, что величина U выбрана тем или иным способом. Очевидно, что это есть некоторая случайная величина. Закон распределения этой случайной величины зависит от закона распределения величины Х и от числа опытов n.

В общем случае диапазон возможных значений величины U в зависимости от выбора метода определения U составляет [-, +] или [0, +]. Предположим, что в качестве меры расхождения U была взята сумма квадратов отклонений теоре- тического и полученного экспериментальным путем значений случайной величи- ны. Теоретический диапазон изменения величины U будет равен [0, +]. Выберем некоторую положительную величину u*, которая разобьет этот диапазон на две области. Будем считать, что если наблюдаемая величина u0.попадает в область u0>u*, то наблюдения не согласуются с рассматриваемой гипотезой; если же во

f(U)

 

u*

 

U

Область принятия гипотезы

Критическая область

Рис.5.1.. Области одностороннего критерия значимости

37

вторую u0 u* то гипотеза подтверждается результатами наблюдений. Первая область называется критической областью критерия U, вторая областью приня- тия гипотезы. Эти области показаны на рис.5.1.

Если известно распределение вероятности наблюдений, соответствующее проверяемой гипотезе H0, то величину u* можно выбрать таким образом, чтобы

при выполнении гипотезы H0 вероятность отвергнуть гипотезу H0 была равна за-

ранее заданной величине α,

P(U > u* )= α .

(5.1)

Величина α по определению равна

 

 

α = òf (u)du .

(5.2)

u *

Если же в качестве меры расхождения было принята величина наибольшего расхождения между теоретическим и экспериментальным значениями случайной величины, то диапазон возможных значений U будет равен [-, +]. В этом случае следует считать не согласующимися с гипотезой те наблюдения, для которых u > u* и u < -u*. Здесь появляются две критические области, в которых нулевая ги-

потеза отвергается. Данная ситуация показана на рис.5.2.

f(U)

-u*

u*

 

U

Критическая область

Область принятия гипотезы Критическая область

Рис.5.2. Области двухстороннего критерия значимости

Для этого случая

u *

 

α = ò

f (u)du + ò

f (u)du = 2 òf (u)du .

(5.3)

−∞

u *

u *

 

Вероятность α, которую можно фиксировать произвольным образом, называ-

ется уровнем значимости критерия или размером критерия. Она определяет ве- роятность отвергнуть нулевую гипотезу, когда она верна, то есть совершить ошиб-

38

ку первого рода. Эту вероятность можно сделать сколь угодно малой, выбрав до-

статочно большое значение величины u*.

Выберем u* таким образом, чтобы величина α была столь малой, чтобы можно

считать практически несомненным, что событие с вероятностью α не произойдет в единичном опыте. Если окажется, что u0 > u*, то это будет означать, что событие,

обладающее вероятностью α, произошло. Однако по нашей гипотезе такое собы- тие практически не может произойти при единичном опыте. Поэтому в данном случае мы должны придти к выводу, что в данном случае наша гипотеза опро- вергнута опытом. С другой стороны, если обнаружится, что u0 < u*, то можно при-

знать рассматриваемую гипотезу не противоречащей опытным данным.

Обычно говорят, что при u0 > u* отклонение значимо и отвергают предвари-

тельно принятую гипотезу. При u0<u* различия считаются незначимыми и гипотеза принимается. В простейшем случае, когда выясняется согласие между выбороч-

ным и теоретическим распределениями, пользуются специальным термином - критерием согласия.

В случае, когда мера отклонения u0 превышает предел значимости u*, счита- ют, что гипотеза опровергнута опытом. Но такое опровержение не равноценно ло-

гическому опровержению. Даже если гипотеза верна, событие u0 > u*, имеющее вероятность α, может произойти в отдельном исключительном случае. Однако,

если α достаточно мало, то мы вправе на практике исключить такую возможность.

f0(U)

u* U

Область принятия гипотезы Н0

Критическая область гипотезы Н0

а)

f1(U)

u*

U

Критическая область гипотезы Н1 Область принятия гипотезы Н1

б)

Рис.5.3. Области критериев нулевой а) и альтернативной б) гипотез

39

С другой стороны, получение одного значения u0 < u* не является доказатель- ством правильности гипотезы. Это лишь показывает, что с точки зрения того част- ного критерия, к которому мы прибегли, совпадение между теорией и эксперимен-

тальными данными удовлетворительно.

Однако нельзя точно ответить на вопрос, говорят ли полученные наблюдения

в пользу данной гипотезы H0, если не рассматривать, с какими альтернативными гипотезами она сравнивается. Вполне может случиться, что наблюдаемые вели-

чины недостаточно хорошо согласуются с теоретическим распределением для

нулевой гипотезы. Однако расхождение может быть еще больше, если справед- лива гипотеза H1. Поэтому решение о принятии или непринятии исходной гипоте- зы существенно зависит от того, против каких гипотез она проверяется.

Допустим, что рассматриваются нулевая гипотеза H0 с плотностью вероятно-

сти появления значения критерия f0(u) и альтернативная ей гипотеза H1 с плотно-

стью f1(u). Области критериев для нулевой и альтернативной гипотез показаны на рис.5.3.

Если гипотеза Н0 верна, то при u0 > u* отвергая ее и принимая гипотезу Н1, мы

с вероятностью α совершаем ошибку первого рода. Принимая при u0 < u* нулевую

гипотезу, в то время как верна альтернативная гипотеза H1, мы с вероятностью β

совершаем ошибку второго рода. Величина β определяется по выражению

u *

 

β = òf1(u)du .

(5.4)

−∞

Вероятность правильного отклонения нулевой гипотезы, когда она ложна,

равна

u *

 

γ = 1− β = 1ò

f1(u)du = òf1(u)du .

(5.5)

−∞

u *

 

Уменьшая вероятность ошибки первого рода, т.е. выбирая меньшее значение

α, тем самым увеличиваем вероятность ошибки второго рода, то есть величину β.

В технических расчетах обычно рекомендуется принимать α = 0,01…0,05.

40

Лекция 9. ВЫРАВНИВАНИЕ СТАТИСТИЧЕСКИХ РЯДОВ

При обработке статистического материала приходится решать вопрос, как по-

добрать для данного статистического ряда теоретическую кривую распределения. Такая задача называется выравниванием или сглаживанием статистических ря-

дов.

Задача о наилучшем выравнивании в общем случае неопределенна. Надо сначала установить, что же считать наилучшим приближением. При этом вопрос,

каким типом теоретической функции следует попытаться аппроксимировать ре- зультаты реальных наблюдений, решается не из математических соображений, а

сучетом физических аспектов задачи. Часто принципиальный характер кривой разделения известен заранее из теоретических соображений, а из опыта необхо- димо получить только некоторые численные параметры, входящие в выражение функции.

Аналитическое выражение выбранной кривой распределения зависит от не- скольких параметров. Задача выравнивания статистических рядов переходит в

задачу выбора тех значений параметров, при которых соответствие между стати-

стическим и теоретическим распределением оказывается наилучшим.

Предположим, что исследуемая величина Х есть ошибка измерения, возника-

ющая в результате суммирования множества независимых элементарных ошибок. можно ожидать, что величина Х подчиняется нормальному закону распределения

сплотностью

1

 

 

(x m)2

 

 

 

2σ2

 

f (x) =

 

 

 

e

 

.

s

 

 

 

2p

 

Задача выравнивания сводится к соответствующему выбору m и s.

Иногда заранее известно, что величина Х распределяется приблизительно равномерно на некотором интервале. Тогда следует искать функцию в виде

ì

 

1

,

α £ X £ β

ï

 

 

 

 

f (x) = íβ - α

 

 

ï0,

 

 

X < α , X > β

î

 

 

 

 

и определить границы интервала a и b.

Следует иметь в виду, что любая функция должна удовлетворять условиям:

f (x) ³ 0 ,

ü

+∞

ï

òf (x)dx = 1

ý .

ï

−∞

þ

41

Предположим, что, исходя из тех или иных соображений, мы выбрали функ-

цию, в выражении которой входит несколько параметров a, b, … . Требуется по- добрать эксперименты так, чтобы функция наилучшим образом описывала дан-

ный статистический материал. Один из методов выбора коэффициентов заключа- ется в следующем. Параметры выбираются таким образом, чтобы наиболее важ- ные числовые характеристики совпадали у теоретического и статистического рас-

пределений. Например, если теоретическое распределение имеет один параметр, то подбираются равными математическое ожидание и среднее арифметическое,

если два параметра, то должны совпадать математическое ожидание и дисперсия

генеральной совокупности со средним арифметическим и выборочной дисперсией и т.д.

Наиболее часто для оценки совпадений распределений используется крите-

рий χ2 Пирсона (хи-квадрат).

Предположим, что произведено n опытов, в каждом из которых случайная ве-

личина Х приняла определенное значение. Результаты опытов сведены в k раз- рядов и оформлены в виде статистического ряда.

Ni

x1-x2

x2-x3

xk-xk+1

p*i

p*1

p*2

p*k

Требуется проверить, согласуются ли экспериментальные данные с тем, что

случайная величина Х имеет закон распределения, заданный функцией распре-

деления F(x) или плотностью распределения f(x).

Зная теоретический закон распределения, можно найти вероятности попада-

ния случайной величины в каждый из интервалов p1, p2, , pk.

Проверяя согласованность теоретического и статистического рядов, будем

оценивать их расхождение по сумме квадратов отклонений

(p* p

), взятых с не-

 

 

i

i

 

которыми весовыми коэффициентами сi:

 

 

 

U = åk

ci (pi* pi )2 .

 

 

(6.1)

i =1

 

 

 

 

Коэффициенты ci вводятся потому, что в общем случае отклонения, относя-

щиеся к различным разрядам, нельзя считать равноценными по значимости. Одно и то же по абсолютной величине отклонение (pi* pi ) можно считать малым, если

значение pi велико, или очень большим, если pi мало.

42

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]