Конспект часть 1 (1)
.pdff(x) |
|
|
|
|
x0= 30,6 |
|
|
|
|
0,4 |
|
|
n= 0,8 |
|
|
|
x0= 3 |
|
|
|
|
|
|
|
0,2 |
|
|
|
|
0 |
|
|
|
x |
|
|
|
|
|
0 |
5 |
10 |
15 |
20 |
f(x) |
|
|
|
|
0,4 |
|
|
n= 1 |
|
0,3 |
|
|
|
|
|
|
x0= 3 |
|
|
0,2 |
|
|
|
|
0,1 |
|
|
|
x |
0 |
|
|
|
|
|
|
|
|
|
0 |
5 |
10 |
15 |
20 |
f(x) |
|
|
|
|
0,3 |
|
|
|
|
0,2 |
|
|
n= 1,6 |
|
|
|
|
x0= 3 |
|
0,1 |
|
|
|
x |
0 |
|
|
|
|
|
|
|
|
|
0 |
5 |
10 |
15 |
20 |
f(x) |
|
|
|
|
0,08 |
|
|
|
|
0,06 |
|
|
n= 1,6 |
|
0,04 |
|
|
x0= 10 |
|
|
|
|
|
|
0,02 |
|
|
|
x |
0 |
|
|
|
|
|
|
|
|
|
0 |
5 |
10 |
15 |
20 |
Рис.6. График плотности распределения |
||||
Вейбулла. |
|
|
|
|
33
Лекция 7. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ДИСКРЕТНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН.
Для дискретных величин существует только функция распределения, так как
производная от функции распределения не определена. Наиболее общим случа- ем дискретного распределения является биноминальное распределение.
Пусть производится n независимых опытов, в каждом из которых событие А может появиться, либо нет. Вероятность появления события А во всех опытах по-
стоянна и равна p. В качестве дискретной случайной величины X будем рассмат- ривать количество появления события А в этих опытах. Вероятность появления события ровно m раз равна
|
p (m) = Cmpm (1− p)n−m . |
(4.13) |
||
|
n |
|
n |
|
Здесь Cnm – число сочетаний m элементов из n, |
|
|||
Cnm = |
n! |
. |
|
|
m!(n |
− m)! |
|
||
|
|
|
Случайная величина с таким распределением называется биноминальной
случайной величиной, а ее распределение - биноминальным. Параметрами рас- пределения являются вероятность появления событий в одном опыте р и количе- ство опытов n.
Математическое ожидание этого распределения
M(m) = n p , |
(4.14) |
дисперсия |
|
D(m) = n p (1− p) . |
(4.15) |
Такое распределение имеет, например, число отказавших однотипных невос-
станавливаемых изделий в течение фиксированного интервала работы.
При n → ∞ биноминальный закон сходится к нормальному с параметрами m = np, σ = n p (1− p) .
При малых вероятностях p < 0,1 и большом количестве опытов, n > 10 бино- минальное распределение сводится к распределению Пуассона, которое также называется законом редких событий.
Вероятность того, что случайная положительная целая величина X примет значение m, равна
p(m) = |
λm |
e− λ . |
(4.16) |
|
m! |
|
|
34
Параметром распределения является величина λ>0. Математическое ожида-
ние и дисперсия равны:
mx = λ, Dx = λ . |
(4.17) |
При больших значениях n > 50 распределение Пуассона приближается к нор- мальному распределению.
Закон Пуассона представляет устойчивое распределение, т. е. сумма случай-
ных величин, каждая из которых имеет распределение Пуассона, также распреде- лена по этому закону.
В статистике используются и другие распределения дискретных случайных величин. При необходимости сведения о них можно найти в справочной литерату- ре.
35
Лекция 8. СТАТИСТИЧЕСКИЕ ВЫВОДЫ
Никакая математическая теория не изучает непосредственно вещи, с которы-
ми сталкиваемся на опыте. Математическая теория всецело принадлежит к обла- сти понятий и оперирует с чисто абстрактными объектами. Однако теория служит
моделью некоторой группы явлений реального мира. Абстрактные объекты тео- рии имеют своих двойников в реальном мире. Для того, чтобы такая модель была практически полезной, должна существовать некоторая согласованность между
выводами теории и наблюдаемыми в опытах явлениями.
Во многих случаях задача проверки согласованности теории с опытом, т.е.
адекватности модели, описывающей исследуемые явления, производится следу- ющим образом: по математической модели рассчитываются некоторые характе- ристики процесса, затем проводятся опыты на реальном объекте и эксперимен- тально определяются те же характеристики. После этого эти данные сопоставля-
ются и по их согласованности судят, правильно ли отражают данная теория и ма- тематическая модель течение реального процесса.
Очевидно, что полного совпадения результатов может не быть. Во-первых,
математические модели отображают только основные черты явления, не рас- сматривая второстепенных. Во-вторых, результаты экспериментальной проверки также отягощены случайными ошибками, вызванными погрешностью приборов, нестационарностью режима, при котором проводились измерения и т.д. Во всяком статистическом распределении неизбежно присутствие элементов случайности. Число наблюдений ограничено, случайным является то, что произведены именно
такие опыты и получены именно такие результаты. Только при очень большом
числе наблюдений эти элементы случайности сглаживаются и случайное в полной мере проявляет свою закономерность. По этим причинам вопрос об оценке адек- ватности сводится к вопросу, расхождение экспериментальных и теоретических результатов является значимым, т.е. существует действительное различие между ними, или несовпадение данных можно объяснить только влиянием второстепен- ных случайных факторов.
Фактически перед проверкой адекватности выдвигается некоторая гипотеза о соответствии опытных данных некоторому теоретическому закону. В дальнейшем
эта гипотеза должна быть или принята, или отвергнута.
Для проверки статистических гипотез используются критерии значимости. Идея применения критериев заключается в следующем. На основании данного
36
статистического материала необходимо проверить гипотезу о том, что случайная
величина Х подчиняется определенному закону распределения. Эта гипотеза
называется нулевой и обозначается как H0. Гипотеза о том, что случайная вели- чина распределена не по рассматриваемому закону, называется альтернативной и обозначается как H1. В результате анализа наблюдаемых реализаций случайной
величины X мы должны принять гипотезу H0 и отвергнуть H1 или принять H1 и от- вергнуть H0.
Для того, чтобы принять или отвергнуть данную гипотезу, рассмотрим некото-
рую величину U, характеризующую степень расхождения теоретического и стати- стического распределений. Величина U может быть выбрана различными спосо-
бами. Например, в качестве U можно взять сумму абсолютных значений расхож- дений теоретического и статистического распределений, сумму квадратов откло- нений, сумму квадратов отклонений с некоторыми весовыми коэффициентами, сумму отклонений четвертой степени или наибольшее значение отклонений. До- пустим, что величина U выбрана тем или иным способом. Очевидно, что это есть некоторая случайная величина. Закон распределения этой случайной величины зависит от закона распределения величины Х и от числа опытов n.
В общем случае диапазон возможных значений величины U в зависимости от выбора метода определения U составляет [-∞, +∞] или [0, +∞]. Предположим, что в качестве меры расхождения U была взята сумма квадратов отклонений теоре- тического и полученного экспериментальным путем значений случайной величи- ны. Теоретический диапазон изменения величины U будет равен [0, +∞]. Выберем некоторую положительную величину u*, которая разобьет этот диапазон на две области. Будем считать, что если наблюдаемая величина u0.попадает в область u0>u*, то наблюдения не согласуются с рассматриваемой гипотезой; если же во
f(U)
|
u* |
|
U |
Область принятия гипотезы |
Критическая область |
Рис.5.1.. Области одностороннего критерия значимости
37
вторую u0 ≤ u* – то гипотеза подтверждается результатами наблюдений. Первая область называется критической областью критерия U, вторая – областью приня- тия гипотезы. Эти области показаны на рис.5.1.
Если известно распределение вероятности наблюдений, соответствующее проверяемой гипотезе H0, то величину u* можно выбрать таким образом, чтобы
при выполнении гипотезы H0 вероятность отвергнуть гипотезу H0 была равна за-
ранее заданной величине α,
P(U > u* )= α . |
(5.1) |
Величина α по определению равна |
|
∞ |
|
α = òf (u)du . |
(5.2) |
u *
Если же в качестве меры расхождения было принята величина наибольшего расхождения между теоретическим и экспериментальным значениями случайной величины, то диапазон возможных значений U будет равен [-∞, +∞]. В этом случае следует считать не согласующимися с гипотезой те наблюдения, для которых u > u* и u < -u*. Здесь появляются две критические области, в которых нулевая ги-
потеза отвергается. Данная ситуация показана на рис.5.2.
f(U)
-u* |
u* |
|
U |
Критическая область |
Область принятия гипотезы Критическая область |
Рис.5.2. Области двухстороннего критерия значимости
Для этого случая
−u * |
∞ |
∞ |
|
α = ò |
f (u)du + ò |
f (u)du = 2 òf (u)du . |
(5.3) |
−∞ |
u * |
u * |
|
Вероятность α, которую можно фиксировать произвольным образом, называ-
ется уровнем значимости критерия или размером критерия. Она определяет ве- роятность отвергнуть нулевую гипотезу, когда она верна, то есть совершить ошиб-
38
ку первого рода. Эту вероятность можно сделать сколь угодно малой, выбрав до-
статочно большое значение величины u*.
Выберем u* таким образом, чтобы величина α была столь малой, чтобы можно
считать практически несомненным, что событие с вероятностью α не произойдет в единичном опыте. Если окажется, что u0 > u*, то это будет означать, что событие,
обладающее вероятностью α, произошло. Однако по нашей гипотезе такое собы- тие практически не может произойти при единичном опыте. Поэтому в данном случае мы должны придти к выводу, что в данном случае наша гипотеза опро- вергнута опытом. С другой стороны, если обнаружится, что u0 < u*, то можно при-
знать рассматриваемую гипотезу не противоречащей опытным данным.
Обычно говорят, что при u0 > u* отклонение значимо и отвергают предвари-
тельно принятую гипотезу. При u0<u* различия считаются незначимыми и гипотеза принимается. В простейшем случае, когда выясняется согласие между выбороч-
ным и теоретическим распределениями, пользуются специальным термином - критерием согласия.
В случае, когда мера отклонения u0 превышает предел значимости u*, счита- ют, что гипотеза опровергнута опытом. Но такое опровержение не равноценно ло-
гическому опровержению. Даже если гипотеза верна, событие u0 > u*, имеющее вероятность α, может произойти в отдельном исключительном случае. Однако,
если α достаточно мало, то мы вправе на практике исключить такую возможность.
f0(U)
u* U
Область принятия гипотезы Н0 |
Критическая область гипотезы Н0 |
а)
f1(U)
u*
U
Критическая область гипотезы Н1 Область принятия гипотезы Н1
б)
Рис.5.3. Области критериев нулевой а) и альтернативной б) гипотез
39
С другой стороны, получение одного значения u0 < u* не является доказатель- ством правильности гипотезы. Это лишь показывает, что с точки зрения того част- ного критерия, к которому мы прибегли, совпадение между теорией и эксперимен-
тальными данными удовлетворительно.
Однако нельзя точно ответить на вопрос, говорят ли полученные наблюдения
в пользу данной гипотезы H0, если не рассматривать, с какими альтернативными гипотезами она сравнивается. Вполне может случиться, что наблюдаемые вели-
чины недостаточно хорошо согласуются с теоретическим распределением для
нулевой гипотезы. Однако расхождение может быть еще больше, если справед- лива гипотеза H1. Поэтому решение о принятии или непринятии исходной гипоте- зы существенно зависит от того, против каких гипотез она проверяется.
Допустим, что рассматриваются нулевая гипотеза H0 с плотностью вероятно-
сти появления значения критерия f0(u) и альтернативная ей гипотеза H1 с плотно-
стью f1(u). Области критериев для нулевой и альтернативной гипотез показаны на рис.5.3.
Если гипотеза Н0 верна, то при u0 > u* отвергая ее и принимая гипотезу Н1, мы
с вероятностью α совершаем ошибку первого рода. Принимая при u0 < u* нулевую
гипотезу, в то время как верна альтернативная гипотеза H1, мы с вероятностью β
совершаем ошибку второго рода. Величина β определяется по выражению
u * |
|
β = òf1(u)du . |
(5.4) |
−∞
Вероятность правильного отклонения нулевой гипотезы, когда она ложна,
равна
u * |
∞ |
|
γ = 1− β = 1− ò |
f1(u)du = òf1(u)du . |
(5.5) |
−∞ |
u * |
|
Уменьшая вероятность ошибки первого рода, т.е. выбирая меньшее значение
α, тем самым увеличиваем вероятность ошибки второго рода, то есть величину β.
В технических расчетах обычно рекомендуется принимать α = 0,01…0,05.
40
Лекция 9. ВЫРАВНИВАНИЕ СТАТИСТИЧЕСКИХ РЯДОВ
При обработке статистического материала приходится решать вопрос, как по-
добрать для данного статистического ряда теоретическую кривую распределения. Такая задача называется выравниванием или сглаживанием статистических ря-
дов.
Задача о наилучшем выравнивании в общем случае неопределенна. Надо сначала установить, что же считать наилучшим приближением. При этом вопрос,
каким типом теоретической функции следует попытаться аппроксимировать ре- зультаты реальных наблюдений, решается не из математических соображений, а
сучетом физических аспектов задачи. Часто принципиальный характер кривой разделения известен заранее из теоретических соображений, а из опыта необхо- димо получить только некоторые численные параметры, входящие в выражение функции.
Аналитическое выражение выбранной кривой распределения зависит от не- скольких параметров. Задача выравнивания статистических рядов переходит в
задачу выбора тех значений параметров, при которых соответствие между стати-
стическим и теоретическим распределением оказывается наилучшим.
Предположим, что исследуемая величина Х есть ошибка измерения, возника-
ющая в результате суммирования множества независимых элементарных ошибок. можно ожидать, что величина Х подчиняется нормальному закону распределения
сплотностью
1 |
|
|
− (x −m)2 |
|
||
|
|
2σ2 |
|
|||
f (x) = |
|
|
|
e |
|
. |
s |
|
|
|
|||
2p |
|
Задача выравнивания сводится к соответствующему выбору m и s.
Иногда заранее известно, что величина Х распределяется приблизительно равномерно на некотором интервале. Тогда следует искать функцию в виде
ì |
|
1 |
, |
α £ X £ β |
ï |
|
|
||
|
|
|||
f (x) = íβ - α |
|
|
||
ï0, |
|
|
X < α , X > β |
|
î |
|
|
|
|
и определить границы интервала a и b.
Следует иметь в виду, что любая функция должна удовлетворять условиям:
f (x) ³ 0 , |
ü |
+∞ |
ï |
òf (x)dx = 1 |
ý . |
ï |
|
−∞ |
þ |
41
Предположим, что, исходя из тех или иных соображений, мы выбрали функ-
цию, в выражении которой входит несколько параметров a, b, … . Требуется по- добрать эксперименты так, чтобы функция наилучшим образом описывала дан-
ный статистический материал. Один из методов выбора коэффициентов заключа- ется в следующем. Параметры выбираются таким образом, чтобы наиболее важ- ные числовые характеристики совпадали у теоретического и статистического рас-
пределений. Например, если теоретическое распределение имеет один параметр, то подбираются равными математическое ожидание и среднее арифметическое,
если два параметра, то должны совпадать математическое ожидание и дисперсия
генеральной совокупности со средним арифметическим и выборочной дисперсией и т.д.
Наиболее часто для оценки совпадений распределений используется крите-
рий χ2 Пирсона (хи-квадрат).
Предположим, что произведено n опытов, в каждом из которых случайная ве-
личина Х приняла определенное значение. Результаты опытов сведены в k раз- рядов и оформлены в виде статистического ряда.
Ni |
x1-x2 |
x2-x3 |
… |
xk-xk+1 |
p*i |
p*1 |
p*2 |
… |
p*k |
Требуется проверить, согласуются ли экспериментальные данные с тем, что
случайная величина Х имеет закон распределения, заданный функцией распре-
деления F(x) или плотностью распределения f(x).
Зная теоретический закон распределения, можно найти вероятности попада-
ния случайной величины в каждый из интервалов p1, p2, , pk.
Проверяя согласованность теоретического и статистического рядов, будем
оценивать их расхождение по сумме квадратов отклонений |
(p* − p |
), взятых с не- |
||
|
|
i |
i |
|
которыми весовыми коэффициентами сi: |
|
|
|
|
U = åk |
ci (pi* − pi )2 . |
|
|
(6.1) |
i =1 |
|
|
|
|
Коэффициенты ci вводятся потому, что в общем случае отклонения, относя-
щиеся к различным разрядам, нельзя считать равноценными по значимости. Одно и то же по абсолютной величине отклонение (pi* − pi ) можно считать малым, если
значение pi велико, или очень большим, если pi мало.
42