Типовой расчет
.pdf9. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СУММЫ И ПРОИЗВЕДЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
Числовые характеристики суммы |
|
|
Пусть Y = a 0 + a1 X 1 + a 2 X 2 , где a i |
- не случайные коэффициенты, то |
|
-математическое ожидание Y равно: |
|
|
mY = a0 +a1m1 +a2m2 ; |
(9.1) |
|
где mi - математическое ожидание СВ Xi |
|
|
- дисперсия Y равно: |
|
|
DY = a12 D1 + a22 D2 |
+ 2a1a2 K12 . |
(9.2) |
где |
Di - дисперсия СВ Xi |
|
|
|
|
||
|
K12 - корреляционный момент величин X1 и X2 |
|
|||||
|
n |
|
|
|
|
|
|
Если Y = a0 +∑ai Xi , a i |
- не случайные коэффициенты, то математическое |
||||||
|
i=1 |
|
|
|
|
|
|
ожидание и дисперсия Y равны: |
|
|
|
|
|
||
|
|
= M a0 + |
n |
|
X i |
n |
|
|
mY |
∑ai |
= a0 + ∑ai mi ; |
(9.3) |
|||
|
|
|
i =1 |
|
|
i=1 |
|
|
|
n |
|
|
n |
n n |
|
|
DY = D a0 +∑ai Xi |
= ∑ai2 Di +2∑ ∑ ai aj Kij . |
(9.4) |
||||
|
|
i=1 |
|
i=1 |
i=1 j=i+1 |
|
|
Числовые характеристики произведения |
|
||||||
Пусть |
Y = aX1 X 2 , где a |
|
- |
не случайный коэффициент, то |
|||
математическое ожидание Y равно: |
|
|
|
|
|
||
|
|
mY = a (m1m2 |
+ K12 ) ; |
(9.5) |
где mi - математическое ожидание СВ Xi
K12 - корреляционный момент величин X1 и X2
Если Y = X X , то математическое ожидание Y равно:
31
m = m m + K |
XX |
= m2 |
+ D |
X ; |
(9.6) |
||||
Y |
X |
X |
|
X |
|
||||
В случае независимых сомножителей X |
1 |
и X |
дисперсия |
Y = a X 1 X 2 |
|||||
|
|
|
|
|
2 |
|
|
|
|
может быть определена по формуле |
|
|
|
|
|
|
|
||
DY =a2 (D1D2 + m12 D2 + m22 D1 ). |
(9.7) |
||||||||
n |
|
|
|
|
|
|
|
|
|
Если Y = ∏ X i , Xi – независимые случайные величины, то математическое |
|||||||||
i =1 |
|
|
|
|
|
|
|
|
|
ожидание и дисперсия Y равны: |
|
|
|
|
|
|
|
|
|
mY |
= |
|
n |
|
|
n |
|
|
(9.8) |
M |
∏ X i |
|
= ∏mi ; |
|
|||||
|
|
|
i =1 |
|
|
i=1 |
|
|
|
DY |
|
n |
|
n |
n |
(9.9) |
= D |
∏ X i |
= ∏ ( Di + m i2 ) − ∏ m i2 . |
||||
|
|
i =1 |
|
i =1 |
i =1 |
|
Пример 10.1. Вычислить математическое ожидание и дисперсию величин U и V, а так же определить их коэффициент корреляции RUV :
U= X 1 − 3 X 2
V= 4 − 2 X 2 + X 3
Величины X1, X2, X3 имеют следующие числовые характеристики:
m1 = 2; m2 = -3; m3 = 0; D1 = 4; D2 = 6; D3 = 12, K12 = 0, K13 = -4, K23 = 9.
Решение. Вычислим математические ожидания U и V по формуле (9.1): m U = m 1 − 3 m 3 = 2 − 3 ( − 3 ) = 1 1
m V |
= 4 − 2 m 2 + m 3 = 4 − 2 ( − 3 ) + 0 = 1 0 |
Вычислим дисперсии DU и DV по формуле (9.2): |
|
D U = D 1 + ( − 3 ) 2 D 2 + 2 ( − 3 ) K 1 2 = 4 + 9 6 = 5 8 |
|
D V |
= ( − 2 ) 2 D 2 + D 3 + 2 ( − 2 ) K 2 3 = 4 4 + 1 2 + 3 6 = 6 4 |
Рассчитаем корреляционный момент KUV по формуле (8.10):
K U V = M [U V ]− m U m V .
32
Для этого определим математическое ожидание произведения величин U и V :
M [UV ] = M [( X1 −3X 2 )(4 − 2 X 2 + X 3 )] =
= M [4 X1 − 2 X1 X 2 + X1 X 3 −12 X 2 + 6 X 2 X 2 −3X 2 X 3 ]= применяем (9.3) =
=4m1 − 2 M [X1 X 2 ]+ M [X1 X 3 ]-12m2 + 6 M [X 2 X 2 ]- 3 M [X 2 X 3 ]=
=применяем (9.5) и (9.5) =
=4m1 − 2(m1m2 + K12 ) + (m1m3 + K13 ) −12m2 + 6(m22 + D2 ) −3(m2m3 + K23 ) =
=8 +12 − 4 +36 +90 − 27 =115
Таким образом
K U V = M [U V ]− m U m V = 1 1 5 − 1 1 1 0 = 5
Величину R U V определим по формуле (8.11):
RU V |
= |
K U V |
= |
5 |
|
= 0 .0 8 2 . |
|
D U |
D V |
5 8 |
|
||||
|
|
|
6 4 |
33
10. ОБРАБОТКА ОДНОМЕРНОЙ ВЫБОРКИ
Генеральной совокупностью опыта называется множество объектов, из которых производится выборка. Выборка - множество {x1 , x2 ,..., xn } случайно отобранных объектов (значений) из генеральной совокупности. Объемом выборки n называется число входящих в нее объектов.
Вариационным рядом называется выборка { x)1, x)2 ,..., x)n }, полученная в результате расположения значений исходной выборки в порядке возрастания.
Значения x)i называются вариантами.
Оценка закона распределения
Эмпирическая функция распределения случайной величины X равна частоте того, что X примет значение меньшее, чем аргумент функции x, и определяется формулой
0, |
x ≤ x)1, |
|
||||
: |
|
|
|
|
||
F*(x) = p*(X < x) = |
i |
, x) |
< x |
≤ x) |
(10.1) |
|
|
||||||
n |
i |
|
i+1 |
|||
: |
x > x) . |
|
||||
1, |
|
|||||
|
|
n |
|
|
||
|
|
|
|
|||
|
|
|
|
|
|
При n →∞ эмпирическая функция распределения F*(x) сходится по
вероятности к теоретической функции распределения F(x).
Интервальный статистический ряд вероятностей строится по исходной выборке, если анализируемая случайная величина Х является
непрерывной:
|
j |
Aj |
|
Bj |
hj |
νj |
p *j |
f j* |
|
1 |
A1 |
|
B1 |
h1 |
ν1 |
p* |
f * |
|
|
|
|
|
|
|
1 |
1 |
|
M |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
M |
AM |
|
BM |
hM |
νM |
pM* |
f * |
|
|
|
|
|
|
|
|
M |
Здесь j – номер интервала; |
|
|
|
|
|
34
M – число непересекающихся и примыкающих друг к другу интервалов, на
которые разбивается диапазон значений [x)1 , x)n ] :
int |
( |
n ), n ≤100, |
(10.2) |
|||||
M ≈ |
(( |
|
) |
|
( |
|
)) |
|
|
2 ÷ 4 |
lg |
n |
, n >100, |
||||
int |
|
|
|
|
|
|
|
|
|
где int(x) - целая часть числа x . Желательно, чтобы n безостатка |
|||||||||
Aj, Bj |
|
|
|
|
|
|
|
|
делилосьна M; |
j-го интервала (Aj+1 = Bj), |
|
|||
|
|
– |
левая и правая границы |
причем |
||||||||||
|
|
|
|
|
|
|
|
A1 = x)1 , B M = x)n ; |
|
|
|
|
||
hj = Bj - Aj – длина j-го интервала; |
|
|
M |
|
||||||||||
νj− количество чисел в выборке, попадающих в j-й интервал, |
∑ ν j |
= n |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
j =1 |
|
p *j = |
ν |
|
j |
|
– частота попадания в j-й интервал; ∑m |
p *j = 1 . |
|
|
||||||
|
n |
|
|
|
||||||||||
|
|
|
|
|
|
|
j =1 |
|
|
|
||||
|
|
p* |
|
|
|
|
ν |
j |
|
|
|
|
|
|
f j* = |
|
|
j |
|
= |
|
|
– статистическая плотность вероятности в j-м интервале. |
||||||
|
h j |
|
|
|
|
|||||||||
|
|
|
|
|
|
nh j |
|
|
|
|
||||
При |
построения интервального |
статистического ряда |
вероятностей |
используют следующие методы разбиения диапазона значений на интервалы:
1) равноинтервальный, т.е. все интервалы одинаковой длины:
h |
|
= h = |
xn − x)1 |
, j A |
|
= x) |
+( j −1)h, j = |
|
(10.3) |
|
j |
j |
2, M |
||||||||
M |
||||||||||
|
|
|
1 |
|
|
|
2) равновероятностный, т.е. границы интервалов выбирают так, чтобы в каждом интервале было одинаковое число выборочных значений (необходимо, чтобы n безостаткаделилосьна M):
|
|
n |
* |
|
1 |
|
|
x( j −1)ν |
+ x)( j −1)ν +1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
ν j |
= ν = |
|
, p j |
= |
|
j A j |
= |
|
|
, |
j = 2 , M |
(10.4) |
|
M |
M |
|
2 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
Гистограмма - статистический аналог графика плотности вероятности
f *(x) случайной величины, и она строится по интервальному статистическому ряду. Гистограмма представляет собой совокупность прямоугольников, построенных, как на основаниях, на интервалах hj статистического ряда с
высотой равной статистической плотности вероятности f j* в соответствующем интервале. Для равноинтервального метода все прямоугольники гистограммы
35
имеют одинаковую ширину, а для равновероятностного метода – одинаковую площадь. Сумма площадей всех прямоугольников гистограммы равна 1.
Точечные оценки числовых характеристик
Статистической оценкой Q* параметра Q распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные.
Точечной называется оценка, определяемая одним числом. Точечная оценка Q* параметра Q случайной величины X в общем случае равна
Q* =ϕ(x1, x2 ,..., xn ) , где xi – значения выборки. Очевидно, что оценка Q* – это случайная величина и значения Q* будут изменяться от выборки к выборке случайным образом. К оценкам предъявляется ряд требований.
1. Оценка Q* называется состоятельной, если при увеличении объема выборки n она сходится по вероятности к значению параметра Q:
Q |
|
→Q lim (P( Q |
|
− Q < ε )) = 1, ε > 0 . |
|||
|
* |
p |
|
|
* |
|
|
|
|
n→∞ |
n→∞ |
|
|
|
|
|
|
|
|
|
|
|
|
Состоятельность – это минимальное требование к оценкам. |
|||||||
2. Состоятельная оценка Q* называется несмещенной, если ее |
|||||||
математическое ожидание точно равно параметру Q для любого объема |
|||||||
выборки: |
|
|
|
|
|
|
|
|
|
|
M [ Q * ] = Q , n . |
3. Состоятельная несмещенная оценка Q* является эффективной, если ее
дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра:
D Q * = min .
Состоятельная, несмещенная и эффективная точечная оценка математического ожидания вычисляется как среднее арифметическое значений выборки x , называемое выборочным средним:
36
m *X |
= |
x |
= |
1 |
∑n |
x i |
(10.5) |
|
|
|
|
n |
i =1 |
|
|
Состоятельная несмещенная точечная оценка дисперсии равна:
D X* = S 02 = |
1 |
∑n (xi − x )2 |
= |
1 |
∑n |
xi2 − |
n |
x 2 |
(10.6) |
n −1 |
|
n −1 |
|||||||
|
i =1 |
|
n −1 i =1 |
|
|
|
|||
Состоятельная несмещенная точечная оценка среднеквадратического |
|||||||||
отклонения равна: |
|
|
|
|
|
|
|
|
|
|
|
σ*X = S0 = |
S02 |
|
|
|
|
(10.7) |
Интервальные оценки числовых характеристик
Доверительным называется интервал
I γ (Q ) = (Q * − ε ; Q * + ε ) ,
где Q* - несмещенная точечная оценка параметра Q,
в который с заданной вероятностью (надежностью) γ попадают истинное значения параметра Q. Вероятность γ выбирается близкой к 1: 0,9; 0,95; 0,975; 0,99.
Согласно центральной предельной теореме, при достаточно большом объеме выборки n ( n > 20 ÷50 ) закон распределения несмещенных точечных оценок m*X и DX* можно считать нормальным при любом законе распределения случайной величины и доверительные интервалы для математического ожидания и дисперсии могут быть определены по следующим формулам.
Доверительный интервал для математического ожидания имеет вид
|
|
|
|
|
|
|
|
|
S |
0 |
|
|
|
S0 |
zγ |
|
|
|
|
|||
|
|
|
|
Iγ (mX |
) = |
x − zγ |
|
|
; x |
+ zγ |
|
|
|
|
|
, |
|
|
(10.8) |
|||
|
|
|
|
|
|
n |
|
|
n |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Доверительный интервал для дисперсии имеет вид |
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
2 |
|
|
2 |
|
2 |
2 |
|
|
|
2 |
|
2 |
|
|
||
|
|
|
Iγ |
( D X ) = |
S0 |
− zγ |
|
|
|
|
S0 |
; S0 |
+ zγ |
|
|
|
S |
0 |
, |
(10.9) |
||
|
|
|
|
n −1 |
|
n −1 |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
где |
zγ |
= arg Φ( |
γ ) |
- значение аргумента функции Лапласа, т.е. Ф(zγ) = |
γ . |
|||||||||||||||||
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
37
Проверка статистических гипотез
Статистической гипотезой называется всякое непротиворечивое мно-
жество утверждений {Н0, Н1, … , Hk-1} относительно свойств распределения случайной величины. Простейшей гипотезой является двухальтернативная: {H0, H1}. В этом случае альтернативу H0 называют нулевой гипотезой, а H1-
конкурирующей гипотезой.
Критерием называется случайная величина U =ϕ (x1,K, xn ),где xi –
значения выборки, которая позволяет принять или отклонить нулевую гипотезу H0 .Ошибка первого рода состоит в том, что будет отклонена гипотеза H0, если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости. Наиболее часто на практике принимают, что α = 0,05 или α = 0,01.
Критериями согласия называются критерии, используемые для проверки гипотез о предполагаемом законе распределения.
Гипотеза о законе распределения выдвигается следующим образом.
1. Построить по вариационному ряду график эмпирической функции распределения F*(x) и по интервальным статистическим рядам
(равноинтервальному и равновероятностному) гистограммы. Для наглядности соединяем плавной линией середины верхних линий прямоугольников гистограмм.
2. По виду графиков выдвинуть двухальтернативную гипотезу о предполагаемом (гипотетическом) законе распределения:
H0 |
- величина X распределена по такому-то закону: |
|
|
f(x) = f0(x), |
F(x) = F0(x) |
H1 |
- величина X не распределена по такому-то закону: |
|
|
f(x) ≠ f0(x), |
F(x) ≠ F0(x) |
где f0(x), F0(x) - плотность и функция распределения гипотетического закона распределения.
38
График эмпирической функции распределения F*(x) должен быть похож на график функции распределения F0(x) гипотетического закона, а
гистограммы на график плотности гипотетического распределения f0(x). Ниже приведены графики и аналитические выражения плотности и функции распределения для часто встречающихся на практике законов.
Равномерное распределение имеет непрерывная случайная величина Х,
если ее плотность вероятности в некотором интервале [а; b] постоянна:
|
0 , x < a , |
|
|
|
0 , x < a , |
|
|
|
||||||||
|
|
1 |
|
|
|
|
|
|
|
− |
a |
|
|
|
|
|
f ( x ) = |
|
|
, a |
≤ |
x ≤ b , |
F ( x ) = |
x |
, a |
≤ x |
≤ b , |
|
|||||
|
|
|
|
|
|
|
|
(10.10) |
||||||||
|
− |
a |
b |
− |
a |
|||||||||||
|
b |
|
|
|
|
|
|
|
|
|
||||||
|
0 , x > b . |
|
|
|
1 , x > b . |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где а, b – параметры распределения (b >a).
Графики плотности и функции равномерного распределения при a =1 и b=3:
Экспоненциальное распределение имеет непрерывная случайная величина T, принимающая только положительные значения, если ее плотность вероятности и функция распределения равны:
|
|
− λ t |
|
|
|
|
− λ t |
|
|
|
f ( t ) = |
λ e |
, t |
≥ 0 , |
F (t ) = 1 − e |
, t |
≥ 0 , |
|
|||
|
|
(10.11) |
||||||||
|
0 , t < 0 . |
|
0 , t < 0 . |
|
где λ – параметр распределения (λ >0).
Графики плотности и функции экспоненциального распределения при λ =1:
39
Нормальное распределение (распределение Гаусса) имеет непрерывная случайная величина Х, если ее плотность вероятности и функция распределения равны:
f (x ) = |
|
1 |
|
|
(x − m) |
2 |
|
|||
|
|
exp − |
|
, F ( x ) |
||||||
|
|
|
σ |
2π |
|
2σ 2 |
|
|
||
где m, σ - параметры распределения ( σ >0), |
||||||||||
|
1 |
|
x |
t2 |
|
|
|
|
||
Φ(x) = |
|
∫e− |
|
dt — функция Лапласа. |
||||||
|
2 |
|||||||||
2π |
||||||||||
|
0 |
|
|
|
|
|
|
= |
0 .5 + Φ |
|
x − m |
|
, (10.12) |
|
|
|
|
||||
σ |
||||||
|
|
|
|
|
Графики плотности и функции нормального распределения при m =0, σ =1:
3. Вычислить точечные оценки математического ожидания x и дисперсии S02
и, используя метод моментов, определить оценки неизвестных |
параметров |
|||
Q1, ..., |
Q)s гипотетического закона распределения, где s ≤ 2 - число неизвестных |
|||
параметров гипотетического закона распределения. |
|
|||
Оценки неизвестных параметров а, b равномерного распределения можно |
||||
определить по формулам: |
|
|
|
|
|
a) = x − 3 S0 , |
|
b = x + 3 S0 |
(10.13) |
или |
|
|
|
|
|
a) = x) , |
b = x) |
(10.14) |
|
|
1 |
|
n |
|
где x , x) - первое и последнее значение вариационного ряда соответственно. |
||||
1 |
n |
|
|
|
Оценку неизвестного параметра λ экспоненциального распределения |
||||
можно определить по формуле: |
|
|
|
|
|
) |
1 |
|
|
|
λ = |
|
|
(10.15) |
|
x |
|||
|
|
|
40