Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Типовой расчет

.pdf
Скачиваний:
87
Добавлен:
01.04.2014
Размер:
739.61 Кб
Скачать

9. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СУММЫ И ПРОИЗВЕДЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

Числовые характеристики суммы

 

 

Пусть Y = a 0 + a1 X 1 + a 2 X 2 , где a i

- не случайные коэффициенты, то

-математическое ожидание Y равно:

 

 

mY = a0 +a1m1 +a2m2 ;

(9.1)

где mi - математическое ожидание СВ Xi

 

- дисперсия Y равно:

 

 

DY = a12 D1 + a22 D2

+ 2a1a2 K12 .

(9.2)

где

Di - дисперсия СВ Xi

 

 

 

 

 

K12 - корреляционный момент величин X1 и X2

 

 

n

 

 

 

 

 

 

Если Y = a0 +ai Xi , a i

- не случайные коэффициенты, то математическое

 

i=1

 

 

 

 

 

 

ожидание и дисперсия Y равны:

 

 

 

 

 

 

 

= M a0 +

n

 

X i

n

 

 

mY

ai

= a0 + ai mi ;

(9.3)

 

 

 

i =1

 

 

i=1

 

 

 

n

 

 

n

n n

 

 

DY = D a0 +ai Xi

= ai2 Di +2∑ ∑ ai aj Kij .

(9.4)

 

 

i=1

 

i=1

i=1 j=i+1

 

Числовые характеристики произведения

 

Пусть

Y = aX1 X 2 , где a

 

-

не случайный коэффициент, то

математическое ожидание Y равно:

 

 

 

 

 

 

 

mY = a (m1m2

+ K12 ) ;

(9.5)

где mi - математическое ожидание СВ Xi

K12 - корреляционный момент величин X1 и X2

Если Y = X X , то математическое ожидание Y равно:

31

m = m m + K

XX

= m2

+ D

X ;

(9.6)

Y

X

X

 

X

 

В случае независимых сомножителей X

1

и X

дисперсия

Y = a X 1 X 2

 

 

 

 

 

2

 

 

 

может быть определена по формуле

 

 

 

 

 

 

 

DY =a2 (D1D2 + m12 D2 + m22 D1 ).

(9.7)

n

 

 

 

 

 

 

 

 

 

Если Y = X i , Xi – независимые случайные величины, то математическое

i =1

 

 

 

 

 

 

 

 

 

ожидание и дисперсия Y равны:

 

 

 

 

 

 

 

 

mY

=

 

n

 

 

n

 

 

(9.8)

M

X i

 

= mi ;

 

 

 

 

i =1

 

 

i=1

 

 

 

DY

 

n

 

n

n

(9.9)

= D

X i

= ( Di + m i2 ) m i2 .

 

 

i =1

 

i =1

i =1

 

Пример 10.1. Вычислить математическое ожидание и дисперсию величин U и V, а так же определить их коэффициент корреляции RUV :

U= X 1 3 X 2

V= 4 2 X 2 + X 3

Величины X1, X2, X3 имеют следующие числовые характеристики:

m1 = 2; m2 = -3; m3 = 0; D1 = 4; D2 = 6; D3 = 12, K12 = 0, K13 = -4, K23 = 9.

Решение. Вычислим математические ожидания U и V по формуле (9.1): m U = m 1 3 m 3 = 2 3 ( 3 ) = 1 1

m V

= 4 2 m 2 + m 3 = 4 2 ( 3 ) + 0 = 1 0

Вычислим дисперсии DU и DV по формуле (9.2):

D U = D 1 + ( 3 ) 2 D 2 + 2 ( 3 ) K 1 2 = 4 + 9 6 = 5 8

D V

= ( 2 ) 2 D 2 + D 3 + 2 ( 2 ) K 2 3 = 4 4 + 1 2 + 3 6 = 6 4

Рассчитаем корреляционный момент KUV по формуле (8.10):

K U V = M [U V ]m U m V .

32

Для этого определим математическое ожидание произведения величин U и V :

M [UV ] = M [( X1 3X 2 )(4 2 X 2 + X 3 )] =

= M [4 X1 2 X1 X 2 + X1 X 3 12 X 2 + 6 X 2 X 2 3X 2 X 3 ]= применяем (9.3) =

=4m1 2 M [X1 X 2 ]+ M [X1 X 3 ]-12m2 + 6 M [X 2 X 2 ]- 3 M [X 2 X 3 ]=

=применяем (9.5) и (9.5) =

=4m1 2(m1m2 + K12 ) + (m1m3 + K13 ) 12m2 + 6(m22 + D2 ) 3(m2m3 + K23 ) =

=8 +12 4 +36 +90 27 =115

Таким образом

K U V = M [U V ]m U m V = 1 1 5 1 1 1 0 = 5

Величину R U V определим по формуле (8.11):

RU V

=

K U V

=

5

 

= 0 .0 8 2 .

D U

D V

5 8

 

 

 

 

6 4

33

10. ОБРАБОТКА ОДНОМЕРНОЙ ВЫБОРКИ

Генеральной совокупностью опыта называется множество объектов, из которых производится выборка. Выборка - множество {x1 , x2 ,..., xn } случайно отобранных объектов (значений) из генеральной совокупности. Объемом выборки n называется число входящих в нее объектов.

Вариационным рядом называется выборка { x)1, x)2 ,..., x)n }, полученная в результате расположения значений исходной выборки в порядке возрастания.

Значения x)i называются вариантами.

Оценка закона распределения

Эмпирическая функция распределения случайной величины X равна частоте того, что X примет значение меньшее, чем аргумент функции x, и определяется формулой

0,

x x)1,

 

:

 

 

 

 

F*(x) = p*(X < x) =

i

, x)

< x

x)

(10.1)

 

n

i

 

i+1

:

x > x) .

 

1,

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

При n →∞ эмпирическая функция распределения F*(x) сходится по

вероятности к теоретической функции распределения F(x).

Интервальный статистический ряд вероятностей строится по исходной выборке, если анализируемая случайная величина Х является

непрерывной:

 

j

Aj

 

Bj

hj

νj

p *j

f j*

 

1

A1

 

B1

h1

ν1

p*

f *

 

 

 

 

 

 

 

1

1

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M

AM

 

BM

hM

νM

pM*

f *

 

 

 

 

 

 

 

 

M

Здесь j – номер интервала;

 

 

 

 

 

34

M – число непересекающихся и примыкающих друг к другу интервалов, на

которые разбивается диапазон значений [x)1 , x)n ] :

int

(

n ), n 100,

(10.2)

M

((

 

)

 

(

 

))

 

2 ÷ 4

lg

n

, n >100,

int

 

 

 

 

 

 

 

 

 

где int(x) - целая часть числа x . Желательно, чтобы n безостатка

Aj, Bj

 

 

 

 

 

 

 

 

делилосьна M;

j-го интервала (Aj+1 = Bj),

 

 

 

левая и правая границы

причем

 

 

 

 

 

 

 

 

A1 = x)1 , B M = x)n ;

 

 

 

 

hj = Bj - Aj – длина j-го интервала;

 

 

M

 

νjколичество чисел в выборке, попадающих в j-й интервал,

ν j

= n

 

 

 

 

 

 

 

 

 

 

 

 

 

j =1

 

p *j =

ν

 

j

 

– частота попадания в j-й интервал; m

p *j = 1 .

 

 

 

n

 

 

 

 

 

 

 

 

 

 

j =1

 

 

 

 

 

p*

 

 

 

 

ν

j

 

 

 

 

 

f j* =

 

 

j

 

=

 

 

– статистическая плотность вероятности в j-м интервале.

 

h j

 

 

 

 

 

 

 

 

 

 

nh j

 

 

 

 

При

построения интервального

статистического ряда

вероятностей

используют следующие методы разбиения диапазона значений на интервалы:

1) равноинтервальный, т.е. все интервалы одинаковой длины:

h

 

= h =

xn x)1

, j A

 

= x)

+( j 1)h, j =

 

(10.3)

j

j

2, M

M

 

 

 

1

 

 

 

2) равновероятностный, т.е. границы интервалов выбирают так, чтобы в каждом интервале было одинаковое число выборочных значений (необходимо, чтобы n безостаткаделилосьна M):

 

 

n

*

 

1

 

 

x( j 1)ν

+ x)( j 1)ν +1

 

 

 

 

 

 

 

 

 

 

 

 

 

ν j

= ν =

 

, p j

=

 

j A j

=

 

 

,

j = 2 , M

(10.4)

M

M

 

2

 

 

 

 

 

 

 

 

 

 

 

Гистограмма - статистический аналог графика плотности вероятности

f *(x) случайной величины, и она строится по интервальному статистическому ряду. Гистограмма представляет собой совокупность прямоугольников, построенных, как на основаниях, на интервалах hj статистического ряда с

высотой равной статистической плотности вероятности f j* в соответствующем интервале. Для равноинтервального метода все прямоугольники гистограммы

35

имеют одинаковую ширину, а для равновероятностного метода – одинаковую площадь. Сумма площадей всех прямоугольников гистограммы равна 1.

Точечные оценки числовых характеристик

Статистической оценкой Q* параметра Q распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке). Статистические оценки делятся на точечные и интервальные.

Точечной называется оценка, определяемая одним числом. Точечная оценка Q* параметра Q случайной величины X в общем случае равна

Q* =ϕ(x1, x2 ,..., xn ) , где xi – значения выборки. Очевидно, что оценка Q* – это случайная величина и значения Q* будут изменяться от выборки к выборке случайным образом. К оценкам предъявляется ряд требований.

1. Оценка Q* называется состоятельной, если при увеличении объема выборки n она сходится по вероятности к значению параметра Q:

Q

 

Q lim (P( Q

 

Q < ε )) = 1, ε > 0 .

 

*

p

 

 

*

 

 

 

 

n→∞

n→∞

 

 

 

 

 

 

 

 

 

 

 

Состоятельность – это минимальное требование к оценкам.

2. Состоятельная оценка Q* называется несмещенной, если ее

математическое ожидание точно равно параметру Q для любого объема

выборки:

 

 

 

 

 

 

 

 

 

 

M [ Q * ] = Q , n .

3. Состоятельная несмещенная оценка Q* является эффективной, если ее

дисперсия минимальна по отношению к дисперсии любой другой оценки этого параметра:

D Q * = min .

Состоятельная, несмещенная и эффективная точечная оценка математического ожидания вычисляется как среднее арифметическое значений выборки x , называемое выборочным средним:

36

m *X

=

x

=

1

n

x i

(10.5)

 

 

 

 

n

i =1

 

 

Состоятельная несмещенная точечная оценка дисперсии равна:

D X* = S 02 =

1

n (xi x )2

=

1

n

xi2

n

x 2

(10.6)

n 1

 

n 1

 

i =1

 

n 1 i =1

 

 

 

Состоятельная несмещенная точечная оценка среднеквадратического

отклонения равна:

 

 

 

 

 

 

 

 

 

 

 

σ*X = S0 =

S02

 

 

 

 

(10.7)

Интервальные оценки числовых характеристик

Доверительным называется интервал

I γ (Q ) = (Q * ε ; Q * + ε ) ,

где Q* - несмещенная точечная оценка параметра Q,

в который с заданной вероятностью (надежностью) γ попадают истинное значения параметра Q. Вероятность γ выбирается близкой к 1: 0,9; 0,95; 0,975; 0,99.

Согласно центральной предельной теореме, при достаточно большом объеме выборки n ( n > 20 ÷50 ) закон распределения несмещенных точечных оценок m*X и DX* можно считать нормальным при любом законе распределения случайной величины и доверительные интервалы для математического ожидания и дисперсии могут быть определены по следующим формулам.

Доверительный интервал для математического ожидания имеет вид

 

 

 

 

 

 

 

 

 

S

0

 

 

 

S0

zγ

 

 

 

 

 

 

 

 

Iγ (mX

) =

x zγ

 

 

; x

+ zγ

 

 

 

 

 

,

 

 

(10.8)

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доверительный интервал для дисперсии имеет вид

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

2

2

 

 

 

2

 

2

 

 

 

 

 

Iγ

( D X ) =

S0

zγ

 

 

 

 

S0

; S0

+ zγ

 

 

 

S

0

,

(10.9)

 

 

 

 

n 1

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

zγ

= arg Φ(

γ )

- значение аргумента функции Лапласа, т.е. Ф(zγ) =

γ .

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

37

Проверка статистических гипотез

Статистической гипотезой называется всякое непротиворечивое мно-

жество утверждений {Н0, Н1, , Hk-1} относительно свойств распределения случайной величины. Простейшей гипотезой является двухальтернативная: {H0, H1}. В этом случае альтернативу H0 называют нулевой гипотезой, а H1-

конкурирующей гипотезой.

Критерием называется случайная величина U =ϕ (x1,K, xn ),где xi

значения выборки, которая позволяет принять или отклонить нулевую гипотезу H0 .Ошибка первого рода состоит в том, что будет отклонена гипотеза H0, если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости. Наиболее часто на практике принимают, что α = 0,05 или α = 0,01.

Критериями согласия называются критерии, используемые для проверки гипотез о предполагаемом законе распределения.

Гипотеза о законе распределения выдвигается следующим образом.

1. Построить по вариационному ряду график эмпирической функции распределения F*(x) и по интервальным статистическим рядам

(равноинтервальному и равновероятностному) гистограммы. Для наглядности соединяем плавной линией середины верхних линий прямоугольников гистограмм.

2. По виду графиков выдвинуть двухальтернативную гипотезу о предполагаемом (гипотетическом) законе распределения:

H0

- величина X распределена по такому-то закону:

 

f(x) = f0(x),

F(x) = F0(x)

H1

- величина X не распределена по такому-то закону:

 

f(x) f0(x),

F(x) F0(x)

где f0(x), F0(x) - плотность и функция распределения гипотетического закона распределения.

38

График эмпирической функции распределения F*(x) должен быть похож на график функции распределения F0(x) гипотетического закона, а

гистограммы на график плотности гипотетического распределения f0(x). Ниже приведены графики и аналитические выражения плотности и функции распределения для часто встречающихся на практике законов.

Равномерное распределение имеет непрерывная случайная величина Х,

если ее плотность вероятности в некотором интервале [а; b] постоянна:

 

0 , x < a ,

 

 

 

0 , x < a ,

 

 

 

 

 

1

 

 

 

 

 

 

 

a

 

 

 

 

f ( x ) =

 

 

, a

x b ,

F ( x ) =

x

, a

x

b ,

 

 

 

 

 

 

 

 

 

(10.10)

 

a

b

a

 

b

 

 

 

 

 

 

 

 

 

 

0 , x > b .

 

 

 

1 , x > b .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где а, b – параметры распределения (b >a).

Графики плотности и функции равномерного распределения при a =1 и b=3:

Экспоненциальное распределение имеет непрерывная случайная величина T, принимающая только положительные значения, если ее плотность вероятности и функция распределения равны:

 

 

λ t

 

 

 

 

λ t

 

 

 

f ( t ) =

λ e

, t

0 ,

F (t ) = 1 e

, t

0 ,

 

 

 

(10.11)

 

0 , t < 0 .

 

0 , t < 0 .

 

где λ параметр распределения (λ >0).

Графики плотности и функции экспоненциального распределения при λ =1:

39

Нормальное распределение (распределение Гаусса) имеет непрерывная случайная величина Х, если ее плотность вероятности и функция распределения равны:

f (x ) =

 

1

 

 

(x m)

2

 

 

 

exp

 

, F ( x )

 

 

 

σ

2π

 

2σ 2

 

 

где m, σ - параметры распределения ( σ >0),

 

1

 

x

t2

 

 

 

 

Φ(x) =

 

e

 

dt — функция Лапласа.

 

2

2π

 

0

 

 

 

 

 

 

=

0 .5 + Φ

 

x m

 

, (10.12)

 

 

 

σ

 

 

 

 

 

Графики плотности и функции нормального распределения при m =0, σ =1:

3. Вычислить точечные оценки математического ожидания x и дисперсии S02

и, используя метод моментов, определить оценки неизвестных

параметров

Q1, ...,

Q)s гипотетического закона распределения, где s 2 - число неизвестных

параметров гипотетического закона распределения.

 

Оценки неизвестных параметров а, b равномерного распределения можно

определить по формулам:

 

 

 

 

a) = x 3 S0 ,

 

b = x + 3 S0

(10.13)

или

 

 

 

 

a) = x) ,

b = x)

(10.14)

 

1

 

n

 

где x , x) - первое и последнее значение вариационного ряда соответственно.

1

n

 

 

 

Оценку неизвестного параметра λ экспоненциального распределения

можно определить по формуле:

 

 

 

 

)

1

 

 

 

λ =

 

 

(10.15)

 

x

 

 

 

40

Соседние файлы в предмете Теория вероятностей и математическая статистика