Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

bardushkin

.pdf
Скачиваний:
14
Добавлен:
05.06.2015
Размер:
2.66 Mб
Скачать

 

 

0, x 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

k

 

 

k

 

 

 

 

 

 

Г

1

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

f F x

 

 

 

 

 

 

 

k

 

 

1

 

 

x 2

1

 

 

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

, если x 0

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

k

k

 

 

 

k

 

k

 

 

 

k

 

 

 

 

 

 

 

2

 

 

2

 

2

 

 

 

 

 

 

1

 

 

 

 

Г

 

1

 

Г

 

 

 

 

 

 

k1

 

 

2

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

2

 

, k

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

F

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F–распределение определяется двумя параметрами k1 и k2 и существует таблица квантилей.

F

k

 

, k

 

 

 

1

 

 

 

 

 

 

k

, k

 

 

1 p

 

1

 

2

F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

1

 

2

 

.

f

(x)

 

F

x

Лекция № 18 Глава 9

Предельные теоремы теории вероятностей

§ 1. Неравенства Чебышева. Закон больших чисел.

Следующие два неравенства называют неравенствами Чебышева. Сформулируем их в виде теорем.

Т е о р е м а : x 0 имеют место неравенства:

P

X

 

x

M

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

D X

 

P

 

 

 

 

 

 

 

 

X mX

 

 

x

 

.

 

 

 

 

 

 

x

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о :

 

X

 

Разложим

в сумму двух слагаемых

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X X I X x X I X x X I X x x I X x x I X x X

M I P X

X x M X

x M X ,

так как x > 0, получаем

P X

x

M

 

X

 

x

 

.

X m

X

 

 

2

 

x

2

X m

X

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P X m

 

 

 

 

 

 

 

 

 

 

 

M X m

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

2

 

 

 

2

2

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

x

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

X m

X

 

 

x

D X

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Замечание.

Очень часто второе неравенство Чебышева дают в такой форме

P

X mX

 

x 1

D X

.

 

 

x

2

 

 

 

 

 

 

 

 

 

 

 

Второе неравенство Чебышева показывает, что при малой дисперсии с вероятностью близкой к 1 СВ Х концентрируется около своего МО.

Т е о р е м а (Чебышева):

Если

:

X

, X

2

,..., X

n

1

 

 

независимы и существует С > 0, такая что

D X K

C

, К = 1, 2, …, n, тогда

x 0

 

X

1

X

n

 

M X

M X

n

 

 

lim P

 

 

1

 

 

x 0

 

n

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о :

Рассмотрим Yn X1

... X n

Y

 

M Y

n

 

 

 

1 P

n

 

 

 

x 1

n

n

 

 

 

 

 

 

 

 

и применим к СВ

Yn

второе неравенство Чебышева.

n

 

 

Y

 

 

D

n

 

 

n

 

 

 

.

x

2

 

 

 

 

 

 

1 P ... 1

D Y

 

 

 

 

n

 

.

n

2

x

2

 

 

 

 

 

 

В силу аддитивного свойства дисперсии, получаем

1 P ... 1

D X

1

... D X

n

 

1

 

n c

 

 

 

 

 

 

 

 

 

 

 

 

 

2

x

2

 

 

2

x

2

 

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

1 P ... 1

c

 

 

 

 

 

 

 

 

 

 

 

 

n x

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

1

X

n

lim

P

 

 

 

 

n

 

n

 

 

 

 

 

 

X1

X n

lim

P

 

 

 

 

 

 

n

 

n

 

 

 

 

M X

M X

n

 

1

 

 

 

n

 

 

M X1 M X n n

x

x

1

,

0 .

Следствие:

 

 

 

 

 

 

 

Если

X1

, X

2 ,..., X n независимы и одинаково распределены, т.е.

1, …, n, тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

X

1

X

n

 

 

 

 

 

 

 

 

 

 

lim

P

 

 

 

 

a

 

x

1,

x 0 .

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M X K a , а

D X K

2

, где k=

Замечание.

Предельные утверждения, сформулированные в теореме Чебышева и следствии к этой теореме носят название закона больших чисел (ЗБЧ). ЗБЧ утверждает, что с вероятностью приближающейся при n к 1, среднее арифметическое независимых слагаемых при определенных условиях становятся близким к константе.

Из утверждения последнего следствия получаем ЗБЧ в схеме Бернулли.

Т е о р е м а (Бернулли):

Пусть n

– число успехов при n независимых испытаниях с вероятностью 0 < p < 1 в каждом испытании,

тогда x 0 :

 

 

 

 

 

n

p

 

 

 

 

 

lim P

 

 

 

x 1 .

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о :

Представим n в виде суммы независимых СВ n X1 ... X n , где X i 1, или при i-ом испытании произошел успех и X i 0 , если при i-ом испытании произошел неуспех.

M X i p .

Применяя следствие к теореме Чебышева, получаем утверждение к теореме Бернулли.

§ 2. Понятие о теореме Ляпунова. Формулировка центральной предельной теоремы

(ЦПТ).

Известно, что нормально распределенные СВ широко распространены на практике, объяснение дал Ляпунов (ЦПТ).

Если СВ Х представляет собой сумму очень большого числа взаимно независимых СВ влияние каждой из которых на всю сумму ничтожно мало, то СВ Х имеет распределение близкое к нормальному.

Приведем формулировку ЦПТ без доказательства.

Т е о р е м а (ЦПТ):

ные

Если СВ в последовательности X n , n = 1, 2, … независимы, одинаково распределены и имеют конеч-

mX

 

m , DX

 

 

2

, то

x R :

 

 

 

 

 

 

 

 

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

t

2

 

 

 

P Yn x lim

 

 

x x

1

 

 

 

 

 

lim

 

n

 

 

e

2

dt ,

 

 

 

 

FY

 

 

 

n

 

 

n

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

X

1

X

n

 

 

 

n

m

Y

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

n

 

– стандартизованное среднее арифметическое, n-независимых СВ в последова-

тельности.

Замечание Следствиями ЦПТ являются локальная и интегральная теоремы Муавра-Лапласса.

Критерий

 

2

и его применение.

 

Критерий

 

2

применяется в частности для проверки гипотез о виде распределения генеральной сово-

 

купности.

 

 

 

Процедура применения критерия 2 для проверки гипотезы H0, утверждающей, что СВ Х имеет закон

распределения

FX x состоит из следующих этапов.

Этапы:

 

 

 

1.

По выборке найти оценки неизвестных параметров предполагаемого закона FX x .

2.

Если Х–СВДТ – определить частоты ni , i = 1, 2, …, r, с которым каждое значение встречается в

выборке.

Если Х–СВНТ – разбить множество значений на r – непересекающихся интервалов 1, ..., 2 и попав-

 

r

 

 

 

 

ших в каждый из этих интервалов

ni n .

i 1

 

3. Х–СВДТ вычислить pi . Х–СВНТ вычислить pi P X i .

r

i 1

4.

p

i

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

n

 

np

 

 

2

 

2

 

i

i

 

b

 

 

np

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

1

 

 

 

.

5.Принять статистическое решение.

2 2 r l 1 – гипотеза Н – принимается. b 1 0

2 2 r l 1 – гипотеза Н – отклоняется. b 1 0

e – количество оцениваемых параметров. Малочисленные частоты надо будет объединять.

Проверка гипотезы о равномерном распределении генеральной совокупности. n = 200

А;

(xi-1, xi)

ni

 

 

 

 

 

=0,05

1

2

– 4

21

2

4

– 6

16

x 12,31

3

6

– 8

15

~

5,81

4

8 – 10

26

 

5

10

– 12

22

 

6

12

– 14

14

 

7

14

– 16

21

 

8

16

– 18

22

 

9

18

– 20

18

 

10

20

– 22

25

 

1.

 

 

 

~

 

~

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

x

 

 

 

 

~

x

~

 

~

2,26

 

 

 

 

2

 

 

 

 

 

 

a

3

a

 

 

 

~

~

2

 

~

x

~

 

~

22,36

 

 

 

 

 

 

~

 

 

 

 

b

3

a

 

b a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

0,05

 

 

 

~

~

 

 

f * b a

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

2. npi 200pi

 

1

 

4

 

 

 

n

 

 

 

dx 17,3

np

 

 

0,05

 

 

2,26

 

 

 

 

6

 

 

 

np2

n 0,05 dx 20

 

 

4

 

 

 

np

2

np

... np 20

 

3

 

 

 

9

 

 

 

22,36

 

 

np10 n

 

0,05 dx 23,6

 

 

 

 

20

 

 

n

i

np

 

i

21

17,3

16

20

 

 

2

7, 17

 

 

b

k = 10 – 2 – 1 = 7

 

2

7 14,1

0,95

 

 

 

7

2

2

 

 

 

 

0,95

 

0,95

 

n

 

np

 

 

2

i

i

 

 

 

 

 

 

 

np

 

 

 

 

 

1

 

 

 

 

 

0,79

 

 

 

 

 

0,8

 

 

 

– нет основания отвергать гипотезу о том, что выборка взята из генеральной совокуп-

ности и имеет равномерное распределение.

Лекция № 19 Глава 10

Элементы математической статистики

§ 1. Задачи математической статистики. Установления закономерностей, которым подчинены массовые случайные явления основано на изучении методами теории вероятностей статистических данных (результатов наблюдений

1. Задача математической статистики

Указать способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально составленных экспериментов.

2. Задача математической статистики

1) Разработать методы анализа статистических данных в зависимости от целей исследования:

-оценка неизвестной вероятности событий;

-оценка неизвестной функции распределения;

-оценка параметров распределения, вид которого известен;

-оценка зависимости СВ от одной или нескольких других СВ.

2) Проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения вид, которого известен.

Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

§ 2. Выборка и способы ее представления

Математическая статистика позволяет получить обоснованные выводы о параметрах, видах распределений и других свойствах СВ о конечной совокупности наблюдений над этими величинами.

Выборка понимается следующим образом. Пусть СВ Х наблюдается на каком либо эксперименте, повторим этот эксперимент n раз при одинаковых условиях. Получаем X1, X 2 ,..., X n , где каждая X j – СВ со-

ответствующая j-му эксперименту. Очевидно, что X j – независимые в совокупности СВ, причем каждая из этих СВ имеет один и тот же закон распределения, что и СВ Х.

О п р е д е л е н и е .

Закон распределения СВ Х называется распределением генеральной совокупности.

СВ вектор X1,..., X n называется выборочным вектором, а конкретные числа x1, x2 ,..., xn , получаемые

на практике при n кратном повторении эксперимента в неизменных условиях представляет собой реализацию выборочного вектора и называются выборкой объема n.

Что такое вариационный ряд, размах выборки, статистический ряд, группированный статистический ряд, частоты, относительные частоты, накопленные частоты, относительные накопленные частоты, всевозможные полигоны и гистограммы, а также, что такое эмпирическая функция распределения изучили самостоятельно.

§ 3. Числовые характеристики выборки

Пусть x1, x2 ,..., xn выборка объема n из генеральной совокупности с функцией распределения FX x .

Рассмотрим выборочное распределение, т.е. распределение дискретной СВ, принимающей эти значения

с вероятностями, равными

1 n

. Соответственно числовые характеристики этого выборочного распределения

называют выборочными (эмпирическими) числовыми характеристиками.

Замечание.

Выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности.

“~” – при обозначении этих числовых характеристик.

~

 

n

 

 

 

 

pi xi

m X x

 

 

i 1

 

 

 

~

n

 

x

2

 

 

 

 

D X xi

 

 

i 1

 

 

 

1 n

p

i

 

 

 

n

 

 

i 1

1

 

n

 

xi

n

i 1

.

x

 

x

 

 

2

 

i

 

.

~

X

 

1

 

i

 

 

 

 

 

i

 

 

x 2

 

 

 

 

 

 

 

 

 

 

D

 

 

x

 

 

 

 

 

 

 

 

 

 

 

n

 

 

x 2 2x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2n x

2

nx

2

 

 

 

 

 

2

n x

2

.

 

 

 

n

xi

 

 

 

n

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d X

– унимодального, т.е. одновершинного распределения называется элемент выборки, встречаю-

щийся с наибольшей частотой.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

Выборочной медианой называется

hX

, которое делит вариационный ряд на две части, содержащие

равное число элементов.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если n – нечетное число, т.е. n = 2l+1, то

~

x

l 1

.

 

 

 

 

hX

 

 

 

 

 

 

Если n – четное число, т.е. n = 2l, то

~

 

1

x

l

x

l 1

.

 

 

hX

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Можно доказать, что выборочные начальные

~

и центральные

~

моменты порядка s для негруппи-

S

S

рованных выборок объема и определяются по следующим формулам

1n

~S

S n i 1 xi

~

1

n

 

xi x

S

S

n

 

 

i 1

 

 

 

 

.

Форма распределения СВ

 

 

 

 

~

 

 

 

 

~

 

 

 

 

3

~

 

a

X

D

 

 

e

X

 

 

~

 

3 / 2

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

характеризуется выборочными коэффициентами асимметрии и эксцесса.

~

 

 

 

 

4

 

3 .

D

 

 

 

 

~

 

 

2

 

 

X

 

 

§ 4. Статистическое описание и вычисление оценок параметров распределения системы двух СВ

Пусть исход некоторого эксперимента описывается двумя СВ (X; Y).

Предварительное представление о зависимости между X и Y можно получить, нанося элементы двумер-

ной выборки xi , yi ,

i 1,..., n , в виде точек на плоскость с выбранной системой координат. Такое пред-

ставление называется диаграммой рассеяния.

О п р е д е л е н и е .

Распределением двумерной выборки называется распределение двумерного дискретного СВ случайного

вектора, принимающего значения

x

i

, y

i

 

 

 

 

с вероятностями

1 n

.

Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного дискретного случайного вектора. Если объем выборки небольшой, то тогда вычисления проводятся в следующей последовательности:

1. xi , yi , xi2 , yi2 , xi yi , xi yi 2 .

Контроль xi yi 2 xi2 2 xi yi yi2 .

2. Суммы квадратов отклонений от среднего и произведения отклонений от среднего

Qx xi x 2 xi2 xi 2 n

Qy yi y 2 yi2 yi 2 n

Q

xy

 

 

 

3.

x

 

 

~

 

DX

xi

xi

n

Qx n

x yi y xi yi

y

yi

 

n

 

 

~

 

Qy

DY

 

n

 

 

x

 

 

i

 

 

 

n

 

yi

.

~

QXY

.

~

QXY

K XY

n

XY

Q

 

Q

 

 

 

X

 

 

 

 

Y

 

 

 

 

 

§ 5. Линии регрессии

Для СВ X и Y.

.

Регрессией Y на X называется условное МО

M Y X

x

x

.

x

используется для предсказания значения СВ Y по фиксированному значению СВ X.

Если M Y X x 0 1x , то говорят о линейной регрессии Y на X. y 0 1x – прямая регрессии.

Оценки параметров линейной регрессии по выборке xi , yi , где i 1,..., n

МНК из условия минимума суммы

, можно получить, используя

 

 

 

 

 

 

 

n

Q 0 , 1

 

 

 

 

 

 

 

i 1

 

~

 

 

Qxy

 

 

1

 

 

 

 

 

 

Qx

 

 

 

 

 

 

 

 

~

 

 

 

~

 

 

0

y 1 x

 

 

~

 

~

x

y

0

 

 

 

 

1

 

yi 0 1 xi

2

.

 

– выборочные коэффициенты регрессии.

 

~

 

 

~

D

x x .

Y

y y XY

~

 

 

D

X

 

 

 

 

Выборочная линейная регрессия Y на X. Аналогично рассматривается X на Y.

~~

0 , 1

 

 

~

 

~

y

 

 

 

x

 

 

 

 

 

 

 

0

 

 

1

 

 

 

 

 

~

 

Q

XY

~

 

~

y .

 

 

 

 

 

 

 

 

 

x

1

 

Q

 

0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

~

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

XY

 

 

 

 

 

Обе прямые регрессий пересекаются в точке с координатами x, y .

Угол между этими двумя прямыми уменьшается при увеличении коэффициента корреляции.

~

 

 

 

 

 

 

При XY 1 обе прямые совпадают.

 

 

Замечание.

 

 

 

 

 

 

~

~

~

 

~

 

 

Прямые y 0

1

 

 

y

x и x 0

1

должны быть различны.

~

~

x

y

0

 

 

1

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]