Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Конспект часть 1 (1)

.pdf
Скачиваний:
14
Добавлен:
07.03.2015
Размер:
397.42 Кб
Скачать

ные точки соединяются отрезками прямых. Такая фигура называется многоуголь-

ником распределения.

Представление закона распределения в виде таблицы или многоугольника

распределения возможно только для дискретной случайной величины. Для не- прерывной величины такой характеристики построить нельзя, поскольку она име- ет бесчисленное множество возможных значений, сплошь заполняющих некото-

рый промежуток. Для количественной характеристики этого распределения ис-

пользуют не вероятность события Х=х0, а вероятность события Х<x0., где x0. – не- которая текущая переменная. Вероятность этого события зависит от x0. и являет- ся функцией от x0. Эта функция называется функцией распределения случайной

величины Х и обозначается F(x).

F(x) = P(X < x).

(3.2)

Функцию распределения F(x) называют также интегральной функцией распре- деления или интегральным законом распределения.

Функция распределения самая универсальная характеристика случайной величины. Она существует для дискретных и непрерывных величин. Функция рас-

пределения полностью характеризует случайную величину с вероятностной точки зрения и является одной из форм закона распределения. Основные свойства функции распределения:

1. Функция распределения неубывающая величина,

При х2>x1 F(x2F(x1).

2.На «минус бесконечности» функция распределения равна нулю.

F(- ¥) = 0 .

3.На «плюс бесконечности» функция распределения равна единице.

F(¥) = 1.

Это означает, что случайная величина Х может принимать значение «- » с вероятностью, равной нулю. Значение случайной величины Х с вероятно-

стью 1 находятся в пределах − ∞ < X < ∞ .

График функции распределения F(x) в общем случае представляет собой график неубывающей функции, значения которой начинаются от 0 и доходят до 1, причем в отдельных точках функция может иметь скачки, то есть разрывы.

13

F(x)

F(x)

1

1

a)

б)

х

 

 

х

 

Рис.3.1. Общий вид функции распределения непрерывной (а) и

дискретной (б) случайной величины

Общий вид функции распределения показан на рис.3.1. Функция распределе-

ния любой дискретной случайной величины всегда есть разрывная ступенчатая

функция, скачки которой всегда происходят в точках, соответствующих возмож- ным значениям случайной величины, и равны вероятностям этих значений. Сумма

всех скачков равна единице.

По мере увеличения числа возможных значений и уменьшения интервалов между ними число скачков становится больше, а сами скачки меньше; ступенча- тая кривая становится более плавной. Случайная дискретная величина прибли-

жается к непрерывной, а ее функция распределения к непрерывной функции.

При решении практических задач, связанных со случайными величинами, ча- сто необходимо вычислить вероятность того, что случайная величина будет нахо- диться в интервале α ≤ X < β . Условимся левый конец неравенства включать в

интервал, а правый не включать. Рассмотрим три события:

 

событие А

X < α ,

 

 

событие В

X < β ,

 

 

событие С

α ≤ X < β .

 

 

По теореме сложения вероятностей

P(B) = P(A)+ P(C)

 

или

P(X < β ) = P(X < α )+ P(α ≤ X < β ),

 

откуда

F(β ) = F(α )+ P(α ≤ X < β )

 

или

P(α ≤ X < β ) = F(β )F(α ) .

(3.3)

Вероятность попадания случайной величины на заданный участок равна при- ращению функции распределения на этом участке.

14

Будем неограниченно уменьшать участок (α,β ), предполагая, что β → α . В

пределе вместо вероятности опадания на участок получим вероятность того, что случайная величина Х примет отдельно взятое значение α.

P(X = α ) = lim P(α ≤ X < β ) =

lim [F(β )F(α )] .

(3.4)

β →α

β →α

 

Значение этого предела зависит от того, непрерывна ли функция F(x) в точке

х=α или же терпит разрыв. Если существует разрыв, то предел равен значению

скачка. Если функция непрерывна, то этот предел равен нулю. Отсюда следует,

что вероятность любого отдельного значения непрерывной случайной величины равна нулю.

Таким образом, обладать нулевой вероятностью могут не только невозмож-

ные, но и возможные события. Событие Х=α возможно, но вероятность его равна нулю.

Если производится опыт, в котором непрерывная случайная величина Х должна принять одно из возможных своих значений, то до опыта вероятность каждого из этих значений равна нулю. Однако в опыте случайная величина непременно примет одно из своих возможных значений, то есть произойдет одно из событий, вероятность которых равна нулю.

Частота события при большом количестве опытов не равна, а только прибли-

жается к вероятности. Из того, что вероятность события X=α равна нулю, следует

только, что при неограниченном повторении опыта это событие будет появляться

сколь угодно редко.

Рассмотрим отношение вероятности попадания случайной величины Х на

участок от х до х+ х к длине этого участка, то есть среднюю вероятность, прихо-

дящуюся на единицу длины на этом участке. При стремлении

х к нулю в пределе

получим производную от функции распределения

 

f (x) = lim F(x +

x)F(x) .

(3.5)

x0

x

 

Функция f(x) характеризует плотность, с которой распределены значения слу-

чайной величины в данной точке. Эта функция называется плотностью распреде- ления случайной величины Х. Ее также называют плотностью вероятности или

дифференциальной функцией распределения. Кривая, изображающая плотность распределения случайной величины, называется кривой распределения. Вид кри- вой распределения изображен на рис.3.2.

15

f(x)

х

0 х dх

х

Рис.3.2. Общий вид плотности распреде-

ления случайной величины

Вероятность попадания слу-

чайной величины Х на элементар-

ный участок шириной x, x+dx равна f(x)dx. Величина f(x)dx называется элементом вероятности. Геомет- рически это площадь элементар-

ного прямоугольника, опирающе-

гося на отрезок dx.

Вероятность попадания величины X на отрезок от a до b равна сумме элемен- тов вероятности на этом участке, то есть интегралу

P(α < X < β ) = βòf (x)dx .

(3.6)

α

 

Геометрически вероятность попадания величины Х на участок (a, b) равна площади под кривой распределения на этом участке.

Функция распределения связана с плотностью распределения зависимостью

F(x) = xò f (x)dx .

(3.7)

−∞

 

Геометрически значение функции распределения равно площади под кривой распределения, лежащей левее точки х. Основные свойства плотности распреде- ления:

1.Плотность распределения есть неотрицательная функция, f(x)³0.

2.Интеграл в бесконечных пределах от плотности распределения равен

единице

+∞

òf (x)dx = 1.

Геометрически основные свойства плотность означают, что вся кривая плот-

ности распределения лежит не ниже оси абсцисс и полная площадь под кривой равна единице.

функция распределения, как и вероятность, есть величина безразмерная.

Размерность плотности распределения обратна размерности случайной величи-

ны.

16

Лекция 4. ЧИСЛЕННЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Во многих практических вопросах нет необходимости использовать полную характеристику случайной величины в виде закона распределения. Обычно удоб-

нее пользоваться отдельными числовыми параметрами, отражающими основные свойства случайной величины.

Параметрами, определяющими положение случайной величины на числовой оси, служат характеристики положения. Главной из них является математическое ожидание случайной величины, равное сумме произведений всех возможных зна- чений случайной величины на вероятность этих значений. Это средневзвешенное

значение случайной величины или теоретическое среднее арифметическое всех возможных значений. Для дискретной случайной величины математическое ожи-

дание определяется по формуле

n

 

mx = åxi pi ,

(3.8)

i =1

для непрерывной по формуле

+∞

mx = ò x f (x)dx

−∞

.

(3.9)

Следующей характеристикой положения случайной величины является мода, соответствующая наиболее вероятному значению случайной величины. Величину моды легко найти по кривой распределения, выбрав значение случайной величи-

ны, имеющее максимальную плотность распределения.

Довольно часто применяется в качестве характеристики положения медиана случайной величины. Ее значение определяется из условия, что вероятности по- явления значений случайной величины больше и меньше медианы равны 0,5. Ма-

тематически это условие можно записать в виде

P(X < Me ) = P(X > Me ) ,

 

F(Me ) = 0,5 .

 

f(x)

 

Ме

х

F(x)

 

1

 

0,5

 

Ме

х

17

Медиана делит площадь под кривой распределения пополам, Значение функ-

ции распределения от медианы равно 0,5.

Следующие параметры относятся к характеристикам рассеивания случайной

величины относительно математического ожидания.

Наиболее важной характеристикой рассеивания случайной величины являет- ся дисперсия случайной величины, равная математическому ожиданию разности

квадратов случайной величины и ее математического ожидания. Для вычисления дисперсии используются формулы:

для дискретной случайной величины

Dx = ån (xi mx )2pi ,

(3.10)

i =1

 

для непрерывной

 

Dx = +∞ò(x mx )2f (x)dx .

(3.11)

−∞

 

Дисперсия случайной величины имеет размерность квадрата случайной вели- чины. Для наглядной характеристики рассеивания удобнее пользоваться величи-

ной, размерность которой совпадает с размерностью случайной величины. Для

этого из дисперсии извлекают квадратный корень. Полученная величина называ- ется средним квадратичным отклонением случайной величины.

σ x =

Dx

.

(3.12)

Математическое ожидание mx и дисперсия Dx или среднее квадратичное от- клонение σх характеризуют наиболее важные черты распределения: его положе- ние и степень разбросанности. Довольно часто ограничиваются только этими двумя показателями.

Для характеристики асимметрии применяется коэффициент асимметрии, рас-

считываемый по формулам

 

 

1

 

n

 

3

 

Sk =

 

 

 

å

(xi m x ) pi

 

 

 

 

 

 

 

σ3x i=1

 

 

 

1

 

+∞

3

 

Sk =

 

 

ò

(x m x ) f(x)dx

 

σ3

или

 

 

x

−∞

.

18

Sk1

>0

 

 

 

 

f(x)

1

 

 

 

 

 

 

Sk1

>0

 

 

 

2

 

 

 

Sk2

<0

 

 

 

 

 

 

 

 

 

x

 

 

m1

m2

 

 

Для характеристики крутости распределения используется эксцесс, рассчиты-

ваемый по формулам

 

 

1

n

 

4

Ex

=

 

å

(xi m x ) pi 3

 

 

 

σ4x i=1

 

 

 

1

+∞

4

Ex =

 

ò

(x mx ) f(x)dx 3

σ4

 

 

или

 

x

− ∞

.

Число 3 вычитается из отношения математического ожидания отклонений

четвертой степени к среднему квадратичному потому, что для нормального закона распределения, наиболее распространенного в природе, это отношение равно 3.

19

Лекция 5. СТАТИСТИЧЕСКИЕ ФУНКЦИЯ И ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ

Теория вероятностей имеет дело с теоретическими величинами, такими, как вероятности событий, математическое ожидание, законы распределения случай- ных величин, дисперсии. На практике приходится иметь дело с реальными вели-

чинами, полученными в результате опыта. Это средние арифметические, частота событий и т.д. Вопросами обработки экспериментальных данных, анализа явле-

ний по полученным результатам при массовых явлениях занимается математиче- ская статистика.

Теория вероятностей предполагает, что при изучении случайных величин мы

можем в результате опыта получить какое-либо значение случайной величины из совокупности возможных значений. Эта совокупность называется генеральной со-

вокупностью. Для непрерывной случайной величины генеральная совокупность ее возможных значений бесчисленна, для дискретной величины она может быть так-

же не ограничена или иметь чрезвычайно большое количество возможных значе- ний.

В результате проведения опытов мы получаем только несколько значений случайной величины, может быть достаточно большое количество, но всегда ограниченное. Эти значения, выбранные случайным образом из генеральной со- вокупности, образуют выборочную совокупность значений. Совершенно очевидно,

что характеристики выборочной совокупности могут отличаться от характеристик

генеральной совокупности. Однако при увеличении количества опытов (объема выборки) параметры выборочной совокупности будут приближаться к характери-

стикам генеральной совокупности: среднее арифметическое к математическому

ожиданию, частота к вероятности и т.д.

Таким образом, теория вероятностей имеет дело с объектами из генеральной совокупности, математическая статистика - с объектами из выборочной совокуп-

ности. По аналогии с теорией вероятности в математической статистике исполь- зуются те же определения (дисперсии, моменты), но относящиеся к выборочной

совокупности.

Предположим, что изучается некоторая случайная величина Х, закон распре-

деления которой в точности не известен, и требуется определить этот закон из

опыта или проверить экспериментально гипотезу о том, что величина Х подчиня-

ется тому или иному закону. С этой целью над случайной величиной Х проводится ряд независимых опытов, в которых она принимает определенные значения хi Со-

вокупность значений представляет собой первичный статистический материал,

20

подлежащий обработке и анализу. Такая совокупность называется «простой ста-

тистической совокупностью» или «простым статистическим рядом».

Обычно простая статистическая совокупность оформляется в виде таблицы, в

первом столбце которой стоит номер опыта, а во втором - наблюдаемое значение случайной величины. Такая таблица является первичной формой записи и в дальнейшем может быть обработана различными способами. Наиболее просто

построить статистическую функцию распределения случайной величины.

По аналогии с теорией вероятности статистической функцией распределения

F*(xi) случайной величины X называется частота события появления значений ве- личины Х<xi.

F * (xi ) = P(X < xi ).

(3.13)

Для того, чтобы найти значение статистической функции распределения при

данном xi, необходимо подсчитать число опытов, в которых случайная величина Х приняла значение, меньшее, чем xi, и разделить это количество на общее число произведенных опытов.

Статистическая функция распределения любой случайной величины (прерыв- ной или непрерывной) представляет собой прерывную ступенчатую функцию,

скачки которой соответствуют наблюденным значениям случайной величины и по величине равны частотам этих значений. Если каждое отдельное значение слу-

чайной величины наблюдалось только один раз, то скачок статистической функ-

ции распределения в каждом наблюденном значении будет равен 1n , где n - чис-

ло наблюдений.

Согласно теореме Бернулли при увеличении числа опытов n частота события

Х<xi для любого xi сходится по вероятности к вероятности этого события. Следо-

вательно, при увеличении n статистическая функция распределения будет при- ближаться к подлинной функции распределения F(x) случайной величины Х.

Если Х - непрерывная случайная величина, то при увеличении числа наблюдений n число скачков функции F*(x) будет увеличиваться, а сами скачки уменьшаться.

График функции F*(x) приблизится к плавной кривой F(x).

В принципе построение статистической функции распределения полностью

решает задачу экспериментального описания материала. Однако при большом

числе опытов построение F*(x) трудоемко. Кроме того, во многих случаях оказы- вается более удобным представить результаты в виде, аналогичном плотности распределения случайной величины.

21

При большом числе наблюдений (порядка сотен) простая статистическая со-

вокупность становится слишком громоздкой. Для большей компактности на осно- вании простой статистической совокупности строится так называемый «статисти-

ческий ряд». Для этого весь диапазон наблюденных значений Х разбивается на интервалы, затем подсчитывается количество значений mi случайной величины Х,

попавших в каждый i-й интервал. Это число делится на общее количество наблю- дений n, в результате чего определяется частота событий попадания случайной величины в каждый интервал:

рi* = mni .

Сумма частот всех разрядов будет равна единице:

n

 

* = 1 .

å P

i =1

i

 

(3.14)

(3.15)

Таблица, в которой приведены разряды в порядке их расположения вдоль оси Х и соответствующие им частоты, называется статистическим рядом.

№ интервала

1

2

 

I

 

k

 

 

 

 

 

 

 

Ширина интервала

х1-х2

х2-х3

 

xi-xi+1

 

xk-xk+1

Частота попадания

P*1

P*2

 

P*i

 

P*k

Х в интервал

 

 

 

 

 

 

При группировке по разрядам значения величины Х, попавшие точно на гра-

ницы интервала, относят с половиной частоты попадания в каждый сопряженный

интервал.

Число разрядов, на которых группируется статистический материал, не долж- но ни быть слишком большим (тогда частоты будут случайным образом колебать- ся), ни слишком малым, чтобы не было слишком грубой оценки. Обычно ограни-

чиваются количеством интервалов k=10...20.

Длины интервалов могут быть одинаковыми или различными. Если плотность распределения очень неравномерна, то удобно выбирать в области высокой

плотности более узкие интервалы, а в области низкой плотности - более широкие. Далее предполагается, что внутри каждого интервала случайная величина

принимала только одно значение, равное среднему арифметическому границ ин- тервала:

 

 

i

=

xi + xi +1

.

(3.16)

x

 

 

 

 

 

2

 

 

22

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]