Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

6067

.pdf
Скачиваний:
1
Добавлен:
21.11.2023
Размер:
709.06 Кб
Скачать

-10-

Распределение непрерывной случайной величины нельзя задавать при помощи вероятностей отдельных значений. Число значений так велико, что для большинства из них вероятность принять эти значения равна 0, т. е. событие может произойти, а

вероятность его равна 0. Для непрерывных случайных величин изучается вероят-

ность того, что в результате опыта значение случайной величины попадет

внекоторую заранее намеченную совокупность чисел. Удобно пользоваться

вероятностью события Х< х, где х — произвольное действительное число,

а X

случайная величина. Эта вероятность является функцией от х:

 

p(X<x)=F(x)

(6)

и называется функцией распределения случайной величины.

 

В виде функции распределения можно задать распределение как непрерывной,

так и дискретной случайной величины. Можно доказать, что F(x) есть неубывающая

функция

х, если х1 x2,

то

F(x1) F(x2)

( рис. 2, а).

Ордината этой

кри-

вой,

 

 

 

 

 

 

 

соответствующая точке x1, представляет собой вероятность

того,

что случайная ве-

личина X

при испытании окажется меньше x2. Разность двух

ординат,

соот-

ветствующая точкам x1 и x2 ,

дает вероятность того, что значения случайной величи-

ны будут лежать в интервале между

x1 и x2:

 

 

 

 

 

 

P(x1 <Х <x2) = F(x2) — F(x 1) .

 

(7)

Значения функции распределения при предельных значениях аргумента соот-

ветственно равны 0 и 1:

 

 

 

 

 

 

 

 

 

F(- ∞) = 0,

F(+ ∞) = 1.

 

(8)

Рис. 2. Функция распределения непрерывной случайной величины (а) и

дискретной случайной величины (б)

-11-

Функция распределения дискретной случайной величины всегда есть разрыв-

ная ступенчатая функция, скачки которой происходят в точках, соответствующих возможным значениям случайной величины, и равны вероятностям этих значений

(рис. 2, б). Сумма всех скачков равна 1.

Для непрерывной случайной величины наиболее часто употребляется произ-

водная функции распределения — плотность распределения вероятности случайной

величины X. Если F(x) непрерывна и дифференцируема, то

f(x)=F'(x) .

(9)

Задание f(x) тоже полностью определяет случайную величину. Можно дока-

зать, что плотность распределения вероятности является

неотрицательной функ-

цией (рис. 3).

 

Рис. 3. Плотность распределения вероятностей непрерывной случайной величи-

ны

Площадь, ограниченная осью Х, прямыми Х = х1 и Х = х2 и кривой плотности распределения, равна вероятности того, что случайная величина примет значения из

интервала от х1 до х2:

x2

 

P( x1 X x2 ) = f ( x )dx = F( x2 ) F( x1 ) ,

(10)

x1

 

в частности

-12-

x

 

F( x ) = P( −∞ X x ) = f ( x )dx .

(11)

−∞

 

Отсюда же выводится еще одно важное свойство плотности распределения

+∞

 

f(x)dx = 1,

(12)

-∞

так как попадание случайной величины в интервал - < Х < +есть достоверное событие.

1.6. Числовые характеристики случайной величины

Вместо задания случайной величины в виде законов распределения вероятно-

стей в прикладных задачах ее часто определяют при помощи числовых характери-

стик – вещественных чисел, выражающих характерные особенности случайной ве-

личины, называемых моментами случайной величины. Различают начальные и цен-

тральные моменты случайной величины.

Начальный момент k-го порядка определяется формулой:

n

k = 1, 2, ...,

 

для дискретной случайной величины mк = xik pi , где

(13)

i =1

 

 

n

k = 1, 2, ...

 

для непрерывной случайной величины mк = xik f ( x )dx ,

(14)

i =1

 

 

Начальный момент первого порядка (при k=1) называется математическим ожиданием (средним значением) случайной величины. Математическое ожидание обозначается М[X] и может быть определено по формулам:

 

 

n

 

для дискретной случайной величины

М[ Х ] = ∑ xi pi ,

(15)

 

 

i =1

 

 

M [ X ] =

+∞

 

для непрерывной случайной величины

x f ( x )dx .

(16)

−∞

Чаще, чем начальные моменты, применяются центральные моменты. Централь-

ный момент k-го порядка обозначается μк и может быть определен по формулам:

 

μ

 

n

 

M [ Х ] )к

 

 

,

(17)

для дискретной случайной величины

k

= ∑( x

i

р

i

 

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

-13-

для непрерывной случайной величины μk =

+∞

( xi M [ Х] )к f (x)dx . (18)

 

-∞

Первый центральный момент всегда равен 0. Второй центральный момент на-

зывается дисперсией. Дисперсией случайной величины называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания,

т.е.

для дискретной случайной величины D( X ) = μ

 

n

 

М [ Х])2 р

 

, (19)

2

= ∑( x

i

 

 

i =1

i

 

 

 

 

 

 

 

 

 

 

+∞

 

 

 

 

 

для непрерывной случайной величины D( X ) =

( xi М [ Х])2 f ( х )dх .(20)

 

−∞

 

 

 

 

 

Дисперсия является мерой рассеяния случайной величины вокруг математиче-

ского ожидания. Легко заметить, что единицы измерения дисперсии будут равны

квадрату единиц измерения случайной величины, что представляет существенные

неудобства при оценке рассеяния. Корень квадратный из второго центрального

момента называется средним квадратическим отклонением. Единицы измерения среднего квадратичного отклонения совпадают с единицами измерения случайной ве-

личины. Среднее квадратичное отклонение определяется по формуле

σ х =

D( X )

=

μ2

.

(21)

Третий центральный момент, разделенный на σ3х , называется коэффициентом асимметрии:

γ

1

= μ

3

σ3 .

(22)

 

 

х

 

Коэффициент асимметрии отражает скошенность кривой распределения.

Через начальные моменты μ3 выражается следующим образом:

 

 

 

μ

3

= т − 3т т

2

+ 2т3 .

(23)

 

 

 

3

1

 

 

 

1

 

Четвертый центральный момент вычисляется по формуле:

 

μ

4

= т

4

− 4т т + 6т2

т

2

− 3т4 .

(24)

 

 

 

1

3

 

1

 

1

 

-14-

Величина

γ 2 = (μ4 σ4х )− 3

(25)

называется коэффициентом эксцесса.

 

Коэффициент эксцесса характеризует крутость подъема кривой

распределе-

ния.

На рис. 4 приведены примеры плотностей распределений с не нулевыми зна-

чениями коэффициентов асимметрии и эксцесса. Для сравнения штриховой линией изображена кривая с теми же математическим ожиданием М[X] и дисперсией D[Х],

но с нулевыми значениями коэффициентов асимметрии и эксцесса.

γ2< 0

Рис. 4. Плотность распределений с ненулевыми коэффициентами асимметрии и эксцесса

1.7. Нормальное распределение

Одним из наиболее часто встречающихся распределений является нормальное распределение. Нормальное распределение занимает особое положение среди других распределений, поскольку нормальный закон распределения является предельным за

-15-

коном, к которому приближаются другие законы распределения. Нормальный закон распределения широко используется при обработке результатов наблюдений.

Случайная величина Х называется распределенной по нормальному закону,

если ее плотность распределения:

1

 

 

 

 

-( х-М [ Х ])2 ( 2×s2х )

 

-∞ < х < + ∞ ,

 

f ( x ) =

sх ×

 

 

×е

 

 

 

 

 

(26)

2p

 

 

 

 

 

а функция распределения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

2

 

 

 

F( Х ) =

 

 

 

х -( х-М [ Х ])

( 2×sх )

× dx .

 

 

 

 

 

-¥е

 

(27)

 

sх

 

 

 

 

2p

 

График плотности вероятности нормального распределения имеет колоколо-

образную форму и называется нормальной кривой или кривой Гаусса (рис.

5).

Изменение параметров М[Х] и σх на вид нормальной кривой влияет следующим образом. При изменении параметра М[Х] (математического ожидания) форма нор-

мальной кривой не изменится, а график сдвигается влево или вправо. При увеличении

σх островершинность кривой уменьшается и она растягивается вдоль оси ОХ

(рис. 5). При этом площадь, ограниченная кривой и осью ОХ, остается постоян-

ной и равна 1.

Использование формул плотности распределения в практике существенно уп-

рощается, если перейти от нормального распределения с произвольными параметра-

ми М[Х] и σх к нормированному распределению с параметрами М[Х] = 0 ; σх = 1.

Преобразование

 

z =

х М[ Х ]

 

(28)

σ х

 

 

называется нормировкой. Нормальное распределение нормированной случайной величины называется стандартным.

Плотность такого распределения имеет вид:

 

 

1

-

z 2

 

f(x) =

 

 

 

 

 

 

 

 

 

 

е 2 ,

(29)

 

 

 

 

 

 

 

 

 

 

а функция распределения:

-16-

 

 

1

 

х

z 2

 

 

F0 ( х ) =

 

 

е

 

2 dz .

(30)

 

 

 

 

 

 

 

 

 

 

−∞

 

 

 

 

График такой функции представлен на рис. 6. Для такой величины

 

P(x1 Х0 х2 ) = F0 ( х2 ) F0 ( х1 ) .

(31)

0

 

М[Х]

 

 

 

 

 

 

Рис. 5. График плотности нормального распределения: 1 – график плотности нормального распределения при среднеквадратичном отклонении σ1 ; 2 – то же при

σ2 .

Функция

Ф(х ) = F

 

( х )

1

 

 

 

 

 

 

 

 

(32)

 

 

 

 

 

 

 

 

 

 

 

0

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

называется функцией Лапласа:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

х

z 2

 

 

 

Ф( х ) = F0 ( х ) F0

( 0 ) =

 

 

 

2 dz .

(33)

 

 

 

 

 

 

е

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

π 0

 

 

 

 

Рис. 6. График функции F0 (x) стандартного нормального распределения

-17-

Значения функции Лапласа, выраженной формулой (33), приведены в прило-

жениях. Следует отметить, что функция Лапласа –

нечетная функция, т.е.

Ф(−х) = −Ф(х) ,

(34)

Поэтому таблицы значений Ф(х) составлены лишь для х > 0.

Для нормированной случайной величины, учитывая (31) и (32), имеем

 

Р(х1 £ Х £ х2 ) = Ф(х2 ) +1 2 - Ф(х1 ) - 1 2 = Ф(х2 ) - Ф(х1 ) .

 

 

 

 

 

(35)

 

В общем случае

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х1

- М[ Х ]

 

 

х2 - М[ Х ]

 

 

х2

- М[ Х ]

 

 

х1

- М[ Х ]

 

 

 

 

 

 

 

 

 

 

 

 

 

Р(х1 £

Х £

х2 ) = Р

 

 

 

£ Х0

£

 

 

 

= Ф

 

 

 

 

- Ф

 

 

 

 

. (36)

 

σ х

σ х

 

σ х

 

σ х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Во многих практических задачах х1 и х2 симметричны относительно матема-

тического ожидания, в частности в задаче об абсолютном отклонении. Абсолютным отклонением называется величина

D Х =

 

X - M [X ]

 

.

(37)

 

 

Требуется найти вероятность того, что абсолютное отклонение случайной величины не превзойдет некоторого заданного числа ε :

 

 

 

Р(DХ0

£ ε) = Р(М[ Х ] - ε £ Х £ М[ Х ] + ε) .

 

(38)

В частности, для нормированной случайной величины (для которой М [Х] = 0)

 

 

 

Р(DХ0 £ ε) = Р(-ε £ Х £ +ε) = Ф(ε) - Ф(-ε) = 2Ф(ε) .

(39)

Для случайной величины,

имеющей нормальное

 

распределение с

параметрами

М[ X ] ¹ 0 и sх ¹ 1 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

ε

 

 

 

 

 

 

 

£

 

 

 

 

 

 

(40)

 

 

 

 

 

 

 

 

 

 

 

Р(DХ0 £ ε) = Р DХ0

σх

 

=

σх

.

 

 

 

 

 

 

 

 

 

 

Обозначив

ε

= k , получим из (40) следующее соотношение:

 

 

σ

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р(DХ £ k × σх ) = 2Ф(k) ,

 

 

 

 

 

(41)

отсюда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р(DХ £ σ х ) = 2Ф(1) = 2 ´ 0,3413 = 0,6826 ,

 

 

 

(42)

 

 

 

Р(DХ £ х ) = 2Ф(2) = 2 ´ 0,4772 = 0,9544,

 

 

 

(43)

 

 

 

Р(DХ £ х ) = 2Ф(3) = 2 ´ 0,4987 = 0,9974,

 

 

 

(44)

-18-

Таким образом, отклонения больше, чем утроенный стандарт (среднеквадрати-

ческое отклонение), практически невозможны.

Отсюда можно сформулировать правило 3σ: если случайная величина распре-

делена по нормальному закону, то отклонения этой величины от ее математическо-

го ожидания по абсолютной величине не превосходят утроенного среднеквадратиче-

ского отклонения.

С помощью функции Лапласа можно решать практические задачи.

Пример 2. Цех по производству железобетонных изделий выпускает плиты перекрытий, изготавливаемых с применением бетона класса В15. При контроле

прочности бетона конструкций получена средняя прочность Х = М( Х ) = 19,3 МПа,

при среднем квадратичном отклонении σ=2,457 МПа.

Определить вероятность появления при испытаниях значений прочности менее

15 МПа.

Решим эту задачу путем вычитания из площади под кривой нормального рас-

пределения от

Х1= - ∞ до

Х3=19,3 МПа, площади заключенной между кривой и

ординатами Х2=15,0 МПа

и Х3=19,3 МПа. Площадь под кривой нормального рас-

пределения от

Х1= - ∞ до Х3=

 

= М ( Х ) = 19,3 МПа, лежащей слева от математиче-

Х

ского ожидания (средней прочности Х = М ( Х ) = 19,3 МПа), равняется половине всей площади, т.е F(Х3)= - 0,5 (знак минус указывает на то, что площадь находится слева от математического ожидания).

Находим Z, при Х2=15,0 МПа и Х3=19,3 МПа:

Z = Х2 М ( Х ) = 15,0 − 19,3 = −1,75 σ 2,457

Площадь под кривой нормального распределения от Х2=15,0 МПа до

Х3= Х = М ( Х ) = 19,3 МПа при этом по приложению 2 равна –0,4599.

Площадь под кривой нормального распределения от Х1= - ∞ до Х2=15,0 МПа

(вероятность попадания значений прочности в интервал от - ∞ до 15,0 МПа) будет равна –0,5-(-0,4599) = -0,0401.

Т.о., вероятность появления значений прочности бетона менее 15,0 МПа равна

0,0401, что соответствует определению класса бетона.

-19-

2.Элементы математической статистики

2.1.Задачи математической статистики. Краткая историческая справка

Установление закономерностей, которым подчинены массовые случайные яв-

ления, основано на изучении методами теории вероятностей статистических данных -

результатов наблюдений. Перед математической статистикой стоит несколько задач,

среди которых можно отметить следующие:

¾указание способов сбора и группировки статистических сведений, полу-

ченных в результате наблюдений или в результате специально поставленных экспе-

риментов;

¾разработка методов анализа статистических данных в зависимости от це-

лей исследования:

а) оценка неизвестной вероятности события; оценка неизвестной функции рас-

пределения; оценка параметров распределения, вид которого неизвестен; оценка зависимости случайной величины от одной или нескольких случайных величин и др.;

б) проверка статистических гипотез о виде неизвестного распределения или о величине параметров распределения, вид которого неизвестен.

Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование экспери-

мента), в ходе исследования (последовательный анализ) и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

Таким образом, задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Математическая статистика возникла (XVII в.) и развивалась параллельно с теорией вероятностей. Дальнейшее развитие математической статистики (вторая по-

ловина XIX - начало XX в.) обязано, в первую очередь, П.Л.Чебышеву,

А.А.Маркову, А.М.Ляпунову, а также К.Гауссу, А.Кетле, К.Пирсону и др.

В XX в. наиболее существенный вклад в математическую статистику был сде-

лан советскими математиками (В.И.Романовский, А.Н.Колмогоров, Н.В.Смирнов). а

также английскими учеными (Стьюдент, Р.Фишер, Э.Пирсон) и американскими

(Ю.Нейман, А.Вальд).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]