- •1 Случайные события
- •1.1 Основные понятия и определения
- •1.2 Аксиомы теории вероятностей
- •1.3 Классическая схема вычисления вероятностей
- •1.3.1 Декартово произведение множеств и правило умножения
- •1.3.2 Размещения и перестановки
- •1.3.3 Сочетания при выборе с возвращением и без возвращения
- •1.3.4 Схема упорядоченных разбиений множества
- •1.4 Геометрическая, статистическая и экспертная схемы расчета
- •1.4.1 Геометрическая схема вычисления вероятности
- •1.4.2 Статистическая схема вычисления вероятности
- •1.4.3 Схема вычисления субъективной вероятности
- •1.5 Условная вероятность. Независимость событий. Формулы сло-
- •1.6 Формула полной вероятности и формулы Байеса
- •2 Случайные величины
- •2.1 Cлучайная величина и ее функция распределения
- •2.2 Дискретная случайная величина
- •2.2.1 Дискретный закон распределения
- •2.2.2 Числовые характеристики дискретного распределения
- •2.2.3 Производящая функция вероятностей
- •2.2.4 Биномиальное распределение
- •2.2.5 Распределение Пуассона
- •2.2.6 Геометрическое распределение
- •2.3 Непрерывные случайные величины
- •2.3.1 Функция распределения и плотность распределения
- •2.3.2 Числовые характеристики непрерывного распределения
- •2.3.3 Равномерное распределение
- •2.3.4 Нормальное распределение
- •2.3.5 Показательное распределение
- •2.4 Функция от случайной величины
- •3 Случайные векторы
- •3.1 Общие свойства случайного вектора
- •3.2 Случайные векторы дискретного типа
- •3.3 Непрерывные случайные векторы
- •4 Предельные теоремы
- •4.1 Закон больших чисел
- •4.2 Центральная предельная теорема
- •5 Элементы математической статистики
- •5.1 Выборка и выборочные законы распределения
- •5.2 Точечные оценки числовых характеристик случайных величин
- •5.3 Интервальные оценки
- •5.4 Проверка статистических гипотез
2.3.4 Нормальное распределение
Нормальное распределение занимает в теории вероятностей и матема-
тической статистике центральное место, поскольку оно часто реализуется при
решении практических задач и удобно при теоретических исследованиях.
Определение нормального распределения. Случайная величина
X называется распределённой по нормальному закону (имеет распределение
Гаусса) с параметром положения µ ∈ R и параметром масштаба σ > 0 ,
если её плотность распределения вероятностей имеет вид
f (x) =
σ
1
√
2π
e−
(x−µ)2
2σ2 .
Любая плотность распределения должна быть неотрицательной функ-
цией, удовлетворяющей условию нормировки. Как видно, плотность нормаль-
ного распределения положительна и удовлетворяет условию нормировки:
+∞
∫
+∞
∫
1
(x−µ)2
1
+∞
∫
1 x−µ2
( x − µ
−∞
f (x)dx =
−∞
σ
√
2π
e−
2σ2 dx = √
2π
+∞
1 ∫ z2
−∞
e−2( σ)d
σ
=
= √
2π
−∞
e−2dz = 1.
При вычислении интеграла была сделана замена переменной z = (x − µ)/σ
и использован известный интеграл Пуассона
+∞
∫
−∞
2
e−z2 dz =
√
2π .
Если по аналогичной схеме вычислить по общим формулам математи-
ческое ожидание и дисперсию нормального распределения, то получим, что
математическое ожидание mxсовпадает с параметром положения µ , а стан-
дартное отклонение σxс параметрм масштаба σ :
mx= µ, σx= σ.
Отсюда, в частности, следует, что стандартная нормальная случайная вели-
чина Z = (X − mx)/σxимеет плотность распределения вероятностей ϕ(z) с
параметром положения µ = 0 и параметром масштаба σ = 1
1
ϕ(z) = √
2π
z2
e−2.
На Рис. 8 представлен график плотности ϕ(z) стандартного нормаль-
ного (гауссового) распределения с параметрами µ = 0 и σ = 1 .
59
Рис. 8
Функция распределения стандартной нормальной случайной величины
имеет специальное обозначение Φ(z) и выражается через плотность распре-
деления вероятностей с параметрами µ = 0 , σ = 1 в следующем виде:
z
1
Φ(z) = √
2π
∫
−∞
t2
e−2dt.
Интеграл справа не выражается через элементарные функции, называется
функцией Лапласа и с учетом важности нормального распределения для
практических приложений представлен в виде подробных таблиц в справоч-
никах и в виде стандартных процедур в статистических пакетах.
Так как ϕ(−z) = ϕ(z) , то плотность стандартного нормального распре-
деления является четной функцией. Отсюда вытекает следующее равенство:
Φ(−z) = 1 − Φ(z).
Для вывода равенства выполним преобразования:
+∞
1
1 = P (Ω) = P (Z < z) + P (Z ≥ z) = Φ(z) + √
2π
−∞ −z
∫
z
t2
e−2dt =
1
∫
u2
1
∫
u2
= Φ(z) − √
2π
−z
e−2du = Φ(z) + √
2π
60
−∞
e−2du = Φ(z) + Φ(−z).
Полученные равенства
ϕ(−z) = ϕ(z) , Φ(−z) = 1 − Φ(z)
позволяют иметь таблицы значений плотности стандартного нормального
распределения и функции Лапласа только для положительных значений z .
В некоторых руководствах приводятся таблицы значений функции
z
Φ0(z) =
∫
0
u2
e−2du.
Из условия Φ(−z) = 1 − Φ(z) следует равенство Φ(0) = 1 − Φ(0) . Отсюда
получаем, что Φ(0) = 0, 5. Так как справедливы следующие преобразования
1
z
∫
t2
1
0
∫
t2
1
z
∫
t2
Φ(z) = √
2π
−∞
e−2dt = √
2π
−∞
e−2dt + √
2π
0
e−2dt = 0, 5 + Φ0(z),
то формула, связывающая функцию Лапласа Φ(z) и функцию Φ0(z) , имеет
следующий вид:
Φ(z) = 0, 5 + Φ0(z).
На Рис. 9 представлен график стандартного нормального распределения
(функции Лапласа).
Рис. 9
Так как плотность f (x) нормального распределения всюду непрерыв-
на, то функция распределения F (x) дифференцируема на всей числовой пря-
61
мой, причем F0(x) = f (x), x ∈ R . Отсюда, учитывая, что функция плотно-
сти распределения вероятностей при всех x ∈ R положительна, следует, что
функция нормального распределения всюду строго возрастает .
Функция нормального распределения F (x) с параметрами µ и σ вы-
ражается через функцию Лапласа Φ(x) по следующим формулам:
F (x) = Φ
( x − µ
σ
= Φ
(x − mx
σx
.
Действительно, используя общее определение функции распределение, полу-
ченные ранее формулы mx= µ и σx= σ и выполнив необходимые тожде-
ственные преобразования, получим:
F (x) = P (X < x) = P
( X − mx
σx
<
x − mx
σx
= Φ
( x − mx
σx
= Φ
( x − µ
σ
.
Отсюда вытекает также, что квантили xpобщего нормального распределе-
ния выражаются через квантили zpфункции Лапласа по формулам
xp= µ + σzp= mx+ σxzp.
При вычислении квантилей zpстандартного нормального распределения до-
статочно иметь таблицу квантилей только для вероятностей p ≥ 0, 5 . Для
вероятности p < 0, 5 квантили находят по следующей формуле:
zp= −z1−p,0 < p < 0, 5 .
Действительно, так как функция Φ(z) строго возрастает, то для нее суще-
ствует обратная функция Φ−1(p) и справедливы следующие преобразования:
Φ(−zp) = 1 − Φ(zp) = 1 − p ⇒ Φ−1[Φ(−zp)] = Φ−1(1− p) ⇒ −zp= z1−p.
Вероятность попадания нормально распределенной случайной величины X
с математическим ожиданием mx= µ и стандартным отклонением σx= σ в
диапазон значений от a до b выражается с помощью нормальной стандарт-
ной функции распределения Φ(z) по формулам:
P (a ≤ X < b) = Φ
( b − mx
σx
− Φ
(a − mx
σx
= Φ
( b − µ
σ
− Φ
(a − µ
σ
,
так как справедливы следующие равенства:
( b − mx
( a − mx
P (a ≤ X < b) = F (b) − F (a) = Φ
σx
− Φ
σx
.
Пример. Вычислим вероятность попадания нормально распределен-
ной случайной величины в интервал (mx−l; mx+ l) длины 2l , симметричный
относительно математического ожидания mx.
62
Данная вероятность вычисляется по приведенной выше формуле в виде:
P (mx− l < X < mx+ l) = Φ
( mx+ l − mx
σx
− Φ
( mx− l − mx
σx
=
= Φ
( l
σx
− Φ
( −l
σx
= Φ
( l
σx
−
[
1 − Φ
( l ]
σx
= 2Φ
( l
σx
− 1.
Если, конкретно, рассмотреть интервал (mx− 3σx; mx+ 3σx) длины 6σx, то
получим вероятность того, что нормально распределенная случайная вели-
чина принимает свои значения в диапазоне от mx− 3σxдо mx+ 3σx. По
таблице значений функции Лапласа находим, что Φ(3) = 0, 99865 . Тогда
P (mx− 3σx< X < mx+ 3σx) = 0, 9973 . Отсюда, вероятность противо-
положного события: ѕCлучайная величина выйдет за диапазон значений от
mx− 3σxдо mx+ 3σxї равна 0,0027. Так как данная вероятность достаточно
мала, то при решении практических задач часто применяют, так называемое
правило трех сигм: ѕПрактически невозможно, что некоторая величина
выйдет за диапазон трех сигм за счет случайных факторовї.
Ранее отмечалось, что биномиальное распределение с параметрами n и
p аппроксимируется нормальным распределением с математическим ожида-
нием np и стандартным отклонением Ⲛnp(1 − p) =
√
npq , если только вы-
полняются условия np(1−p) > 5 и 0, 1 < p < 0, 9 . При условии np(1−p) > 25
это приближение можно применять при любых p . Пусть при указанных усло-
виях требуется вычислить вероятность попадания биномиальной случайной
величины в диапазон значений от k1до k2. Полагая в формуле вычисления
вероятности попадания нормальной случайной величины в промежуток от a
до b , mx= µ = np , σx= σ =
√
npq , k1= a , k2= b , получим
( k2− np ( k1− np
P (k1≤ X < k2) = Φ
√npq
− Φ
√npq.
Пример. Вероятность попадания в цель при одном выстреле равна
0,75. Найти вероятности того, что при 300 выстрелах: а) будет ровно 210
попаданий; б) будет от 210 до 240 попаданий.
Решение. В данной задаче дискретная случайная величина: ѕЧисло
попаданийї имеет биномиальное распределение с параметрами n = 300 и
p = 0, 75 . Найдем её математическое ожидание mB= np = 225 и стан-
дартное отклонение σB=
√
npq =
√
300 · 0, 75 · 0, 25 = 7, 5 . Как видно, в
данном случае биномиальное распределение можно аппроксимировать нор-
мальным распределением с математическим ожиданием mx= mB= 225
и стандартным отклонением σx= σB= 7, 5 . Отсюда, сначала используя
63
таблицу значений плотности стандартного нормального распределения ϕ(z)
находим требуемую в пункте а) задачи вероятность в виде
P {X = 210} =
1
√npqϕ
( k − np
√npq=
1
ϕ
(210 − 225
=
7, 5
7, 5
= ϕ(−2)/7, 5 = ϕ(2)/7, 5 = 0, 054/7, 5 = 0, 0072.
Далее вычисляем требуемую в пункте б) задачи вероятность в виде
P (210 ≤ X ≤ 240) = Φ
(240 − 225
7, 5
− Φ
( 210 − 225
7, 5
=
= Φ(2) − Φ(−2) = 2Φ(2) − 1 = 2 · 0, 977 − 1 = 0, 954.
Распределение Пуассона при значениях параметра λ > 9 может быть
достаточно точно приближено нормальным распределением с математиче-
ским ожиданием mx= λ и стандартным отклонением σx=
√
λ . При данном
условии вероятность попадания случайной величины, имеющей распределе-
ние Пуассона, в диапазон значений от k1до k2вычисляется по формуле:
( k2− λ
( k1− λ
P (k1≤ X < k2) = Φ
√
λ
− Φ
√
λ
.
Пример. Среднее число вызовов на телефонной станции за одну ми-
нуту равно mx= λ = 16 . Найти вероятности следующих событий:
A = {X ≥ 20}, A = {10 ≤ X ≤ 20}.
Решение. Так как параметр распределения Пуассона больше девя-
ти, то распределение случайной величины X ѕЧисло вызовов за одну ми-
нутуї можно аппроксимировать нормальным распределением с математиче-
ским ожиданием mx= λ = 16 и стандартным отклонением σx=
√
λ = 4 .
Отсюда, используя таблицу значений функции Лапласа, получим искомые
вероятности в следующем виде:
( 20 − 16
P {X ≥ 20} = 1−P {X < 20} = 1−Φ = 1−Φ(1) = 1−0, 84 = 0, 16,
4
P {10 ≤ X ≤ 20} = Φ
(20 − 16
4
− Φ
( 10 − 16
4
=
= Φ(1) − Φ(−1, 5) = Φ(1) − (1 − Φ(1, 5)) = 0, 84 − (1 − 0, 93) = 0, 77.
Функция нормального распределения всюду строго возрастает, поэтому
медиана hxнаходится как единственное решение уравнения F (hx) = 0, 5 .
64
Так как F (hx) = Φhx−σxmx, то данное уравнение равносильно уравнению
Φhx−mx
= 0, 5 . Учитывая, что квантиль уровня 0,5 функции Лапласа ра-
σx
вен нулю, получимhx−mx
σx= 0 и hx= mx.
Таким образом, у нормального распределения медиана совпадает с ма-
тематическим ожиданием и равна параметру положения µ .
Для вычисления моды dxнормального распределения исследуем функ-
цию плотности f (x) на локальный максимум, анализируя ее производную
x − µ
(x−µ)2
f0(x) = −
σ3
√
2π
e−
2σ2 .
Приравнивая первую производную нулю, получим значение единственной
точки экстремума в виде x = µ . Так как при x < µ производная f0(x)
положительна, а при x > µ производная f0(x) отрицательна, то данная точ-
ка x = µ является точкой максимума.
Таким образом, мода dxнормального распределения равна параметру
положения µ и совпадает с математическим ожиданием и медианой, т. е.
mx= hx= dx= µ.
Плотность нормального распределения симметрична относительно ма-
тематического ожидания, поэтому третий центральный момент равен нулю
и, соответственно, коэффициент асимметрии ax= µ3/σx3 равен нулю.
Непосредственно по определению вычисляется четвертый центральный
момент µ4= 3σ4= 3σx4 . Отсюда коэффициент эксцесса ex= µ4/σx4 − 3 для
нормального распределения также равен нулю.