- •ВВЕДЕНИЕ
- •Глава XIV ТЕОРИЯ ВЕРОЯТНОСТЕЙ
- •Раздел I
- •Виды случайных событий
- •Классическое определение вероятности
- •Основные формулы комбинаторики
- •Статистическое определение вероятности
- •Непосредственное вычисление вероятностей
- •§ 2. Теорема сложения вероятностей несовместных событий
- •§ 3. Условная вероятность. Теорема умножения вероятностей
- •§ 4. Теорема сложения вероятностей совместных событий
- •§ 5. Формула полной вероятности
- •§ 6. Формула Бейеса
- •§ 7. Схема Бернулли
- •Раздел II
- •§ 2. Математическое ожидание, дисперсия и среднеквадратическое отклонение случайной величины, их свойства
- •Свойства математического ожидания
- •Свойства дисперсии
- •Примеры решения задач
- •§ 3. Примеры распределения случайных величин
- •3.1 Биномиальное распределение
- •3.2 Распределение Пуассона
- •3.3 Нормальное распределение
- •3.4. Равномерное распределение
- •3.5 Показательное (экспоненциальное) распределение
- •§ 4. Система случайных величин
- •§ 5. Ковариация и коэффициент корреляции
- •Свойства коэффициента корреляции
- •§ 6. Закон больших чисел. Теорема Чебышева
- •§ 7. Центральная предельная теорема Ляпунова
- •Глава XV МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
- •§ 1. Задачи математической статистики
- •§ 2. Выборочный метод
- •2.1 Генеральная и выборочная совокупности
- •2.2 Статистическое распределение выборки
- •2.3 Эмпирическая функция распределения
- •2.4 Полигон и гистограмма
- •2.5 Оценки математического ожидания
- •2.6 Оценки дисперсии
- •§ 3. О статистической проверке гипотез
- •ПЕРЕЧЕНЬ КОНТРОЛЬНЫХ ВОПРОСОВ
- •КОНТРОЛЬНЫЕ ЗАДАНИЯ
- •Вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •ПРИЛОЖЕНИЕ
- •Список рекомендуемой литературы
47
2.5 Оценки математического ожидания
Найдем сначала точечную оценку математического ожидания. Пусть исследуется некоторая случайная величина X , в результате испытаний получены значения этой величины x1 , x2 , …, xn . Рассмотрим попарно незави-
симые случайные величины X1 , X 2 , …, X n , распределения которых совпадают с распределением X и каждая X k определена соответствующим xk .
По условию
M ( X ) = M ( X1 ) = ... = M ( X n ) = a , D( X ) = D( X1 ) =... = D( X n ) =σ 2 .
По теореме Чебышева всякое значение случайной величины n1 ( X1 +... + X n )
с большой вероятностью близко к M ( X ) . Отсюда
|
|
|
|
|
M ( X ) ≈ |
1 |
(x + x |
2 |
+... + x |
n |
) . |
(1) |
||
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
n |
1 |
|
|
|
||
|
1 (x |
|
|
|
|
|
|
|
|
|
|
|
||
Число |
+ x |
2 |
+... + x |
n |
) называется средней статистической. Оценка |
|||||||||
|
n |
1 |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1) является точечной, она тем точнее, чем больше n . Однако какой-либо информации о количественной мере точности и о том, как эта мера зависит от n , формула (1) не дает.
Более глубокий подход к оценке математического ожидания состоит в следующем. В силу центральной предельной теоремы случайная величина
|
|
= |
1 |
( X1 + X 2 +... + X n ) при больших n имеет нормальное распределение с |
|||||||||
X |
|||||||||||||
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
параметрами |
|
|
σ 2 |
|
|
||||||||
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
M ( X ) = M ( Xi ) = a , D( X ) = |
D( Xi ) = |
. |
(2) |
||||||
|
|
|
|
n |
n |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Можно доказать, что если X распределена нормально, то справедливо соотношение
|
|
|
|
|
|
δ |
|
|
|
P( |
|
X |
− a |
|
<δ )= 2Ф |
|
|
. |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
D( X ) |
Обозначив число δσn = t (*), с учетом (2), получим
|
|
|
|
|
σ t |
= 2Ф(t) . |
|
X − a |
< |
||||||
P |
|
||||||
|
|
|
|
|
n |
|
|
|
|
|
|
|
(3)
(4)
Получили, что вероятность того, что значение случайной величины X ,
т.е. |
|
= |
1 |
( X1 + X 2 +... + X n ) отличается от искомого значения M ( X ) = a |
X |
||||
|
|
|
n |
|
меньше, чем на δ , равна 2Ф(t) (Ф(t) – функция Лапласа).
48
Если параметр σ известен, то равенство (4) определяет интервал
(x −δ ; x +δ ) , т.е. ( x −σ t n ; x +σ t n ) , в котором с вероятностью p = 2Ф(t) заключено подлежащее оценке математическое ожидание величи-
ны X , M ( X ) = a .
В этом случае говорят об интервальной оценке математического ожи-
дания. Интервал (x −δ ; x +δ ) называют доверительным интервалом (δ –
произвольное число), а вероятность p = 2Ф(t) – доверительной вероятностью, соответствующей данному доверительному интервалу ( p иногда называют надежностью γ ).
Разумеется, чем больше взят доверительный интервал, тем больше доверительная вероятность. Увеличивая же число испытаний n можно увеличить доверительную вероятность p = 2Ф(t) , приблизив ее как угодно близко к 1 для любого (даже очень малого) интервала (x −δ ; x +δ ) .
Из соотношений (4), (*) можно вычислить n по заданным σ , δ , p , т.е.
решить задачу о нахождении такого числа испытаний, чтобы данному доверительному интервалу соответствовала данная доверительная вероятность.
|
Пример 5. |
|
|
X со |
|
|
|
|
|
|
|||
|
Случайная величина |
средним квадратическим |
отклонением |
||||||||||
σ ( X ) = 2 |
испытывается 20 раз. Оценить ее математическое ожидание, если |
||||||||||||
результаты испытаний таковы: |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ |
|
1 |
|
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
102 |
|
100 |
101 |
103 |
97 |
99 |
100 |
98 |
96 |
93 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ |
|
11 |
|
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
100 |
|
103 |
101 |
102 |
104 |
100 |
101 |
103 |
101 |
99 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Решение.
Вычислим точечную оценку математического ожидания этой величины
|
|
|
20 |
|
|
x = |
|
1 |
∑xi =100,15 ≈ a . |
||
|
|
||||
|
|
20 i =1 |
|
||
Найдем теперь вероятность того, что математического ожидание a бу- |
|||||
дет находиться в пределах 100,15 ± 0,5. |
|
||||
Имеем |
|
|
|
|
|
x =100,15; |
δ = 0,5 ; |
n = 20 ; σ = 2 . |
|||
t = δ n |
= |
0,5 20 |
= 0,5 5 ≈1,12 . |
||
σ |
|
|
2 |
|
p = 2Ф(t) = 2 Ф(1,12) = 2 0,3686 = 0,7372 .
49
Ответим еще на такой вопрос: каков должен быть интервал, чтобы искомое математическое ожидание находилось в нем с вероятностью 0,99 ?
Имеем
x =100,15; |
δ = 0,5 ; n = 20 ; σ = 2 ; |
p = 0,99 ; δ = ? |
|||
2 Ф(t) = 0,99 |
Ф(t) = 0,495 |
t = 2,58 . |
|||
δ = t σ |
= |
2t |
|
=1,15 . |
|
|
|
|
|||
n |
20 |
|
|
100,15 −1,15 < a <100,15 +1,15 с вероятностью 0,99.
2.6 Оценки дисперсии
Для нахождения точечной оценки дисперсии можно вычислить среднее арифметическое квадратов отклонений значений xi от среднего статистиче-
ского x :
|
|
|
1 |
n |
|
|
|
= |
∑(xi − x)2 . |
(5) |
|
D |
|||||
|
|
|
n i =1 |
|
На первый взгляд при больших приближением неизвестной дисперсии что число
n это число должно быть хорошим величины X . Однако оказывается,
|
|
|
n |
|
|
|
1 |
n |
|
|
|
|
* = |
|
= |
∑(xi − x)2 |
(6) |
||||
D |
D |
|||||||||
|
n −1 |
|
||||||||
|
|
|
|
|
n −1 i =1 |
|
дает лучшее приближение неизвестной дисперсии (хотя при больших n D и
D * мало отличаются).
Можно доказать, что математическое ожидание случайной величины
1 ∑n ( Xi − X )2 равно D( X ) (в предположении, что величины X k незави- n −1 i =1
симы и одинаково распределены). Если же вычислить математическое ожи-
|
1 |
n |
n −1 |
|
|||
дание случайной величины |
∑( Xi − |
|
)2 , то получится |
D( X ) . Указан- |
|||
X |
|||||||
|
|
||||||
|
n i =1 |
n |
ные факты и являются основными аргументами в пользу того, чтобы считать оценку дисперсии (6) более удачной.
Рассматривают также интервальную оценку дисперсии, указывая для каждого интервала D ±δ вероятность P(δ ) , с которой искомая дисперсия
принадлежит этому интервалу. Обычно удобнее оценивать не саму дисперсию, а среднее квадратическое отклонение:
P( σ −σ * <δ )= γ , σ * = D * ,
σ * −δ <σ <σ * +δ ,
50
σ * 1 − σδ* <σ <σ * 1 + σδ* .
Положив σδ* = q , получим оценку
σ * (1 − q) <σ <σ * (1 + q) .
Значение q определяется из довольно сложного интегрального уравнения. На практике для отыскания значения q по данным значениям n и γ пользуются таблицами.
Заметим, что в задаче об интервальной оценке математического ожидания в случае неизвестной величины σ допустимо взять в качестве σ число
D * , где D * – точечная оценка дисперсии, выражаемая формулой (6).
2.7 Общие замечания об оценке параметров статистического распределения
Рассмотрим кратко общий вопрос об оценке параметров статистического распределения. Оценкой какого-либо параметра распределения по опытным данным является значение некоторой функции ϕ( X1, X 2 , ..., X n ) от
результатов испытаний x1 , x2 , …, xn . Для того, чтобы эта оценка была разумной (приемлемой), функция ϕ должна обладать некоторыми свойствами,
аименно эффективностью, состоятельностью и несмещенностью.
1.Оценка ϕ параметра a называется состоятельной, если
lim P( a −ϕ < ε )=1.
n→∞
2. Оценка ϕ параметра a называется несмещенной, если M (ϕ) = a . 3. Оценка ϕ – эффективна, если D(ϕ) минимальна.
Замечание. Оценка (1) состоятельна и несмещена. Она также эффективна для нормально распределенной случайной величины X .
Оценки (5) и (6) состоятельны, но не являются эффективными.
(5)также не является несмещенной в отличие от (6).
2.8Оценка параметров статистического распределения
сточки зрения генеральной совокупности и выборки
Решение задачи об оценке математического ожидания и дисперсии можно сформулировать, используя понятия генеральной совокупности и выборки.
Пусть дано большое количество N элементов, каждый из которых характеризуется некоторым числом xi , i =1, N . Как известно, такое множество
51
называют генеральной совокупностью ( N – объем генеральной совокупности).
|
1 |
N |
|
Число xГ = |
∑xi называется средней генеральной, а число |
||
|
|||
|
N i =1 |
DГ = 1 ∑N (xi − xГ )2 – генеральной дисперсией.
N i =1
Фактическое вычисление xГ и DГ часто оказывается невозможным
вследствие того, что объем генеральной совокупности очень велик. Тогда из генеральной совокупности делают сравнительно небольшую по объему n < N выборку. Выборка производится случайным образом, т.е. для каждого элемента генеральной совокупности вероятность попасть в выборку равна
N1 , так что все элементы имеют равные вероятности и последовательность
испытаний независима.
Таким образом, возникает задача об оценке параметров xГ и DГ по
выборочным данным. Она является частным случаем описанной выше задачи об оценке параметров распределения по результатам испытаний: достаточно рассматривать испытание как выбор одного элемента из генеральной сово-
купности. Обозначим элементы выборки через xВ , |
x |
В , …, |
xВ . Тогда имеем |
||||||||||||||||||||||||||||||
оценки: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
2 |
|
|
n |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑xiВ |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
xГ ≈ |
i =1 |
|
= xВ , |
|
|
|
|
|
|
|
(7) |
|||||||||
xВ – средняя выборочная; |
|
|
n |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑(xiВ − xВ )2 |
|
|
В* , |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
DГ |
≈ |
|
i =1 |
|
|
= |
|
|
|
|
|
|
|
|
(8) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
D |
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
В* – выборочная дисперсия; |
|
|
|
|
|
n − |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
D |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
P( |
|
xВ − xГ |
|
|
<δ )= 2Ф(t), |
|
δ = |
|
σ t |
, |
|
|
|
(9) |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
σВ* (1 − q) <σГ <σВ* (1 + q) , |
|
|
n |
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
σВ* = |
|
|
В* |
( q находят по заданным значениям n и γ |
– надежности). |
|
|||||||||||||||||||||||||||
D |
|
||||||||||||||||||||||||||||||||
|
|
|
|
Пример 6. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
Из генеральной совокупности извлечена выборка объема n =12 : |
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
xi |
−0,5 |
−0,4 |
−0,2 |
|
0 |
|
0,2 |
|
0,6 |
0,8 |
|
|
|
1 |
|
|
1,2 |
1,5 |
Σ |
|||||||||||
|
|
ni |
1 |
2 |
1 |
|
1 |
|
|
|
|
1 |
|
1 |
1 |
|
|
|
|
1 |
|
|
2 |
1 |
12 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|