- •1 Случайные события
- •1.1 Основные понятия и определения
- •1.2 Аксиомы теории вероятностей
- •1.3 Классическая схема вычисления вероятностей
- •1.3.1 Декартово произведение множеств и правило умножения
- •1.3.2 Размещения и перестановки
- •1.3.3 Сочетания при выборе с возвращением и без возвращения
- •1.3.4 Схема упорядоченных разбиений множества
- •1.4 Геометрическая, статистическая и экспертная схемы расчета
- •1.4.1 Геометрическая схема вычисления вероятности
- •1.4.2 Статистическая схема вычисления вероятности
- •1.4.3 Схема вычисления субъективной вероятности
- •1.5 Условная вероятность. Независимость событий. Формулы сло-
- •1.6 Формула полной вероятности и формулы Байеса
- •2 Случайные величины
- •2.1 Cлучайная величина и ее функция распределения
- •2.2 Дискретная случайная величина
- •2.2.1 Дискретный закон распределения
- •2.2.2 Числовые характеристики дискретного распределения
- •2.2.3 Производящая функция вероятностей
- •2.2.4 Биномиальное распределение
- •2.2.5 Распределение Пуассона
- •2.2.6 Геометрическое распределение
- •2.3 Непрерывные случайные величины
- •2.3.1 Функция распределения и плотность распределения
- •2.3.2 Числовые характеристики непрерывного распределения
- •2.3.3 Равномерное распределение
- •2.3.4 Нормальное распределение
- •2.3.5 Показательное распределение
- •2.4 Функция от случайной величины
- •3 Случайные векторы
- •3.1 Общие свойства случайного вектора
- •3.2 Случайные векторы дискретного типа
- •3.3 Непрерывные случайные векторы
- •4 Предельные теоремы
- •4.1 Закон больших чисел
- •4.2 Центральная предельная теорема
- •5 Элементы математической статистики
- •5.1 Выборка и выборочные законы распределения
- •5.2 Точечные оценки числовых характеристик случайных величин
- •5.3 Интервальные оценки
- •5.4 Проверка статистических гипотез
5.2 Точечные оценки числовых характеристик случайных величин
Отдельные свойства случайной величины определяются целым рядом
числовых характеристик таких, как математическое ожидание, медиана, дис-
персия, стандартное отклонение и т.д. Кроме того формулы функции распре-
деления FX(x) или плотности распределения fX(x) , как правило, содержат
один или несколько параметров. Данные параметры называют параметрами
закона распределения и подразделяют на параметры положения, масштаба
и формы. Параметры закона распределения позволяют в компактной форме
задавать класс распределений одного типа, т. е. распределений полученных
из некоторого основного распределения путем линейных преобразований.
Используя выборку, для числовых характеристик или параметров рас-
пределения можно вычислить соответствующие приближённые числовые зна-
чения, называемые точечными оценками. Точечные оценки необходимы
для оценивания числовых характеристик или параметров распределения и
являются частными случаями статистик , т. е. некоторых случайных ве-
личин, полученных в виде функций выборочного вектора.
Точечные оценки должны обладать определенными положительными
свойствами, такими как простота вычислений по выборке, информативность,
несмещённость, состоятельность, эффективность, робастность и т.д.
Точечную оценку называют несмещённой , если её математическое
ожидание равно оцениваемой числовой характеристике. Несмещённые точеч-
ные оценки, вычисленные по нескольким выборкам, группируются симмет-
ричным образом относительно оцениваемой характеристики.
Наиболее распространенным и достаточно простым методом статисти-
ческого оценивания является метод подстановки . Данный метод состоит
в том, что в качестве точечной оценки той или иной числовой характеристики
генеральной совокупности берут соответствующую характеристику выбороч-
ной случайной величины, принимающей значения x1, x2, . . . , xnс вероятно-
стями, равными 1/n . Полученные по методу подстановки точечные оценки
называют выборочными характеристиками .
Выборочное среднее арифметическое или просто среднее арифмети-
ческое по методу подстановки определяется как математическое ожидание
102
выборочной случайной величины и рассчитывается по формуле
Ї =
n
∑
k=1
xk· pk=
n
∑
k=1
xk·
1
n
=
1
n
n
∑
k=1
xk.
Выборочное среднее арифметическое является несмещенной точечной
оценкой математического ожидания генеральной совокупности с функцией
распределения FX(x) , что показывается следующим образом:
M ( Ї ) = M
1
n
n
∑
k=1
Xk
!
=
1
n
n
∑
k=1
M (Xk) =
1
n
· nmx= mx, n ∈ N.
Аналогично показывается, что выборочная (эмпирическая) дисперсия
n
∑
Dx∗=
k=1
(xk− Ї)2/n
является смещенной оценкой дисперсии Dxтеоретического распределения.
Для того чтобы убрать смещение выборочную дисперсию Dx∗ умножа-
ют на дробь n/(n − 1) и используют другую точечную оценку Dxвида
n
s2x=
∑
k=1
(xk− Ї)2
n − 1
,
которая уже является несмещённой оценкой дисперсии Dx, что показы-
вается вычислением математического ожидания данной оценки s2x.
Отметим, что выборочное стандартное отклонение sx, опреде-
ляемое как корень квадратный из несмещенной оценки дисперсии s2x
v
u
n
(xk− Ї)2
u∑
,
sx=t
k=1
(n − 1)
не является несмещенной оценкой для стандартного отклонения σx.
Точечные оценки начальных и центральных моментов вычисляют как
α∗l=
n
∑
k=1
xk
l·1
n
, µ∗l=
n
∑
(xk− Ї)l·
k=1
1
n
, l = 1, 2, 3, . . . .
Отсюда находят выборочные коэффициенты асимметрии и эксцесса :
a∗x=
µ∗
3 , e∗
µ∗
4
− 3 .
s3
x=
103
s4
Отметим, что все выборочные начальные моменты являются несмещёнными
оценками соответствующих начальных моментов генеральной совокупности,
а для центральных моментов требуется дополнительный анализ свойств ве-
роятностной модели, сформировавшей данную выборку.
Статистика называется состоятельной , если при увеличении объёма
выборки она сходится по вероятности к оцениваемому параметру.
Cреднее арифметическое является состоятельной точечной оценкой ма-
тематического ожидания генеральной совокупности с функцией распределе-
ния FX(x) , что следует из закона больших чисел.
Все выборочные начальные и центральные моменты также являются
состоятельными оценками для соответствующих числовых характеристик,
что позволяет при больших объемах выборки приближённо заменять харак-
теристики генеральной совокупности их выборочными аналогами.
Несмещённая статистика называется эффективной , если она имеет
наименьшую дисперсию в своём классе. Для любого закона распределения
неравенство Рао–Крамера задаёт нижнюю границу дисперсий оценок. В част-
ности, среднее арифметическое при любом объёме выборки является эффек-
тивной оценкой, а выборочная дисперсия асимптотически эффективной.
Робастные статистики являются устойчивыми, надёжными при
условиях засорения выборки аномальными наблюдениями.
Робастной оценкой характеристики или параметра положения является
выборочная медиана h∗x, вычисляемая по формуле
x(k),n = 2k + 1,
h∗x=
(x(k)+x(k+1))/2, n = 2k.
Выборочная медиана делит вариационный ряд на две равные части и приво-
дит к правильному результату даже в том случае, когда выбросы составляют
почти половину объёма выборки.
Отметим, что выборочное среднее Ї может заметно отличаться от оце-
ниваемой характеристики при наличии в выборке хотя бы одного выброса.
Робастными статистиками для оценивания характеристики рассеива-
ния в генеральной совокупности являются выборочный интерквартильный
размах и выборочное серединное отклонение:
w0∗,5=x∗0,75 − x∗0,25, Ex∗=w∗0,5/2.
Здесь x∗0,25,x∗0,75 выборочные квартили уровней 0, 25 и 0, 75 соответ-
ственно, вычисленные по следующему правилу. Если p заданная вероят-
ность, равная, например, 0, 25 или 0, 75 , то выборочный квантиль x∗pуровня
104
p соответствует элементу вариационного ряда с номером k = [np] + 1 , когда
число np дробное. Если же число np целое, то соответствующий квантиль
x∗pопределяется по формуле x∗p= (x(np)+x(np+1))/2 . Как видно из определе-
ния интерквартильный размах даёт оценку, близкую к теоретической, даже в
том случае, когда примерно 25% наблюдений слева и справа от выборочной
медианы являются аномальными наблюдениями.