Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
TV11_1_2.doc
Скачиваний:
25
Добавлен:
12.07.2019
Размер:
2.01 Mб
Скачать

5.2 Точечные оценки числовых характеристик случайных величин

Отдельные свойства случайной величины определяются целым рядом

числовых характеристик таких, как математическое ожидание, медиана, дис-

персия, стандартное отклонение и т.д. Кроме того формулы функции распре-

деления FX(x) или плотности распределения fX(x) , как правило, содержат

один или несколько параметров. Данные параметры называют параметрами

закона распределения и подразделяют на параметры положения, масштаба

и формы. Параметры закона распределения позволяют в компактной форме

задавать класс распределений одного типа, т. е. распределений полученных

из некоторого основного распределения путем линейных преобразований.

Используя выборку, для числовых характеристик или параметров рас-

пределения можно вычислить соответствующие приближённые числовые зна-

чения, называемые точечными оценками. Точечные оценки необходимы

для оценивания числовых характеристик или параметров распределения и

являются частными случаями статистик , т. е. некоторых случайных ве-

личин, полученных в виде функций выборочного вектора.

Точечные оценки должны обладать определенными положительными

свойствами, такими как простота вычислений по выборке, информативность,

несмещённость, состоятельность, эффективность, робастность и т.д.

Точечную оценку называют несмещённой , если её математическое

ожидание равно оцениваемой числовой характеристике. Несмещённые точеч-

ные оценки, вычисленные по нескольким выборкам, группируются симмет-

ричным образом относительно оцениваемой характеристики.

Наиболее распространенным и достаточно простым методом статисти-

ческого оценивания является метод подстановки . Данный метод состоит

в том, что в качестве точечной оценки той или иной числовой характеристики

генеральной совокупности берут соответствующую характеристику выбороч-

ной случайной величины, принимающей значения x1, x2, . . . , xnс вероятно-

стями, равными 1/n . Полученные по методу подстановки точечные оценки

называют выборочными характеристиками .

Выборочное среднее арифметическое или просто среднее арифмети-

ческое по методу подстановки определяется как математическое ожидание

102

выборочной случайной величины и рассчитывается по формуле

Ї =

n

k=1

xk· pk=

n

k=1

xk·

1

n

=

1

n

n

k=1

xk.

Выборочное среднее арифметическое является несмещенной точечной

оценкой математического ожидания генеральной совокупности с функцией

распределения FX(x) , что показывается следующим образом:

M ( Ї ) = M

1

n

n

k=1

Xk

!

=

1

n

n

k=1

M (Xk) =

1

n

· nmx= mx, n ∈ N.

Аналогично показывается, что выборочная (эмпирическая) дисперсия

n

Dx=

k=1

(xk− Ї)2/n

является смещенной оценкой дисперсии Dxтеоретического распределения.

Для того чтобы убрать смещение выборочную дисперсию Dx∗ умножа-

ют на дробь n/(n − 1) и используют другую точечную оценку Dxвида

n

s2x=

k=1

(xk− Ї)2

n − 1

,

которая уже является несмещённой оценкой дисперсии Dx, что показы-

вается вычислением математического ожидания данной оценки s2x.

Отметим, что выборочное стандартное отклонение sx, опреде-

ляемое как корень квадратный из несмещенной оценки дисперсии s2x

v

u

n

(xk− Ї)2

u∑

,

sx=t

k=1

(n − 1)

не является несмещенной оценкой для стандартного отклонения σx.

Точечные оценки начальных и центральных моментов вычисляют как

α∗l=

n

k=1

xk

l·1

n

, µ∗l=

n

(xk− Ї)l·

k=1

1

n

, l = 1, 2, 3, . . . .

Отсюда находят выборочные коэффициенты асимметрии и эксцесса :

a∗x=

µ∗

3 , e∗

µ∗

4

− 3 .

s3

x=

103

s4

Отметим, что все выборочные начальные моменты являются несмещёнными

оценками соответствующих начальных моментов генеральной совокупности,

а для центральных моментов требуется дополнительный анализ свойств ве-

роятностной модели, сформировавшей данную выборку.

Статистика называется состоятельной , если при увеличении объёма

выборки она сходится по вероятности к оцениваемому параметру.

Cреднее арифметическое является состоятельной точечной оценкой ма-

тематического ожидания генеральной совокупности с функцией распределе-

ния FX(x) , что следует из закона больших чисел.

Все выборочные начальные и центральные моменты также являются

состоятельными оценками для соответствующих числовых характеристик,

что позволяет при больших объемах выборки приближённо заменять харак-

теристики генеральной совокупности их выборочными аналогами.

Несмещённая статистика называется эффективной , если она имеет

наименьшую дисперсию в своём классе. Для любого закона распределения

неравенство Рао–Крамера задаёт нижнюю границу дисперсий оценок. В част-

ности, среднее арифметическое при любом объёме выборки является эффек-

тивной оценкой, а выборочная дисперсия асимптотически эффективной.

Робастные статистики являются устойчивыми, надёжными при

условиях засорения выборки аномальными наблюдениями.

Робастной оценкой характеристики или параметра положения является

выборочная медиана h∗x, вычисляемая по формуле

 x(k),n = 2k + 1,

h∗x=

 (x(k)+x(k+1))/2, n = 2k.

Выборочная медиана делит вариационный ряд на две равные части и приво-

дит к правильному результату даже в том случае, когда выбросы составляют

почти половину объёма выборки.

Отметим, что выборочное среднее Ї может заметно отличаться от оце-

ниваемой характеристики при наличии в выборке хотя бы одного выброса.

Робастными статистиками для оценивания характеристики рассеива-

ния в генеральной совокупности являются выборочный интерквартильный

размах и выборочное серединное отклонение:

w0,5=x∗0,75 − x∗0,25, Ex∗=w∗0,5/2.

Здесь x∗0,25,x∗0,75 выборочные квартили уровней 0, 25 и 0, 75 соответ-

ственно, вычисленные по следующему правилу. Если p заданная вероят-

ность, равная, например, 0, 25 или 0, 75 , то выборочный квантиль x∗pуровня

104

p соответствует элементу вариационного ряда с номером k = [np] + 1 , когда

число np дробное. Если же число np целое, то соответствующий квантиль

x∗pопределяется по формуле x∗p= (x(np)+x(np+1))/2 . Как видно из определе-

ния интерквартильный размах даёт оценку, близкую к теоретической, даже в

том случае, когда примерно 25% наблюдений слева и справа от выборочной

медианы являются аномальными наблюдениями.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]