Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по теории вероятностей.doc
Скачиваний:
165
Добавлен:
02.05.2014
Размер:
3.94 Mб
Скачать

4.1 Оценка функций распределения

Теоретической основой статистического исследования является генеральная совокупностьГ, представляющая собой отображение всех свойств реального явления в некоторое числовое множество.

Исходным материаломстатистического исследования является совокупность статистических данных, представленных в виде конечного набораnчисел:

(118)

из генеральной совокупности Г.

Набор чисел (118) называется выборкойобъемаn, если он получен в соответствии с правилами комбинаторики при выборе с возвращением.

Пусть - случайная величина, определенная на множестве Г, с функцией распределенияF(x).

Поставим задачу: по выборке (118) получить как можно больше информации о всей генеральной совокупности (в идеале, это построение вероятностного пространства (Г, F(x)), хотя, в ряде случаев, ограничиваются оценкой числовых характеристик случайных величин).

Замечание. Интуитивно ясно, что выборка (118) должна бытьрепрезентативна, то есть ее элементы должны отражать все основные свойства реального явления. Если это неизвестно, то следует полагаться на интуицию. В любом случае, репрезентативность выборки можно оценить только при проверке построенной статистической модели на адекватность.

Выберем из выборки (118) элементы в порядке их возрастания

 … . (119)

Упорядоченная выборка (119) называется вариационным рядом, а его элементы признаками. Обозначим через mr число повторений признака r,

, тогда выборку (118) можно представить в виде простой статистической табл. 10.

Таблица 10

...

( mr = n) .

...

Числа называют абсолютной частотой,

Как правило, таблица 10 составляется для дискретных, случайных величин.

Для непрерывных случайных величин используется табл. 11.

Таблица 11

интервалы

...

.

относит.

частота

...

Величина называется относительной частотой,

Табл. 11 можно изобразить графически в виде гистограммы, представленной на рис. 32.

Рис. 32

Гистограмма – набор прямоугольников, в основании которых лежат длины интервалов , а их высоты определяются равенством.

Учитывая, что сумма площадей прямоугольников равна , то гистограмма есть статистический аналог плотности.

Замечание. Часто, при исследовании непрерывной случайной величины для выборок большого объема (n 50) рассматривают интервалы равной длины h, определяемые формулой

,

, . Обычно, что продиктованол практической целесообразностью.

Величина R =называетсяразмахом выборки (118) (или вариационного ряда (119)).

Желательно, чтобы, при выборе длин интервалов hr гистограммы, не получались прямоугольники с площадью равной 0. В противном случае, это может привести к неверному выбору плотности распределения. Положение всегда можно исправить путем соответствующего изменения длин интервалов hr.

Если выборка (118) достаточно большого объема и репрезентативна, то можно построить эмпирическую функцию распределения исследуемой случайной величины , , которая определяется формулой:

(120)

где , а m – число элементов выборки (118), не превосходящих заданного х.

Если случайная величина - непрерывна, то эмпирическая функция может быть задана формулой

(121)