Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат_статистика.doc
Скачиваний:
22
Добавлен:
22.09.2019
Размер:
370.18 Кб
Скачать

Эмпирическая функция распределения

Пусть пх – число наблюдений, при которых наблюдалось значение признака Х, меньшее х. При объеме выборки, равном п, относительная частота события Х < х равна пх / п.

Определение 1. Функция, определяющая для каждого значения х относительную частоту события Х < х,

F* (х) = пх / п (3)

называется эмпирической функцией распределения, или функцией распределения выборки.

В отличие от эмпирической функции распределения F*(х) выборки функция распределения F(x) генеральной совокупности называется теоретической функцией распределения. Различие между ними состоит в том, что функция F(x) определяет вероятность события Х < х, a F*(х) — относительную частоту этого события. Из теоретических результатов обшей теории вероятностей (закон больших чисел) следует, что при больших п вероятность отличия этих функций друг от друга близка к единице:

(4)

Нетрудно увидеть, что F*(х) обладает всеми свойствами F(х), что вытекает из ее определения (3):

  1. значения F* (х) принадлежат отрезку [0, 1]

  2. F* (х) является неубывающей функцией

  3. пусть хт и хМ — соответственно, минимальная и максимальная варианты, тогда F* (х) = 0 при ххт и F* (х) = 1 при х хМ.

Сама же функция F*(х) служит для оценки теоретической функции распределения F (x) генеральной совокупности.

Пример 3. Построить эмпирическую функцию по заданному распределению выборки:

хi

2

4

6

пi

10

15

25

Решение. Находим объем выборки: п = 10 + 15 + 25 = 50. Наименьшая варианта равна 2, поэтому F* (х) = 0 при х 2. Значение Х < 4 (при х1 = 2) наблюдалось 10 раз, значит, F* (х) = 10/50 = 0,2 при 2 < х < 4. Значения Х < 6 (а именно, х1 = 2 и х2 = 4) наблюдались 10 + 15 = 25 раз, значит, при 4 < х < 6 функция F* (х) = 25/50 = 0,5. Поскольку х = 6 – максимальная варианта, то F* (х) = 1 при х > 6. Напишем формулу искомой эмпирической функции:

График этой функции показан на рис. 1.

Рис. 1 График эмпирической функции по данным примера 3

Полигон и гистограмма

Каждую пару значений (хi, пi) из распределения выборки можно трактовать как точку на координатной плоскости. Точно так же можно рассматривать и пары значении (хi, wi) относительного распределения выборки.

Ломаная, отрезки которой соединяют точки (хi, пi), называется полигоном частот

Ломаная, соединяющая на координатной плоскости точки (хi, wi), называется полигоном относительных частот.

На рис. 2 показан полигон относительных частот для распределения, приведенного в примере 2.

Рис. 2. Полигон относительных частот распределении по данным примера 2

Для случая непрерывного признака Х удобно разбить интервал (хmin, хmax) его наблюдаемых значении на несколько частичных интервалов данной h каждый и найти для каждого из этих интервалов сумму частот nj, попавших в него.

Ступенчатая фигура, состоящая из прямоугольников с основаниями длиной h и высотами nj / h (плотность частоты), называется гистограммой частот.

Геометрический смысл гистограммы: нетрудно увидеть, что площадь ее равна сумме всех частот, или объему выборки. На рис. 3 изображена гистограмма выборки объема n = 100.

Рис. 3. Пример гистограммы выборки объема n = 100

Аналогичным образом определяется и гистограмма относительных частот. Высоты прямоугольников, составляющих ступенчатую фигуру, определяются отношениями сумм относительных частот, попадающих в интервал (xmin + (j1) h, xmin + j h), к длине интервала h, т.е. величинами wj / h. В этом случае площадь гистограммы относительных частот равна единице (сумме относительных частот выборки).