- •Содержание
- •Введение
- •Глава 3. Элементы математической статистики
- •3.1. Выборочный метод
- •3.1.1 Задачи и методы математической статистики
- •3.1.2 Виды выборки
- •3.2. Графическое представление эмпирических данных
- •3.2.1. Эмпирическая функция распределения. Кумулята
- •3.2.2 Полигон и гистограмма
- •3.3. Числовые характеристики вариационного ряда
- •3.4. Статистические оценки параметров распределения
- •3.4.2 Точечные оценки параметров распределения
- •3.4.3. Метод моментов
- •3.4.4 Метод наибольшего (максимального) правдоподобия
- •3.5. Интервальные оценки параметров распределения
- •3.5.1 Доверительная вероятность. Доверительные интервалы
- •3.5.2 Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении
- •3.5.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении
- •3.5.4 Доверительный интервал для дисперсии и среднего квадратического отклонения
- •3.5.5 Доверительный интервал для вероятности успеха в схеме Бернулли
- •3.6. Статистическая проверка статистических гипотез
- •3.6.1 Статистические гипотезы. Основные понятия
3.2. Графическое представление эмпирических данных
3.2.1. Эмпирическая функция распределения. Кумулята
Эмпирическая функция распределения. Каждая генеральная совокупность имеет некоторую функцию распределения F(x). Обычно она неизвестна. По выборке можно найти эмпирическую функцию распределения F*(x).
Эмпирической функцией распределения F*(x) (функцию распределения выборки) называют функцию F*(x), которая определяет для каждого значения x относительную частоту события X<x.
Теоретической функцией распределения называют функцию распределения генеральной совокупности, которая определяет вероятность события X<x. На основании закона больших чисел (в форме Бернулли) эмпирическая функция распределения выборки F*(x) служит для приближенного представления теоретической функции распределения генеральной совокупности. Итак,
, (3.3)
где n — объем выборки, — число всех элементов выборки, значения которых строго меньше x. Отличие эмпирической функции распределения F*(x) от реальной (теоретической) F(x) заключается в том, что для ее составления берется не вся генеральная совокупность, а выборка, и вероятность pi заменяется относительной частотой . Т.о., теоретическая функцияF(x) определяет вероятность события X<x, а эмпирическая функция F*(x) определяет относительную частоту этого же события.
Следует заметить, что вероятность pi — тоже относительная частота, только примененная к самой генеральной совокупности: pi= Ni/N. Отсюда возникают два важных свойства эмпирической функции распределения F*(x):
(3.4)
т.е. эмпирическая функция распределения в каждой своей точке сходится по вероятности к соответствующей ей теоретической функции распределения. Т.о., для всякой эмпирической функции распределения существует равная ей теоретическая функция распределения некоей генеральной совокупности. Следовательно, эмпирическая функция распределения обладает всеми свойствами теоретической функции распределения ДСВ (см. гл. II):
F*(x)[0;1];
F*(x) – неубывающая функция;
если задана ранжированная последовательность вариант x1, x2,…,xn, то F*(x1)=0, F*(xn+0)=1.
Итак, если выборка задана вариационным рядом (xi, ), то эмпирическая функция распределения имеет вид:
(3.5)
График эмпирической функции распределения называют кумулятой. Для выборки, взятой из генеральной совокупности, имеющей вид ДСВ, кумулята носит характер ступенчатой ломаной (Рис. 1). Для выборки, взятой из генеральной совокупности, имеющей вид НСВ, для построения кумуляты точки с координатами (xi; F*(xi)) соединяют отрезками. В таком случае кумулята носит характер непрерывной ломаной.
Задача 1. Контролер ОТК анализировал отклонение длины деталей в мм от Госстандарта на основе выборки, состоящей из 50 деталей. По результатам выборки построить эмпирическую функцию распределения:
xi |
-2 |
0 |
1 |
3 |
5 |
8 |
ni |
8 |
5 |
11 |
16 |
4 |
6 |
Решение:
Объем выборки равен n=8+5+11+16+4+6=50. Тогда вариационный ряд относительных частот имеет вид:
xi |
-2 |
0 |
1 |
3 |
5 |
8 |
ni/n |
0.16 |
0.10 |
0.22 |
0.32 |
0.08 |
0.12 |
В соответствии с формулой (1.5) построим эмпирическую функцию распределения:
Рис. 1
Если задан интервальный вариационный ряд, то для составления эмпирической функции находят середины интервалов xi+h/2 и по ним получают эмпирическую функцию аналогично точечному вариационному ряду. Т.о., вся часть выборки, попавшая в интервал (хi , xi+h], как бы “концентрируется” в середине этого интервала – в точке xi+h/2.