Графическое представление статистических распределений
Для наглядности принято использовать следующие формы графического представления статистических распределений: полигоны и гистограммы.
Дискретный ряд изображают в виде полигона. Полигон частот- ломаная линия, отрезки которой соединяют точки с координатами (i,i); аналогичнополигон относительных частот- ломаная, отрезки которой соединяют точки с координатами (,wi ).
Интервальный ряд изображают в виде гистограммы. Гистограмма частотесть ступенчатая фигура, состоящая из прямоугольников, основания которых - интервалы длиной, а высоты - плотности частот. Длягистограммы относительных частотвысоты прямоугольников - плотности относительных частот. Здесь в общем случае , однако на практике чаще всего полагают величинуhодинаковой для всех интервалов.где i=1, 2, ..., k.
Площадь гистограммы есть сумма площадей ее прямоугольников.
таким образом, площадь гистограммы частот равна объему выборки, а площадь гистограммы относительных частотравна единице.
В теории вероятностей гистограмме относительных частот соответствует график плотности распределения вероятности . Поэтому гистограмму можно использовать для подбора закона распределения генеральной совокупности.
Кумулятивныеряды графически изображают в видекумуляты. Для ее построения на оси абсцисс откладывают варианты признака или интервалы, а на оси ординат - накопленные частотыН() или относительные накопленные частоты, а затем точки с координатами (i;H(i )) или (i;) соединяют отрезками прямой. В теории вероятностей кумуляте соответствует график интегральной функции распределения.
Замечание 1.Если в статистическом исследовании исходным является статистическое распределение в виде интервального ряда (сгруппированные данные), а исходный вариационный ряд недоступен, то точное расположение отдельных вариант, попавших в каждый из интервалов, неизвестно. Только выбирая в качестве аргумента эмпирической функции распределения правую границу интервала (xi-1-xi), мы уверены, что все варианты, попавшие в этот интервал, будут учтены (просуммированы) в значении накопленной частоты (накопленной относительной частоты), соответствующей этому интервалу.
Поэтому в случае интервального ряда значения иH(x) точно определены лишь для правой границы интервала:x=xi. В остальных точках интервалаxi-1 <x<xi значенияиH(x) можно задать лишь приближенно. Примером может служить кумулята, отрезки прямых которой представляют собой выраженную в графической форме линейную интерполяцию значенийиH(x) на интервалеxi-1 <x<xi.
Замечание 2.В случае дискретного ряда использовать кумуляту для изображенияиH(x) можно лишь условно, для наглядности. Более корректным является изображение эмпирической функции распределения, а такжеH(x) по аналогии с теоретической функцией распределениядискретной случайной величины (рис. 3) ступенчатым графиком - отрезками прямых, параллельных оси абсцисс; длины отрезков -hi =xi - xi-1 , расстояния от отрезков до оси абсцисс -, илиH(xi).
Пример 1. Имеется распределение 80 предприятий по числу работающих на них (чел.):
150 |
250 |
350 |
450 |
550 |
650 |
750 |
| |
1 |
3 |
7 |
30 |
19 |
15 |
5 |
. |
Построить полигон распределения частот.
Решение. ПризнакХ- число работающих (чел.) на предприятии. В данной задаче признакХявляется дискретным. Поскольку различных значений признака сравнительно немного -k= 7, применять интервальный ряд для представления статистического распределения нецелесообразно (в прикладной статистике в подобных задачах часто используют именно интервальный ряд). Ряд распределения - дискретный. Построим полигон распределения частот (рис. 1).
Рис. 1
Пример 2. Дано распределение 100 рабочих по затратам времени на обработку одной детали (мин):
xi-1-xi |
22-24 |
24-26 |
26-28 |
28-30 |
30-32 |
32-34 |
|
2 |
12 |
34 |
40 |
10 |
2 |
. |
Построить гистограмму частот.
Решение. ПризнакХ - затраты времени на обработку одной детали (мин). ПризнакХ -непрерывный, ряд распределения - интервальный. Построим гистограмму частот (рис. 2), предварительно определив(k= 6) и плотность частоты.
xi-1-xi |
22-24 |
24-26 |
26-28 |
28-30 |
30-32 |
32-34 |
|
1 |
6 |
17 |
20 |
5 |
1 |
. |
Рис. 2
Пример 3. В распределении, данном в примере 1, найти накопленные частотыH(i ) и построить кумуляту.
Решение. Используем значенияН(х):H(x1)=0,H(xi)=H(xi-1)+mi-1(i=2, 3, ј,k+1, k=7).
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
xi |
150 |
250 |
350 |
450 |
550 |
650 |
750 |
850 |
mi |
1 |
3 |
7 |
30 |
19 |
15 |
5 |
0 |
H(i ) |
0 |
0+1=1 |
1+3=4 |
4+7=11 |
11+30=41 |
41+19=60 |
60+15=75 |
75+5=80 |
На рис. 3 показана кумулята распределения предприятий по числу работающих (чел.).
Пример 4. В распределении, данном в примере 2, составить эмпирическую функцию распределения и построить кумуляту относительных частот.
Решение. Используем значенияН(х):H(x0)=0,H(xi)=H(xi-1)+mi(i=1, 2, ј,k,k=6).Проверка:1.
|
i |
0 |
1 |
2 |
3 |
4 |
5 |
6 | |||||||
|
xi-1-xi |
-Ґ-22 |
22-24 |
24-26 |
26-28 |
28-30 |
30-32 |
32-34 | |||||||
|
mi |
0 |
2 |
12 |
34 |
40 |
10 |
2 | |||||||
|
H(i ) |
0 |
0+2=2 |
2+12=14 |
14+34=48 |
48+40=88 |
88+10=98 |
98+2=100 | |||||||
|
0 |
0,02 |
0,14 |
0,48 |
0,88 |
0,98 |
1 |
Построим кумуляту распределения (рис. 4).
Рис. 3
Рис. 4