Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методические указания к практическим занятиям по математике 4 семестр

.pdf
Скачиваний:
143
Добавлен:
29.03.2016
Размер:
3.9 Mб
Скачать

181

где n x число вариант, меньших x ; n объем выборки.

Полигон и гистограмма

Графически статистическое распределение может быть представлено в виде полигона, гистограммы или графика накопленных частот.

Полигоном частот называют ломаную, отрезки которой соединяют

точки x1 , n1 ,

x2 , n2 ,..., xk , nk . Полигоном относительных

частот

называют ломаную, отрезки которой соединяют точки

x1 , w1 ,

x2 , w2 ,..., xk ,

wk (рис. 15.1). Полигоны обычно служат для изображения

в случае дискретного распределения.

Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы

длины h , а высоты равны ni . Площадь гистограммы частот равна сумме

h

всех частот, т.е. объему выборки.

Рис. 15.1

Для построения гистограммы относительных частот за высоту

прямоугольников берут величину wi (рис. 15.2). Площадь гистограммы

h

относительных частот равна сумме всех относительных частот, т.е. единице.

Рис. 15.2

182

Рис. 15.3

Гистограммы обычно служат для изображения выборки в случае непрерывного распределения. Если на гистограмме частот соединить середины верхних сторон прямоугольников, то полученная ломаная образует полигон частот. Аналогично получается полигон относительных частот из гистограммы относительных частот (рис. 15.3).

При построении гистограммы в реальных исследованиях следует понимать, что формула Стерджеса для числа интервалов разбиения k дает лишь рекомендацию, а не строгое правило. Если взять слишком маленькое число k , то гистограмма получится грубой, плохо отражающей свойства распределения. При слишком больших k гистограмма становится «колючей», имеет игольчатый вид, и может распасться на отдельные «иглы» и пустые интервалы. Оптимальное значение k в общем случае неизвестно – оно зависит как от типа распределения, так и от конкретной выборки.

Графиком накопленных частот называется фигура, строящаяся аналогично гистограмме относительных частот, с тем различием, что для расчета высот прямоугольников вместо относительных частот берутся накопленные относительные частоты, т.е. величины

i

 

wic wi .

(15.3)

j 1

Эти величины неубывают и, таким образом, график накопленных частот имеет вид ступенчатой «лестницы». График эмпирической функции распределения проходит через правые верхние углы прямоугольников, то есть через точки вида (ci , wic ) . График накопленных частот и эмпирическая функция распределения на практике используются для приближения теоретической функции распределения.

183

Примеры решения задач

1. Построить эмпирическую функцию по данному распределению выборки:

 

 

 

xi

 

2

 

 

 

 

 

 

3

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

75

 

 

 

 

20

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

wi

 

0,75

 

 

 

 

0,2

 

0,05

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Найдем объем выборки:

75 20 5 100 .

Наименьшая

варианта равна 2, следовательно

 

 

 

 

 

 

 

 

 

 

 

 

Fn ( x ) 0

при x 2 .

 

 

Значение

X 3 ,

а именно x1 2

имеет

частоту

75, т.е.

это значение

наблюдалось 75 раз. Следовательно,

 

 

 

 

 

 

 

 

 

 

Fn

( x )

75

 

 

0, 75

при 2 x 3 .

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

Значения

X 5 ,

а именно

x1 2 и

 

x2

3

наблюдались 75 20 95 раз.

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fn

( x )

95

 

0, 95

при 3 x 5 .

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

Так как x 5 наибольшая варианта, то

 

 

 

 

 

 

 

 

 

 

Fn ( x ) 1

при x 5 .

 

 

Эмпирическая функция распределения имеет вид (рис. 15.4):

0, есл и x 2;

0 .7 5, есл и 2 x 3;

Fn ( x ) 0 .9 5, есл и 3 x 5;

1, есл и x 5 .

184

Рис. 15.4

2. По данным выборки составить дискретное статистическое распределение: 1, 10, 15, 13, 9, 13, 7, 6, 1, 2, 10, 9, 15, 1, 7, 7, 7, 8, 1, 13.

Решение. Объем выборки n 20 . Построим дискретный вариационный ряд, для этого надо расположить все значения выборки в возрастающем порядке. Получим

1, 1, 1, 1, 2, 6, 7, 7, 7, 7, 8, 9, 9, 10, 10, 13, 13, 13, 15, 15.

Теперь, по вариационному ряду, составим таблицу. В первой строке записываем различные варианты ряда, во второй строке – частоты соответствующих вариант, т.е. число повторений каждой варианты.

Например,

варианта

x1 1

появляется четыре раза в выборке,

значит

частота этой варианты n1 4 . Получим следующую таблицу:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

1

2

 

6

 

7

 

8

9

 

10

13

 

15

 

 

ni

 

4

1

 

1

 

4

 

1

2

 

2

3

 

2

 

 

Для

проверки

можно

 

сложить

все

частоты

ni ,

сумма

должна

получиться равной числу n , т.е. объему выборки. Проверим:

4 1 1 4 1 2 2 3 2 20 .

3. По данным выборки объема n 60 построить статистическое распределение.

1; 2,5; 1,5; 4; 6; 6,1; 3,7; 6,5; 2,5; 8,1; 7,8; 9,1; 5,1; 10; 13,4; 8,2; 4; 9,4; 11; 14,8; 13,2; 11,7; 15; 14,8; 12,8; 9,7; 13; 14; 3,4; 13,4; 8,4; 9,4; 9,1; 10,5; 4,8; 5; 1,3; 2,8; 8,6; 7; 14; 15; 7,3; 10; 12,7; 1,7; 5,6; 7,5; 8,9; 11,3; 13,7; 3; 6,3; 4; 3,2; 6,7; 15; 1,2; 7,9; 9,5.

185

Решение. Так как объем выборки достаточно велик и выборка содержит большое количество различных элементов, то данные выборки лучше сгруппировать. Найдем сначала крайние элементы ряда: xm in 1, xm ax 1 5 . Значит отрезок [1; 15] надо разбить на k интервалов

одинаковой длины. Чтобы найти оптимальное число интервалов разбиения, воспользуемся формулой Стерджеса (15.1)

k 1 lo g 2 n 1 log 2 60 7 .

То есть отрезок [1, 15] разбиваем на 7 интервалов. Длина этих интервалов одинакова и вычисляется по формуле (15.2):

h xm ax xm in 15 1 2 .

k

7

Получим следующие интервалы:

[1; 3), [3; 5), [5; 7), [7; 9), [9; 11), [11; 13), [13; 15].

Теперь надо найти частоты соответствующих интервалов. Частота каждого интервала это количество вариант, вошедших в этот интервал. Например, первый интервал [1; 3) попадают элементы 1; 2,5; 1,5; 2,5; 1,3;

2,8; 1,7; 1,2. Всего 8 элементов, значит, частота интервала [1; 3) равна 8. Проводя аналогичные рассуждения, получим следующую таблицу:

Номер

Частичный

Частоты ni

интервала

интервал

 

1

1–3

8

2

3–5

8

3

5–7

8

4

7–9

10

5

9–11

9

6

11–13

5

7

13–15

12

Эта таблица задает статистическое распределение исходной выборки.

4. Анализируется выборка из 100 малых предприятий региона. Цель обследования – измерение коэффициента соотношения заемных и собственных средств xi на каждом i ом предприятии. Результаты

анализа представлены в табл. 15.1. Требуется построить гистограмму и график накопленных частот.

186

Решение. Построим сгруппированный ряд наблюдений (табл. 15.2).

1) Определим по выборке xm in 5, 05 и

xm ax 5, 85 .

2) Разобьем весь диапазон [ xm in , xm ax ]

на k интервалов одинаковой

длины, используем формулу (15.1):

 

k 1 log 2 100 7, 62; k 8 .

Отсюда получаем, что длина интервала (15.2)

h

xm ax xm in

 

5, 85 5, 05

0,1 .

 

 

 

k

8

 

Таблица 15.1

Таблица 15.2

187

Рис. 15.5

Рис. 15.6

5. Построить полигон частот по данному распределению выборки:

 

xi

2

 

3

5

6

 

 

ni

10

 

15

5

20

 

Решение. Отложим на оси абсцисс варианты xi , а на оси ординат –

соответствующие им частоты ni ,

затем соединим последовательно точки

xi , ni . Полигон частот имеет вид:

188

Рис. 15.7

6. Построить гистограмму частот по данному распределению выборки:

Номер

Частичный

Частоты ni

интервала

интервал

 

1

2–7

5

2

7–12

10

3

12–17

25

4

17–22

6

5

22–27

4

Решение. Сначала найдем плотности частот, то есть величины ni .

h

Для данного примера h 5 . Таким образом, получаем

Номер

Плотность

интервала

частоты

1

1

2

2

3

5

4

1,2

5

0,8

Отложим на оси абсцисс интервалы длиной h 5 каждый, а затем проведем над ними отрезки, параллельные оси x , на расстояниях от нее,

равных соответствующим значениям плотности частоты (ось ординат), т.е. гистограмма частот состоит из прямоугольников, ширина каждого прямоугольника равна длине интервала h 5 , а высота равна плотности соответствующей частоты (рис. 15.8).

189

Рис. 15.8

7. Построить гистограмму относительных частот и график накопленных частот по данному распределению выборки:

Номер

Частичный

Частоты ni

интервала

интервал

 

1

10–15

2

2

15–20

4

3

20–25

8

4

25–30

4

5

30–35

2

Решение. Найдем относительные частоты и плотности относительных частот:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Плотность

 

Частота wi

 

Плотность

wi

накопленной частоты

 

 

 

 

 

c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

wi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

w1

 

 

n1

 

 

 

2

 

 

0,1

 

w1

 

 

0,1

 

 

 

0, 02

w1c 0, 0 2

 

n

20

 

 

h

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w2

 

 

n2

 

 

4

 

 

0, 2

 

w2

 

 

0, 2

 

0, 04

w2c 0, 0 2 0, 0 4 0, 0 6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

20

 

 

 

 

h

 

 

 

 

5

 

 

 

 

 

 

 

 

 

w3

 

n3

 

 

8

 

0, 4

 

w3

 

 

0, 4

0, 08

w3c 0, 0 6 0, 0 8 0,1 4

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

h

 

 

 

 

5

 

 

 

 

 

 

 

 

 

w4

 

n4

 

 

4

 

0, 2

 

w4

 

 

0, 2

0, 04

w4c 0,1 4 0, 0 4 0,1 8

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

20

 

 

 

 

h

 

 

 

 

5

 

 

 

 

 

 

 

 

 

w5

 

n5

 

 

 

 

2

 

 

0,1

 

w5

 

 

 

0,1

0, 02

w5c 0,1 8 0, 0 2 0, 2

n

 

 

20

 

 

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

190

Построим на оси абсцисс частичные интервалы h 5 , затем проведем параллельно им отрезки, отстоящие от оси x на соответствующие значения плотности относительной частоты:

Рис. 15.9

График накопленных частот строится аналогично гистограмме относительных частот, но вместо значений плотностей относительных частот, на оси ординат откладываются значения плотностей накопленных частот, т.е. мы строим прямоугольники, ширина которых равна h 5 , а высоты прямоугольников равны плотностям накопленных частот. Так как накопленные частоты возрастают с увеличением индекса, то и фигура должна получиться возрастающей.

Задачи для самостоятельного решения

1. Данные выборки приведены в таблице. Построить полигон частот. а)

 

xi

1

2

4

5

6

 

ni

5

2

8

3

2

б)

 

 

 

 

 

 

xi

-1

0

1

2

4

 

ni

5

4

3

6

2

в)

 

 

 

 

 

 

xi

0

1

2

3

4

 

ni

3

6

4

5

2