Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс лекций _Выборочный метод_Новротская.doc
Скачиваний:
18
Добавлен:
10.11.2018
Размер:
398.85 Кб
Скачать

Интервальное статистическое распределение

Если признак может принимать любые значения из некоторого промежутка, т.е. является непрерывной случайной величиной, то необходимо промежуток между наименьшим и наибольшим значениями признака в выборке разбить на несколько интервалов одинаковой (или разной) длины. При этом количество интервалов k не должно быть меньше 6 – 10 и больше 20 – 25 (выбор числа интервалов зависит от объема выборки n).

При подборе количества интервалов можно пользоваться приближенной формулой, которую предложил американский статистик Sturgess (Стерджесс):

– целая часть числа х.

Затем определяем длину частичного интервала группировки:

, где R = – размах выборки.

Находим границы каждого из непересекающихся частичных интервалов :

a1 = xmin; b1 = a1 + h;

a2 = b1; b2 = a2 + h и т.д.

Далее каждому интервалу требуется поставить в соответствие число выборочных значений признака, попавших в этот интервал. В результате получим интервальное статистическое распределение:

Таблица 3.3

Интервалы

[a1; b1)

[a2; b2)

[a3; b3)

...

[ak; bk)

Частоты

m1

m2

m3

...

mk

Используя интервальное статистическое распределение, можно вычислить относительную частоту, накопленную частоту, эмпирическую функцию распределения, так же как и для дискретного статистического распределения.

Если в интервальном распределении каждый интервал заменить числом, лежащим в его середине (ai + bi)/2, то получим дискретное статистическое распределение. Такая замена вполне естественна, так как, например, при измерении размера детали с точностью до одного миллиметра, всем размерам из промежутка [49,5 мм; 50,5 мм) будет соответствовать одно число, равное 50.

Для графического изображения интервального распределения используется гистограмма. Для ее построения в прямоугольной системе координат по оси абсцисс откладываем границы интервалов группировки и на этих интервалах как на основаниях строим прямоугольники, высоты которых откладываются на оси ординат. Различают:

а) гистограмму абсолютных частот, когда высота прямоугольника равна ;

б) гистограмму относительных частот, когда высота прямоугольника равна .

Гистограмма является выборочным аналогом графика плотности вероятности. Площадь на интервале (aj; am) можно интерпретировать как приближенное значение вероятности попадания случайной величины Х в этот интервал, т.е. .

Основное свойство гистограммы: ее площадь для абсолютных частот равна n, а для относительных частот равна единице.

Отношение относительной частоты к длине частичного интервала h называют плотностью распределения частоты на интервале (рис. 3.5).

Рис. 3.5. Гистограмма относительных частот

При построении графика эмпирической функции распределения для интервального ряда необходимо учитывать, что функция определена только на концах интервалов.

Таким образом, статистическое распределение выборки можно рассматривать как статистический аналог для распределения генеральной совокупности. Из-за случайных колебаний эти два распределения, как правило, не будут совпадать, но можно ожидать, что при большом объеме выборки ее распределение будет служить приближением для генеральной совокупности, т.е. , если .

Пример 2. Получены данные о выработке продукции 30-ю рабочими в отчетном месяце в процентах к предыдущему месяцу

n

Х – выработка продукции, %

1-10

125

91

82

93

101

111

109

103

121

90

11-20

79

105

115

95

84

130

104

117

127

107

21-30

85

76

98

104

126

113

98

84

113

123

Необходимо:

  1. составить интервальное статистическое распределение;

  2. построить гистограмму относительных частот.

Решение

1. Определим величину частичных интервалов:

Построим 6 непересекающихся интервалов:

[70,5; 81,5), [81,5; 92,5), [92,5; 103,5),

[103,5; 114,5), [114,5; 125,5), [125,5; 136,5).

Первый интервал [70,5; 81,5) содержит два значения (76 и 79), поэтому m1 = 2. Второй интервал [81,5; 92,5) содержит шесть значений (82, 84, 84, 85, 90, 91), поэтому m2 = 6 и т.д. Полученные данные внесем в таблицу интервального статистического распределения:

Таблица 3.4

Интервалы

[70,5-

81,5)

[81,5-

92,5)

[92,5-

103,5)

[103,5-

114,5)

[114,5-

125,5)

[125,5-

136,5)

Частоты

2

6

6

8

5

3

2. Для построения гистограммы вычислим значения относительных частот wi и значения плотности распределения частоты на интервале :

Таблица 3.5

Интервалы

[70,5-

81,5)

[81,5-

92,5)

[92,5-

103,5)

[103,5-

114,5)

[114,5-

125,5)

[125,5-

136,5)

mi

2

6

6

8

5

3

wi

0,07

0,20

0,20

0,27

0,17

0,10

0,006

0,018

0,018

0,024

0,015

0,009

Изобразим данные последней строки табл. 3.5 на графике (рис. 3.6).

Обведем гистограмму плавной линией f*(x) так, чтобы приблизительно были равны площади, ограниченные гистограммой и кривой f*(x), которую называют эмпирической плотностью распределения относительных частот. В генеральной совокупности ей соответствует плотность вероятности f(x).

Рис. 3.6. Гистограмма относительных частот