- •Математическая статистика теория и практика
- •220301, 230104, 230201 Очной формы обучения
- •Издательство
- •Оглавление
- •§1. Задачи математической статистики
- •§2. Генеральная и выборочная совокупность. Репрезентативность выборки. Способы отбора (способы организации выборки)
- •§3. Статистическое распределение выборки. Графическое представление распределений
- •Эмпирическая функция распределения
- •§4. Статистические оценки параметров распределения
- •§5. Генеральная средняя. Выборочная средняя. Оценка генеральной средней по выборочной средней
- •§6. Генеральная дисперсия. Выборочная дисперсия. Оценка генеральной дисперсии по исправленной дисперсии
- •§7. Метод моментов и метод наибольшего правдоподобия нахождения оценок параметров. Метод моментов
- •Метод наибольшего правдоподобия
- •§8. Доверительная вероятность. Доверительный интервал
- •Доверительный интервал для оценки математического ожидания
- •§9. Проверка гипотезы о соответствии статистических данных теоретическому закону распределения
- •§ 10. Понятие о корреляционном и регрессивном анализе
- •Индивидуальные задания
- •Ответы и указания
- •Приложения
- •Алгоритм проверки гипотез о законе распределения случайных величин
- •О нормальном законе распределения случайной величины X
- •Критические точки распределения 2
- •Список литературы
- •Учебное издание
- •Математическая статистика теория и практика
Эмпирическая функция распределения
Определение. Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события Х < х.
где nx – число вариантов (число хi) меньших х; n – объем выборки.
Свойства:
Значение F*(х) принадлежит отрезку [0, 1]: ;
F*(х) – неубывающая функция;
Если xi – наименьшее наблюдаемое значение, хk – наибольшее наблюдаемое значение, то F*(х) = 0 при ;
F*(х) = 1 при .
Пример 7. Пусть результаты наблюдений представлены в виде следующего ДСР (данные примера 3):
xi |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
wi |
1/20 |
2/20 |
3/20 |
4/20 |
5/20 |
3/20 |
2/20 |
Объём выборки по условию примера n = 20. Наименьшая варианта равна 1, значит, mx = 0 при x ≤ 1. Тогда при x ≤ 20. Следующая варианта в ранжированном ряду равна 2. Рассмотрим 1 < x ≤ 2. В этом случае неравенство X < x выполняется для варианты x1 = 1. Эта варианта встречается один раз в выборке, поэтому mx = 1 и .
Далее, если 2 < x ≤ 3, то неравенство X < x выполняется для вариант x1 = 1 и x2 = 2. Варианта x1 встречается один раз, а варианта x2 встречается два раза, поэтому mx = 1 + 2 = 3 и и т.д. Следовательно, аналитически функция определяется следующим образом:
|
Замечание. Вообще, если известен ДСР, то
Здесь xk совпадает с xmax. |
Суммы обычно называются накопленными относительными частотами.
Построим график по данным примера 7 (рис. 6).
Рис. 6
Если результаты наблюдений представлены в виде ИСР, то выборочную функцию строят иначе.
Пример 8. Рассмотрим для этого следующий вариационный ряд:
[xi; xi+1) |
[0; 10) |
[10; 20) |
[20; 30) |
[30; 40) |
[40; 50) |
wi |
1/30 |
2/30 |
3/30 |
4/30 |
5/30 |
[xi; xi+1) |
[50; 60) |
[60; 70) |
[70; 80) |
[80; 90) |
[90; 100] |
wi |
5/30 |
4/30 |
3/30 |
2/30 |
1/30 |
Очевидно, что для функция , т.к. mx = 0. Пусть теперь . В этом случае число не определено, т.к. неизвестно, сколько выборочных значений случайной величины, принадлежащих этому интервалу, меньше x. Если x = 10, то mx = 1. Следовательно, в этом случае . Рассуждая аналогично, убеждаемся, что точками, в которых значение функции можно определить, являются правые концы интервалов и все точки интервала . Значение функции в указанных точках можно записать в виде таблицы:
x |
|
10 |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
90 |
|
|
0 |
|
|
|
|
|
|
|
|
|
1 |
Так как эта таблица определяет функцию не полностью (не для всех x известны ее значения), то при графическом изображении данной функции ее доопределяют, соединив точки графика, соответствующие концам интервалов, отрезками прямой. В результате график функции будет представлять собой непрерывную линию. Подобный график выборочной функции часто называют кумулятивной кривой (от англ. accumulation – накопление).
Построим график по данным примера 8 (рис. 7).
Рис. 7
Задачи _______________________________________________________
Для проведения демографических исследований выбрали 50 семей и получили следующие данные о количестве членов семьи:
2 |
5 |
3 |
4 |
1 |
3 |
6 |
2 |
4 |
3 |
4 |
1 |
3 |
5 |
2 |
3 |
4 |
4 |
3 |
3 |
2 |
5 |
3 |
4 |
4 |
3 |
3 |
4 |
4 |
3 |
2 |
5 |
3 |
1 |
4 |
3 |
4 |
2 |
6 |
3 |
2 |
3 |
1 |
6 |
4 |
3 |
3 |
2 |
1 |
7 |
Составить ДСР.
В ходе проведения эксперимента получен следующий набор данных:
32 |
26 |
16 |
44 |
28 |
40 |
30 |
31 |
17 |
30 |
37 |
32 |
42 |
31 |
36 |
49 |
35 |
21 |
25 |
40 |
27 |
25 |
33 |
34 |
27 |
43 |
19 |
23 |
36 |
48 |
31 |
35 |
43 |
32 |
26 |
35 |
33 |
45 |
19 |
22 |
28 |
49 |
23 |
32 |
33 |
27 |
43 |
35 |
23 |
44 |
Составить ИСР, выбрав число интервалов группирования, равное 7.
На телефонной станции проводились наблюдения над числом X неправильных соединений в минуту. Наблюдения в течение часа дали следующие результаты:
3 |
1 |
3 |
1 |
4 |
2 |
2 |
4 |
0 |
3 |
0 |
2 |
2 |
0 |
2 |
1 |
4 |
3 |
3 |
1 |
4 |
2 |
2 |
1 |
1 |
2 |
1 |
0 |
3 |
4 |
1 |
3 |
2 |
7 |
2 |
0 |
0 |
1 |
3 |
3 |
1 |
2 |
4 |
2 |
0 |
2 |
3 |
1 |
2 |
5 |
1 |
1 |
0 |
1 |
1 |
2 |
2 |
1 |
1 |
5 |
Составить ДСР.
Управление сельского хозяйства Костромского района представило сводку по пятидесяти хозяйствам. Согласно этой сводке урожайность ржи в них составила (в центнерах с гектара):
17,5 |
17,8 |
18,6 |
18,3 |
19,1 |
19,9 |
20,6 |
20,1 |
22,0 |
21,4 |
17,5 |
18,5 |
19,0 |
20,0 |
22,0 |
20,6 |
19,1 |
18,6 |
17,9 |
19,1 |
22,0 |
19,0 |
17,5 |
22,0 |
22,0 |
21,0 |
21,4 |
19,0 |
17,8 |
18,3 |
19,9 |
20,1 |
21,4 |
18,5 |
20,0 |
20,6 |
18,6 |
21,4 |
21,0 |
20,0 |
20,0 |
18,0 |
18,0 |
18,0 |
17,5 |
18,6 |
19,1 |
20,6 |
17,5 |
18,6 |
Составить ИСР.
Наблюдается число выигрышей в мгновенной лотерее. В результате наблюдения получены следующие значения выигрышей (тыс. руб.):
0 |
1 |
0 |
0 |
5 |
0 |
10 |
0 |
1 |
0 |
0 |
1 |
5 |
1 |
0 |
0 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
5 |
0 |
5 |
0 |
0 |
1 |
1 |
1 |
5 |
1 |
10 |
0 |
1 |
1 |
0 |
5 |
0 |
0 |
0 |
0 |
1 |
0 |
1 |
0 |
5 |
0 |
0 |
0 |
0 |
1 |
0 |
|
|
|
|
|
|
Составить ДСР.
В таблице приведена выборка результатов измерения роста 105 студентов (юношей). Измерения проводились с точностью до 1 см:
155 |
170 |
185 |
180 |
188 |
152 |
173 |
178 |
178 |
168 |
185 |
173 |
170 |
183 |
175 |
173 |
170 |
183 |
175 |
180 |
175 |
193 |
178 |
183 |
180 |
197 |
178 |
181 |
187 |
168 |
174 |
179 |
184 |
183 |
178 |
180 |
178 |
163 |
166 |
178 |
175 |
182 |
190 |
167 |
170 |
178 |
183 |
170 |
178 |
181 |
173 |
168 |
185 |
175 |
170 |
155 |
169 |
186 |
179 |
189 |
155 |
174 |
179 |
179 |
169 |
186 |
174 |
171 |
184 |
175 |
193 |
178 |
184 |
180 |
196 |
175 |
181 |
188 |
168 |
179 |
178 |
183 |
184 |
178 |
181 |
177 |
163 |
166 |
178 |
175 |
183 |
190 |
167 |
170 |
178 |
183 |
170 |
178 |
182 |
173 |
168 |
186 |
176 |
171 |
188 |
|
|
|
|
|
Составить ИСР.
В супермаркете проводились наблюдения над числом X покупателей, обратившихся в кассу за один час. Наблюдения в течение 30 часов (15 дней в период с 9 до 10 и с 10 до 11 часов) дали следующие результаты:
70 |
75 |
100 |
120 |
75 |
60 |
100 |
120 |
70 |
60 |
65 |
100 |
65 |
100 |
70 |
75 |
60 |
100 |
100 |
120 |
70 |
75 |
70 |
120 |
65 |
70 |
75 |
70 |
100 |
100 |
Число X является дискретной случайной величиной, а полученные данные представляют собой выборку из n = 30 наблюдений. Составить ИСР.
В городе A для определения сроков гарантийного обслуживания проведено исследование величины среднего пробега автомобилей, находящихся в эксплуатации в течение двух лет с момента продажи автомобиля магазином. Получен следующий результат (тыс. км):
3,0 |
25,0 |
18,6 |
12,1 |
10,6 |
18,0 |
17,3 |
29,1 |
20,0 |
18,3 |
21,5 |
26,7 |
12,2 |
14,4 |
7,3 |
9,1 |
2,9 |
5,4 |
40,1 |
16,8 |
11,2 |
9,9 |
25,3 |
4,2 |
29,6 |
|
|
|
|
|
Составить ИСР.
Средняя месячная зарплата за год каждого из пятидесяти случайно отобранных работников хозяйства такова (тыс. руб.):
317 |
304 |
230 |
285 |
290 |
320 |
262 |
274 |
205 |
180 |
234 |
221 |
241 |
270 |
257 |
290 |
258 |
296 |
301 |
150 |
160 |
210 |
235 |
308 |
240 |
370 |
180 |
244 |
365 |
130 |
170 |
250 |
370 |
267 |
288 |
231 |
253 |
315 |
201 |
256 |
279 |
285 |
226 |
367 |
247 |
252 |
320 |
160 |
215 |
350 |
Здесь случайной величиной X является средняя месячная зарплата. Составить ИСР.
На фирме работает 39 человек. Проведено исследование числа рабочих дней, пропущенных каждым работником фирмы в течение месяца. Результаты этого исследования таковы:
0 |
1 |
3 |
0 |
2 |
3 |
5 |
7 |
3 |
5 |
2 |
10 |
7 |
5 |
0 |
2 |
5 |
10 |
5 |
3 |
1 |
9 |
15 |
10 |
1 |
0 |
2 |
3 |
5 |
7 |
7 |
6 |
5 |
3 |
0 |
7 |
10 |
13 |
0 |
|
Составить ИСР. Найти функцию распределения случайной величины числа пропущенных дней и построить ее график.
Найти эмпирическую функцию распределения по данному ДСР и построить ее график:
а)
xi |
1 |
3 |
7 |
9 |
12 |
ni |
2 |
10 |
4 |
24 |
10 |
б)
xi |
-2 |
0 |
5 |
8 |
14 |
ni |
3 |
17 |
28 |
22 |
10 |
Найти эмпирическую функцию распределения по данному ИСР и построить ее график:
[xi; xi+1) |
[0; 2) |
[2; 4) |
[4; 6) |
[6; 8) |
[8; 10) |
ni |
6 |
4 |
2 |
18 |
29 |
[xi; xi+1) |
[10; 12) |
[12; 14) |
[14; 16) |
[16; 18] |
|
ni |
11 |
10 |
17 |
3 |
|
а) б)
[xi; xi+1) |
[11; 14) |
[14; 17) |
[17; 20) |
[20; 23) |
ni |
16 |
24 |
30 |
7 |
[xi; xi+1) |
[23; 26) |
[26; 29) |
[29; 32) |
[32; 35] |
ni |
8 |
6 |
5 |
4 |
Построить полигоны частот и относительных частот распределения по данному ДСР:
xi
1
3
5
7
9
ni
10
15
30
33
12
Построить полигон частот по данному ДСР:
xi
1
4
5
7
ni
20
10
14
6
Построить полигоны относительных частот по данному ДСР:
xi
1
2
3
5
wi
0,4
0,2
0,3
0,1
Построить гистограмму частот по данному ИСР:
[xi; xi+1)
[5; 10)
[10; 15)
[15; 20)
[20; 25)
ni
4
6
16
36
[xi; xi+1)
[25; 30)
[30; 35)
[35; 40]
ni
24
10
4
Построить гистограмму относительных частот по данному ИСР:
[xi; xi+1)
[2; 5)
[5; 8)
[8; 11)
[11; 14]
wi
0,18
0,2
0,5
0,12
Построить гистограмму относительных частот по данному ИСР:
[xi; xi+1)
[3,2; 3,4)
[3,4; 3,6)
[3,6; 3,8)
[3,8; 4,0)
[4,0; 5,0]
wi
0,1
0,2
0,5
0,2
0,2
Построить гистограмму относительных частот по данному ИСР:
[xi; xi+1)
[6,67; 6,69)
[6,69; 6,71)
[6,71; 6,73)
[6,73; 6,75)
[6,75; 6,77)
ni
2
15
17
44
52
[xi; xi+1)
[6,77; 6,79)
[6,79; 6,81)
[6,81; 6,83)
(6,83; 6,85]
ni
44
14
11
1
Построить гистограмму относительных частот по данному ИСР:
[xi; xi+1)
[3; 5)
[5; 7)
[7; 9)
[9; 11)
ni
20
25
15
13
[xi; xi+1)
[11; 13)
[13; 15)
[15; 17]
ni
12
8
7
Построить гистограмму относительных частот по данному ИСР:
[xi; xi+1) |
[-2; 2) |
[2; 6) |
[6; 10) |
[10; 14) |
[14; 16) |
ni |
5 |
25 |
40 |
12 |
18 |
Построить гистограмму относительных частот по данному ИСР:
[xi; xi+1) |
[60; 65) |
[65; 70) |
[70; 75) |
[75; 80] |
ni |
30 |
20 |
25 |
25 |