- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
2.4. Примеры статистических расчетов
Результаты независимых измерений некоторой физической величины представлены в таблице 2.4.1.
Таблица 2.4.1
|
7 |
10 |
13 |
16 |
19 |
22 |
25 |
|
1 |
1 |
4 |
6 |
5 |
2 |
1 |
Требуется:
построить полигон относительных частот;
построить график эмпирической функции распределения;
найти выборочное среднее, выборочное среднеквадратическое отклонение, несмещенную оценку среднеквадратического отклонения;
построить доверительный интервал для математического ожидания при доверительной вероятности 0,9;
построить доверительный интервал для среднеквадратического отклонения при доверительной вероятности 0,95.
Вычислим объем выборки n = 1 + 1 + 4 + 6 + 5 + 2 + 1 = 20. Дополним таблицу 2.4.1 строкой с относительными частотами .
Таблица 2.4.2
|
7 |
10 |
13 |
16 |
19 |
22 |
25 |
|
1 |
1 |
4 |
6 |
5 |
2 |
1 |
|
0,05 |
0,05 |
0,2 |
0,3 |
0,25 |
0,1 |
0,05 |
По первой и третьей строке таблицы 2.4.2 построим полигон относительных частот, представленный на рисунке 2.4.1.
Рис. 2.4.1
Для построения графика эмпирической функции распределения дополним таблицу 2.4.1 строками накопленных частот.
Таблица 2.4.3
|
7 |
10 |
13 |
16 |
19 |
22 |
25 |
|
1 |
1 |
4 |
6 |
5 |
2 |
1 |
|
1 |
2 |
6 |
12 |
17 |
19 |
20 |
|
0,05 |
0,1 |
0,3 |
0,6 |
0,85 |
0,95 |
1 |
Следовательно, эмпирическая функция распределения может быть определена следующим образом:
График этой функции представлен на рисунке 2.4.2.
Рис. 2.4.2
Выборочная медиана вариационного ряда, приведенного в таблице 2.4.1, равна 16. Используя свойства выборочных моментов (см. параграф 1.4), можно построить новый вариационный ряд, данные которого упростят дальнейшие вычисления.
Таблица 2.4.4
|
7 |
10 |
13 |
16 |
19 |
22 |
25 |
|
1 |
1 |
4 |
6 |
5 |
2 |
1 |
|
– 9 |
– 6 |
– 3 |
0 |
3 |
6 |
9 |
|
– 3 |
– 2 |
– 1 |
0 |
1 |
2 |
3 |
|
– 3 |
– 2 |
– 4 |
0 |
5 |
4 |
3 |
|
9 |
4 |
4 |
0 |
5 |
8 |
9 |
Выборочное среднее вычисляется по формулам:
;
;
Выборочная дисперсия, выборочное среднеквадратическое отклонение и несмещенная оценка среднеквадратического отклонения вычисляются по формулам:
;
;
.
.
Доверительный интервал для задает границы истинного значения математического ожидания генеральной совокупности. Необходимую для расчетов величину t можно найти в таблице приложения 2. Эта таблица имеет два входа. По строкам меняется число степеней свободы k = n – 1, столбцы связаны с уровнем значимости . На пересечении соответствующих строки и столбца расположены требуемые значения t. В рассматриваемом примере число степеней свободы , а уровень значимости , поэтому . Подставив найденные значения в формулу , получаем интервальную оценку (14,8; 18,1) величины математического ожидания с заданной надежностью 0,9.
Доверительный интервал при определим из неравенства . Сначала необходимо при =19 и =0,05 по таблице приложения 3, определить (0,05; 19) = 0,37.
Тогда 4,27(1 – 0,37) 4,27(1 + 0,37) или 2,69 5,85.
В этом примере рассмотрим случай, когда выборка представлена в виде сгруппированного вариационного ряда, приведенного в таблице 2.4.5.
Таблица 2.4.5
Интервал |
[30; 40] |
(40; 50] |
(50; 60] |
(60; 70] |
(70; 80] |
(80; 90] |
(90; 100] |
(100; 110] |
|
4 |
11 |
26 |
50 |
54 |
29 |
13 |
3 |
Требуется:
построить гистограмму выборки;
построить график эмпирической функции распределения;
найти выборочное среднее, выборочное среднеквадратическое отклонение, несмещенную точечную оценку среднеквадратического отклонения;
построить доверительный интервал для математического ожидания при доверительной вероятности ;
построить доверительный интервал для среднеквадратического отклонения при доверительной вероятности .
1) Для построения гистограммы дополним исходную таблицу 2.4.5 тремя строками: , и .
Таблица 2.4.6
Интервал |
[30; 40] |
(40; 50] |
(50; 60] |
(60; 70] |
(70; 80] |
(80; 90] |
(90; 100] |
(100; 110] |
|
4 |
11 |
26 |
50 |
54 |
29 |
13 |
3 |
|
10 |
10 |
10 |
10 |
10 |
10 |
10 |
10 |
|
0,02 |
0,06 |
0,14 |
0,26 |
0,28 |
0,15 |
0,07 |
0,02 |
|
0,002 |
0,006 |
0,014 |
0,026 |
0,028 |
0,015 |
0,007 |
0,002 |
Последняя строка таблицы 2.4.6 определяет высоты столбцов гистограммы, приведенной на рисунке 2.4.3.
Рис. 2.4.3
Для построения графика эмпирической функции в таблицу 2.4.5 надо добавить две строки, в которых следует записать и .
Таблица 2.4.7
Интервал |
[30; 40] |
(40; 50] |
(50; 60] |
(60; 70] |
(70; 80] |
(80; 90] |
(90; 100] |
(100; 110] |
|
4 |
11 |
26 |
50 |
54 |
29 |
13 |
3 |
|
4 |
15 |
41 |
91 |
145 |
174 |
187 |
190 |
|
0,02 |
0,08 |
0,22 |
0,48 |
0,76 |
0,92 |
0,98 |
1 |
По данным, приведенным в таблице 2.4.7 можно найти узловые точки эмпирической функции распределения .
При построении графика функции , приведенного на рисунке 2.4.4, узловые точки соединяются отрезками прямых. Затем полученная ломаная дополняется двумя горизонтальными линиями при и .
Рис. 2.4.4
Также как и в предыдущем примере построим новый вариационный ряд, чтобы, используя свойства выборочных моментов, упростить дальнейшие вычисления.
Таблица 2.4.8
Интервал |
[30; 40] |
(40; 50] |
(50; 60] |
(60; 70] |
(70; 80] |
(80; 90] |
(90; 100] |
(100; 110] |
|
4 |
11 |
26 |
50 |
54 |
29 |
13 |
3 |
|
10 |
10 |
10 |
10 |
10 |
10 |
10 |
10 |
|
35 |
45 |
55 |
65 |
75 |
85 |
95 |
105 |
|
– 30 |
– 20 |
– 10 |
0 |
10 |
20 |
30 |
40 |
|
– 3 |
– 2 |
– 1 |
0 |
1 |
2 |
3 |
4 |
|
– 12 |
– 22 |
– 26 |
0 |
54 |
58 |
39 |
12 |
|
36 |
44 |
26 |
0 |
54 |
116 |
117 |
48 |
Выборочное среднее вычисляется по формулам
;
;
.
Выборочная дисперсия и выборочное среднеквадратическое отклонение вычисляются по формулам
;
;
.
Поправки Шеппарда дают возможность получить несмещенные оценки дисперсии и среднеквадратического отклонения
;
.
4) Оценку истинного значения параметра а дает доверительный интервал для математического ожидания, который для случая большой выборки определяется формулой . В таблице значений функции Лапласа, приведенной в приложении 1, находим число 0,4505, наиболее близкое к . Это число расположено в строке, именованной «1,6», и столбце с названием «5». Искомое значение =1,6 + 0,05 = 1,65, так как 2 (1,65) 0,9. При 70,42 и точности оценки 1,67 доверительный интервал для математического ожидания с надежностью 0,9 имеет вид (68,75: 72,09).
5) Оценку истинного значения параметра дает доверительный интервал для среднеквадратического отклонения, который для случая большой выборки определяется по формуле
.
По заданной доверительной вероятности по таблице значений функции Лапласа, находим , следовательно, . Тогда доверительный интервал для среднеквадратического отклонения с надежностью 0,95 имеет вид (12,72;15,59).