- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
1.3. Эмпирическая функция распределения
В теории вероятности случайную величину Х можно задать [3] функцией распределения или (в случае непрерывной величины Х) плотностью распределения . В статистике функция распределения генеральной совокупности называется теоретической функцией распределения. По вариационному ряду (см. таблицу 1.2.1) можно построить эмпирическую функцию распределения , которая определяется как относительная частота события . Таким образом,
,
где – число вариант, меньших в данной выборке.
Функция обладает следующими свойствами:
1) если – наименьшая варианта, то при ,
2) если – наибольшая варианта, то при ;
3) – неубывающая функция;
4) .
Из теоремы Бернулли [3] следует, что для всех х относительная частота события стремится по вероятности к значению теоретической функции распределения . Это означает, что
при любом значении . Другими словами, значения и мало отличаются одно от другого при больших .
Для построения исходный вариационный ряд (см. таблицу 1.2.1) нужно дополнить двумя графами: накоплений частот ( ) и относительных частот ( ).
Таблица 1.3.1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Данные, приведенные в таблице 1.3.1, дают возможность задать все значения функции :
График подобной функции представлен на рисунке 1.3.1.
Рис. 1.3.1
Перед построением графика эмпирической функции распределения сгруппированного вариационного ряда надо также добавить две строки в таблицу 1.2.3.
Таблица 1.3.2
Интервал |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В случае непрерывной теоретической функции распределения график строится приближенно по точкам , которые соединяются отрезками, как это показано на рисунке 1.3.2. Чтобы показать, что для всех и для всех , надо провести две горизонтальных линии.
Рис. 1.3.2
При большом количестве промежутков со значительным числом вариант в них , т.е. ломаная дает представление о гладкой кривой .
1.4. Числовые характеристики выборки
В случае вариационного ряда выборочный начальный момент -го порядка определяется следующим образом:
;
Выборочной средней называется среднее арифметическое значений выборки. Величина совпадает с начальным моментом первого порядка
.
Выборочная медиана – значение, приходящееся на середину вариационного ряда в таблице 1.2.1, значит
|
если
если |
Выборочная мода – варианта с наибольшей частотой . Таких значений в выборке может быть несколько. Характеристики положения , , примерно указывают расположение вариант на числовой оси, т.к. каждая из них не превышает наибольшего значения и не может быть меньше наименьшего значения .
Выборочные центральные моменты m-го порядка вычисляются по формуле
.
Выборочной дисперсией называется среднее арифметическое квадратов отклонения наблюдаемых значений от их среднего значения . Величина совпадает с центральным выборочным моментом второго порядка
.
Раскрывая скобки и учитывая, что , получаем
,
где – начальный момент второго порядка.
Выборочным среднеквадратическим отклонением называется квадратный корень из выборочной дисперсии, т.е. .
Величина , вычисленная по формуле
,
называется исправленной выборочной дисперсией, а – исправленным выборочным среднеквадратическим отклонением.
Характеристики рассеивания , , , определяют величину разброса вариант относительно центра расположения .
В случае сгруппированного вариационного ряда сначала таблица 1.2.3 преобразуется в обычный вариационный ряд, в котором в первой строке помещены значения середины промежутков .
Таблица 1.4
|
|
|
|
|
|
|
|
|
|
Все выборочные моменты в этом случае вычисляются по тем же формулам для вариационного ряда с учетом значений, приведенных в таблице 1.4. Например, выборочное среднее
.
Группировка и усреднение исходных данных вносят определенную ошибку в расчет моментов, особенно заметную при малом количестве интервалов. Для уменьшения ошибок можно применить поправки Шеппарда [6]. Если все промежутки имеют одинаковую ширину , то выборочная дисперсия с учетом поправки Шеппарда вычисляется по формуле:
.
При выполнении условия поправкой Шеппарда можно пренебречь.
Используя свойства выборочных моментов, можно упростить расчеты численных характеристик выборки.
1) Если все выборочные значения уменьшить на одно и то же постоянное число , то выборочное среднее уменьшится на это же число , а все центральные выборочные моменты не изменятся. Это свойство используется при вычислении выборочных моментов: из каждого значения вычитается величина близкая к среднему (ложный нуль), что равносильно изменению начала отсчета.
2) Если все выборочные значения умножить на одно и то же постоянное число , то начальные и центральные выборочные моменты -го порядка умножаться на .
В реальных задачах (см. параграф 2.4) оба свойства обычно используют одновременно.