- •Министерство образования и науки российской федерации
- •Раздел I. Теория вероятностей
- •Тема 1. Случайные события
- •1.1 Классификация событий
- •1.2. Вероятность событий
- •Свойства вероятности
- •1.3. Элементы комбинаторики
- •1.4. Операции над событиями
- •Тема 2. Основные теоремы
- •2.1. Теорема сложения вероятностей несовместных событий
- •2.2. Теорема умножения вероятностей
- •2.3. Формула полной вероятности. Формулы Байеса
- •Тема 3. Повторные независимые испытания
- •3.1. Формула Бернулли
- •3.2. Формула Пуассона
- •3.3. Локальная теорема Муавра-Лапласа
- •Свойста функци , ее график
- •3.4. Интегральная теорема Муавра-Лапласа
- •Свойства функции :
- •Тема 4. Дискретная случайная величина и её характеристики
- •4.1. Понятие случайной величины
- •4.2. Закон распределения дискретной случайной величины
- •4.3. Математические операции над случайными величинами
- •4.4. Числовые характеристики дискретной случайной величины
- •Свойства
- •Свойства
- •4.5. Биноминальный закон распределения и закон Пуассона
- •4.6. Функция распределения случайной величины
- •Свойства функции распределения
- •Тема 5. Непрерывные случайные величины.
- •5.1. Плотность распределения вероятностей непрерывных случайных величин
- •Свойства плотности распределения
- •5.2. Числовые характеристики непрерывных случайных величин
- •5.3. Нормальный закон распределения
- •Свойства случайной величины, распределенной по нормальному закону
- •5.4. Центральная предельная теорема. Теорема Ляпунова
- •Тема 6. Двумерные (n-мерные) случайные величины
- •6.1. Способы задания двумерной случайной величины
- •Свойства двумерной функции распределения
- •6.2. Условные законы распределения
- •6.3. Ковариация и коэффициент корреляции
- •Свойства коэффициента корреляции
- •6.4. Двумерный нормальный закон распределения
- •Тема 7. Закон больших чисел
- •Неравенство Маркова (лемма Чебышева)
- •Неравенство Чебышева
- •Теорема Чебышева
- •Раздел II. Математическая статистика Тема 8. Выборочный метод. Общие вопросы
- •8.1. Понятие о вариационных рядах
- •8.2. Эмпирическая функция распределения
- •Свойства :
- •8.3. Числовые характеристики вариационного ряда
- •Основные свойства
- •Основные свойства дисперсии
- •Упрощённый способ расчёта средней арифметической и дисперсии
- •8.4. Выборочный метод
- •Тема 9. Оценка доли признака и генеральной средней
- •Точечные оценки генеральной совокупности. Свойства оценок
- •Интервальная оценка параметров
- •Доверительный интервал для генеральной средней и генеральной доли по большим выборкам
- •Объём выборки
- •Тема 10. Статистическая проверка гипотез
- •10.1. Статистическая гипотеза и общая схема её проверки
- •1) - То нулевую гипотезуотвергают,
- •2) - То нет оснований отвергнуть.
- •10.2. Построение теоретического закона распределения по опытным данным. Критерий согласия Пирсона
- •Правило проверки нулевой гипотезы
- •Тема 11. Корреляция и регрессия
- •11.1. Линейная парная регрессия
- •11.2. Оценка тесноты корреляционной зависимости
- •Свойства выборочного коэффициента корреляции r
- •Проверка значимости выборочного коэффициента корреляции
1) - То нулевую гипотезуотвергают,
2) - То нет оснований отвергнуть.
10.2. Построение теоретического закона распределения по опытным данным. Критерий согласия Пирсона
Пусть необходимо определить вид и параметры закона распределения некоторой случайной величины. Параметры распределения, как правило, не известны, поэтому их заменяем наилучшими оценками по выборке. Как бы хорошо не был подобран закон распределения, между эмпирическим и теоретическим распределениями неизбежны расхождения. Необходимо ответить на вопрос: эти расхождения являются случайными, связанными с ограниченным числом наблюдений, или они связаны с тем, что теоретический закон распределения подобран неудачно. Для ответа служат критерии согласия.
Определение. Критерий согласия– это некоторая случайная величина, характеризующая степень расхождения теоретического и эмпирического распределений.
Имеется несколько критериев согласия. Мы рассмотрим критерий согласия Пирсона(хи-квадрат). Данный критерий основан на сравнении эмпирических частот и теоретических частот.
Определение. Теоретическими частотаминазывают частоты, найденные в отличие от фактически наблюдаемых частоттеоретически и равные
,
где - число испытаний,- вероятность попадания с.в.в- й частичный интервал, вычисленная при условии, что с.в.имеет определенное распределение.
Если предполагаем, что с.в.распределена нормально, то
,
где - объём выборки;- длина частичного интервала;- выборочное среднеквадратическое отклонение;, где- серединаi-го частичного интервала,- выборочная средняя,- затабулированная функция.
Итак, пусть по выборке объёма получено эмпирическое распределение
… | |||||
… |
Допустим, что вычислены теоретические частоты
… |
При уровне значимости проверяем нулевую гипотезу- генеральная совокупность распределена по нормальному закону. В качестве критерия проверки гипотезыприменим случайную величину, равную сумме квадратов отклонений эмпирических частот от теоретических:
. (10.1)
Доказано, что при закон распределения случайной величины (10.1), независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределениясстепенями свободы. Поэтому случайная величина (10.1) и обозначена через, а сам критерий называется критерием согласия.
Число степеней свободы,
где - число частичных интервалов выборки,- число параметров предполагаемого распределения. В случае нормального распределения().
Т.о. для нормального распределения.
Правило проверки нулевой гипотезы
1) Вычислить теоретические частоты .
2) Рассчитать по формуле (10.1).
3) По таблице критических точек найти.
4) Если - нет оснований отвергнуть нулевую гипотезу.
Если - нулевую гипотезуотвергают.
Замечание. Объём выборки должен быть не менее 50. Каждый интервал должен содержать не менее 5 – 8 вариант. Малочисленные интервалы следует объединять с соседними, суммируя частоты.
Пример 10.1. Для заданного эмпирического распределения при уровне значимостипроверить гипотезу о нормальном распределении.
-
х
94-100
100-106
106-112
112-118
118-124
124-130
130-136
136-142
ni
3
7
11
20
28
19
10
2
Решение. Найдем выборочные среднюю и дисперсию
Выборочное среднеквадратическое отклонение .
Составим формулу для вычисления теоретических частот
.
Вычислим , для чего составим таблицу.
-
1
2
3
4
5
6
7
8
9
интервалы
Серед.
94-100
97
-2,37
0,0241
0,5
100
12,5
100-106
103
-1,73
0,0893
106-112
109
11
-1,09
0,2203
14
0,64
121
8,64
112-118
115
20
-0,45
0,3605
23
0,39
400
17,39
118-124
121
28
0,19
0,3918
25
0,36
784
31,36
124-130
127
19
0,83
0,2827
18
0,06
361
20,06
130-136
133
1,48
0,1334
0
144
12
136-142
139
2,12
0,0422
100
100
1,95
101,95
Согласно замечанию частоты первых двух и последних двух интервалов суммируются.
Столбцы 8 и 9 служат для проверки правильности вычислений по формуле
(последняя ячейка 7 столбца)
Проверка: .
Вычисления произведены правильно.
По таблице критических точек распределения (см. приложения учебников), по уровню значимостии числу степеней свободынаходим.
Так как - нет оснований отвергнуть нулевую гипотезу, то есть расхождения эмпирических и теоретических частот незначимо.
Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении совокупности.