- •Бийский технологический институт (филиал)
- •Теория вероятностей и математическая статистика
- •Введение
- •События. Классификация событий. Классическое определение вероятности
- •Статистическое определение вероятности
- •Геометрическая вероятность
- •Контрольные вопросы
- •Контрольные задания
- •4. Операции над событиями. Соотношения между событиями
- •5.Теорема сложения вероятностей
- •6. Теорема умножения вероятностей
- •Контрольные вопросы
- •Контрольные задания
- •7. Формула полной вероятности
- •8. Теорема гипотез (формула Бейеса)
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •9. Повторение опытов. Формула Бернулли
- •10. Локальная формула Муавра-Лапласа. Формула Пуассона
- •11. Интегральная формула Муавра-Лапласа. Вероятность отклонения частоты события от его вероятности в n независимых испытаниях
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •12. Понятие случайной величины. Ряд распределения. Многоугольник распределения
- •13. Функция распределения. Вероятность попадания непрерывной случайной величины в заданный интервал
- •Контрольные вопросы
- •Контрольные задания
- •14. Плотность распределения
- •Контрольные вопросы
- •Контрольные задания
- •15. Числовые характеристики случайных величин. Математическое ожидание и его свойства
- •Свойства математического ожидания
- •16. Дисперсия и ее свойства. Среднее квадратическое отклонение
- •17. Моменты распределения случайной величины
- •Контрольные вопросы
- •Контрольные задания
- •18. Типы распределений дискретных случайных величин
- •Биномиальное распределение
- •18.2 Гипергеометрическое распределение
- •18.3 Геометрическое распределение
- •4. Распределение Пуассона
- •Контрольные вопросы
- •Контрольные задания
- •19. Типы распределений непрерывных случайных величин
- •19.1 Равномерное распределение
- •19.2 Показательное распределение
- •20. Нормальный закон распределения
- •21. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •22. Понятие системы случайных величин
- •23. Закон распределения вероятностей дискретной двумерной случайной величины
- •Контрольные вопросы
- •24. Функция распределения двух случайных величин. Вероятность попадания случайной величины в полуполосу и прямоугольник
- •25. Плотность распределения системы двух случайных величин. Законы распределения отдельных величин, входящих в систему
- •26. Условные законы распределения
- •Контрольные вопросы
- •27. Зависимые и независимые случайные величины
- •28. Числовые характеристики составляющих системы двух случайных величин. Условное математическое ожидание
- •29. Корреляционный момент. Коэффициент корреляции
- •30. Коррелированность и зависимость случайных величин
- •Если величины независимы, то они некоррелированы.
- •31. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •32. Закон больших чисел
- •33. Центральная предельная теорема
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Математическая статистика
- •34. Понятие о выборочном методе. Генеральная и выборочная совокупность
- •35. Статистические данные и их представление
- •36. Статистические аналоги теоретических законов распределения
- •36.1 Эмпирическая функция распределения
- •36.2 Полигон и гистограмма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •37. Точечное оценивание параметров распределения
- •38. Свойства статистических оценок
- •Контрольные вопросы
- •Контрольные задания
- •39. Интервальное оценивание параметров распределения
- •40. Интервальное оценивание параметров нормального распределения
- •40.1 Интервальная оценка математического ожидания нормального распределения при известной дисперсии
- •40.2 Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •41. Статистические гипотезы
- •42. Критерии проверки гипотез
- •Контрольные вопросы
- •Контрольные задания
- •43.Критерий согласия Пирсона «Хи-квадрат» ( )
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •44. Элементы теории корреляции. Задачи корреляционного анализа
- •45. Выбор формы зависимости между переменными. Метод наименьших квадратов
- •Контрольные вопросы
- •46. Коэффициент корреляции и проверка его значимости. Линейная регрессия и прогноз
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Глоссарий
Контрольные вопросы
Сформулируйте определение понятия статистическая гипотеза.
Какие выводы делаются при проверке статистических гипотез?
Какую гипотезу называют: а) нулевой; б) конкурирующей; в) параметрической; г) простой; д) сложной?
Определите понятие ошибок 1-го рода и 2-города.
Можно ли одновременно уменьшить вероятности ошибок 1-го и 2-го рода?
Что называется статистическим критерием?
Что называется критической областью?
Что называется областью принятия гипотезы?
Дайте определение: а) правосторонней критической области; б) левосторонней критической области; в) двусторонней критической области.
Как определяются критические точки: а) правосторонней критической области; б) левосторонней критической области; в) двусторонней критической области?
В чем состоит схема проверки статистических гипотез?
Контрольные задания
Наблюдаемый объект может быть либо своим, либо объектом противника. Система обнаружения относит объект к одному из классов по результатам нескольких замеров определенных характеристик. Сформулируйте нулевую и альтернативную гипотезы, если в результате ошибки 1-го рода происходит пропуск цели. В чем состоит ошибка 2-го рода?
Если и , то какие ошибки и как часто будем совершать в результате статистической проверки гипотезы?
43.Критерий согласия Пирсона «Хи-квадрат» ( )
На практике часто возникают задачи, связанные с тем, что вид закона распределения исследуемого признака – гипотетический и подлежит проверке. Если проводить графическое сравнение полигона или гистограммы частот с кривой распределения, то можно получить представление, по крайней мере с качественной стороны, о большей или меньшей близости теоретического и эмпирического распределений.
Предположим, что выборка извлечена из генеральной совокупности с неизвестной теоретической функцией распределения , относительно которой имеются две непараметрические гипотезы: простая основная Н0: и сложная конкурирующая Н1: , где - известная функция распределения. Иными словами, мы хотим проверить, согласуются ли исходные данные с нашим гипотетическим предположением относительно теоретического закона распределения или нет. Поэтому критерий для проверки гипотез Н0 и Н1 называются критериями согласия.
Существуют различные критерии согласия, например, критерий согласия Пирсона , критерий согласия Колмогорова. Приведем один из наиболее часто используемых критериев согласия – критерий согласия Пирсона .
Предположим, что проверяется основная гипотеза Н0: исследуемый признак Х имеет распределение , против конкурирующей противоположной гипотезы при уровне значимости . Здесь - функция распределения исследуемого признака Х, известная с точностью до параметров . В силу взаимно однозначного соответствия между функцией распределения и рядом (плотностью) распределения нулевая гипотеза Н0 может быть сформулирована также в терминах ряда (плотности) распределения. Если основная гипотеза простая, т.е. гипотетическое распределение исследуемого признака основной гипотезой определяется однозначно, то количество параметров распределений, требуемых оценки по выборке, m = 0.
Проверка нулевой гипотезы Н0 против альтернативной при уровне значимости проводится по следующей схеме:
Исходя из выборочных данных, находят оценки неизвестных параметров распределения . Найденные оценки используются в дальнейшем вместо неизвестных параметров распределения.
Вся область изменения признака Х разбивается на k непересекающихся интервалов при i = 1, 2, …, k. Если признак Х принимает значения на всей вещественной оси, то полагаем и правый конец . Если признак Х принимает только положительные значения, то полагаем и правый конец . Подсчитываются далее величины - количество выборочных данных, попавших в i-тый интервал при i = 1, 2, …, k. Интервалы выбирают обычно таким образом, чтобы все были не меньше . Очевидно, − объем выборки.
Находятся теоретические вероятности того, что исследуемый признак Х примет какое–либо значение из промежутка :
, i = 1, 2, …, k.
Если исследуемый признак дискретный, то
,
где суммирование ведется по всем значениям индекса r, для которых , i = 1, 2, …, k.
Очевидно, должно выполняться равенство .
4. Вычисляется мера расхождения между теоретическим и эмпирическим распределением:
,
где - эмпирические частоты признака Х, - теоретические частоты, - вероятности, рассчитанные по предполагаемому теоретическому распределению.
Для выбранного уровня значимости по таблице распределения находят критическое значение при числе степеней свободы , где k – число выборочных групп, m - число параметров теоретического распределения, определяемого по опытным данным.
Производится сравнение вычисленного по выборке значения с табличным значением . Если значения < , то считается, что выборочные данные согласуются с нулевой гипотезой Н0. В противном случае нулевая гипотеза Н0 отвергается, она опровергается имеющимися данными в пользу альтернативной.
Задача. Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в % к предыдущему году):
Выработка в отчетной году (в % к предыдущему году) |
|
|
|
|
|
|
Количество рабочих |
6 |
20 |
45 |
24 |
5 |
100 |
С помощью критерия согласия Пирсона проверить гипотезу о том, что выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения. Уровень значимости критерия принять равным 0,05.
Решение. Нулевая гипотеза Н0 состоит в том, что исследуемый признак Х – выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения.
В качестве оценок двух неизвестных параметров а и будут фигурировать соответствующие выборочные характеристики: и . Можно показать, что . Исследуемый признак принимает значения на всей вещественной оси (в принципе, но не в реальности!). Поэтому интервалы разбиения таковы, что левый конец и правый конец .
Теоретические вероятности находятся по формуле
, i = 1, 2, … , k.
Необходимые для этих вычислений значения функции взяты из таблицы Приложения. Дальнейшие выкладки сведены ниже в таблицу. При этом объединены два последних интервала группировки ввиду их малочисленности.
№ п/п |
Интервал группировки |
Частота |
|
Функция |
Веро-ятность |
|
|
1 |
|
6 |
−∞ |
−0,5 |
0,053 |
5,3 |
0,092 |
2 |
|
20 |
−1,62 |
−0,447 |
0,238 |
23,8 |
0,636 |
3 |
|
45 |
−0,55 |
−0,209 |
0,404 |
40,4 |
0,524 |
4 |
|
24 |
0,51 |
0,195 |
0,248 |
24,8 |
0,026 |
5 |
|
5 |
1,57 |
0,442 |
0,057 |
5,7 |
0,11 |
7 |
− |
− |
+ ∞ |
0,5 |
− |
− |
− |
|
− |
100 |
− |
− |
1,00 |
100 |
|
Вычисленное статистическое значение критерия . По количеству интервалов группировки k = 5, числу параметров нормального распределения найдем число степеней свободы 5 – 3 = 2. Для заданного уровня значимости критерия и числа степеней свободы, равного 2, находим . Так как , то нулевая гипотеза о нормальности распределения величины выработки рабочего согласуется с имеющимися данными.