- •Теория вероятностей и математическая статистика
- •1.2 События и действия (операции) над ними.
- •1.3 Классическое определение вероятности
- •1.4. Свойства вероятностей
- •1.5. Формула сложения вероятностей
- •Эта формула называется формулой сложения вероятностей для несовместных событий и читается так: вероятность суммы нескольких попарно несовместных событий равна сумме их вероятностей.
- •1.6. Статистическое и геометрическое определения вероятности
- •Геометрическое определение вероятности.Вероятностью событияА называется.
- •1.7. Понятие об аксиоматическом определении вероятности.
- •2.1 Условная вероятность
- •2.2 Формула умножения вероятностей.
- •2.3 Формула полной вероятности
- •2.4 Формула Байеса
- •2.5 Схема и формула Бернулли
- •2.5 Приближенные формулы в схеме Бернулли
- •Лекция 3
- •3.1 Случайная величина
- •3.2 Дискретные случайные величины
- •3.4 Непрерывные случайные величины
- •Свойства плотности вероятности.
- •Смысл дисперсии в том, что она является мерой рассеяния значений случайной величины от математического ожидания. Чем меньше дисперсия, тем меньше разброс значений от математического ожидания.
- •4.4 Свойства дисперсии
- •4.5 Другие числовые характеристики
- •4.6 Нормальное распределение (распределение Гаусса)
- •Лекция 5
- •5.1 Числовые характеристики некоторых распределений
- •Равномерное распределение.
- •Непрерывно распределенные двумерные случайные величины
- •6.3 Корреляционный момент, коэффициент корреляции
- •6.4 Представление о законе больших чисел
- •6.5 Представление о центральной предельной теореме
- •Лекция 7
- •Рассмотрим три закона распределения, которые часто используются в теории вероятностей.
- •1. Распределение (читается “хи в квадрате”). ПустьÎn(0, 1) – независимые нормально распределенные с.В. С.В. Называетсяраспределенной по закону со степенью свободыk.
- •2. Распределение Стьюдента т(k). С.В. , гдеU în(0, 1), называется распределенной по закону Стьюдента со степенью свободы k.
- •3. С.В. , гдеk1, k2 – натуральные числа, называется распределенной по закону Фишера со степенями свободы k1, k2.
- •7.4.1 Доверительный интервал для м.О. Нормально распределенной с.В.
- •7.4.2 Доверительный интервал для дисперсии нормально распределенной г.С.
- •8.1 Предварительная обработка реализации выборки
- •F*(X) – статистическая функция распределенияр(X) – плотность распределения
- •8.2 Основные понятия проверки статистических гипотез
- •Лекция 9. Элементы регрессионного анализа
- •9.1 Парный линейный регрессионный анализ.
- •9.2 Парный обобщенный линейный регрессионный анализ
Рассмотрим три закона распределения, которые часто используются в теории вероятностей.
1. Распределение (читается “хи в квадрате”). ПустьÎn(0, 1) – независимые нормально распределенные с.В. С.В. Называетсяраспределенной по закону со степенью свободыk.
2. Распределение Стьюдента т(k). С.В. , гдеU în(0, 1), называется распределенной по закону Стьюдента со степенью свободы k.
3. С.В. , гдеk1, k2 – натуральные числа, называется распределенной по закону Фишера со степенями свободы k1, k2.
Рисунок
7.6
F(xa)= a. В случае непрерывно распределенной с.в. с плотностью распределения p(x) F(xa)= P(X<xa) = . Это значит, что квантильxa – точка на оси х, в которой вертикаль отсекает слева от себя на графике плотности распределения криволинейную трапецию с площадью a (см. рис. 7.1). Если плотность распределения четная функция, т.е. ее график симметричен относительно оси у, то
xa= – x1– a (рис. 7.1). Квантили введенных выше распределений можно найти в таблицах в учебниках по теории вероятностей и математической статистике [ ].
7.4.1 Доверительный интервал для м.О. Нормально распределенной с.В.
1) Пусть г.с. XÎN(m,s) и известна дисперсия s 2. Воспользуемся тем фактом, что с.в. . Зададим малый уровень значимости 2a. Очевидно, что значения с.в. U попадают в интервал (ua, u1– a) c вероятностью g =1–2a:
.
Здесь ua– квантиль распределения с.в. U порядка a.
Теперь, решив неравенства относительноm, получим
. Но так как ua = – u1– a, то . Далее изg =1–2a имеем 1–a =. Таким образом, окончательно получаем доверительный интервал
.
2) Пусть г.с. XÎN(m,s) и дисперсия s 2 не известна. Тогда аналогично, используя точечную оценку S2 для дисперсии, получим доверительный интервал
,
где – квантиль распределения Стьюдента порядкасо степенью свободыn–1, S2 – исправленная выборочная дисперсия.
7.4.2 Доверительный интервал для дисперсии нормально распределенной г.С.
Пусть м.о. m не известно. Воспользуемся известным фактом, что с.в.
имеет распределение . Пусть – квантиль распределения порядка a. По определению квантили
.
Решив двойное неравенство в скобках относительно , и, учитываяg =1–2a, получим доверительный интервал для дисперсии
.
Извлекая корень квадратный, из этих неравенств получим доверительный интервал для среднеквадратического отклонения
.
Лекция 8
Проверка статистических гипотез
8.1 Предварительная обработка реализации выборки
Рассмотрим основные понятия, связанные с реализацией выборки. Пусть имеется реализация выборки объема n. Если упорядочить значения по возрастанию, то полученная цепочка чисел называетсявариационным рядом.
Пусть xi – элемент вариационного ряда. Тогда число повторений этого элемента в реализации выборки называется частотой выборочного значенияxi и обозначаетсяni.Величина называетсяотносительной частотойзначенияxi.
Выделим очевидные равенства
, . (8.1)
Пусть x1,x2, …,xm – все различные значения вариационного ряда, упорядоченные по возрастанию. Таблица
-
x1
x2
…
xm
n1
n2
…
nm
называется статистическим рядом. Он в некотором смысле характеризует закон распределения г.с.
Теперь предположим, что объем выборки большой. В этом случае строят так называемый интервальный (или группированный) статистический ряд. Рассмотрим реализацию выборки x1, x2, …, xn объема n. Выбираем некоторый отрезок I (обычно это либо отрезок [min{xi}, max{xi}], либо чуть больший, чем он). Делим отрезок I точками z0, z1, …, zk. на равные частичные промежутки D1=[z0, z1[, D2= [z1 z2[, …, Dk=[zk–1 zk]. Здесь z0 и zk – начало и конец отрезка I соответственно. Частотой ni i-го промежутка Di называется число значений реализации выборки, попавших в Di (i=1,2,…, k). Интервальным статистическим рядом называется таблица
-
D1
D2
…
Dk
n1
n2
…
nk
Проверьте, что для частот и относительных частот выполняется равенства (8.1).
Статистической (или эмпирической) функцией распределения называется
.
Теорема. Если F(x) – функция распределения г.с., то для любого действительного значения x и любого e >0 выполняется равенство
.
Смысл этой теоремы в том, что при больших объемах выборки значения статистической функции распределения является приближенными значениями функция распределения, т.е. статистическая функция распределения является оценкой неизвестной функция распределения г.с.
Для непрерывно распределенной г.с. наглядную оценку для плотности распределения дает гистограмма относительных частот.
Гистограмма относительных частот – это ступенчатая фигура, построенная следующим образом. На оси Ох откладываются частичные промежутки D1,…, Dk. Над каждым из них строится прямоугольник с высотой ni / h, где h – длина частичного промежутка. Функция, график которой задается гистограммой относительных частот, также называется гистограммой относительных частот.
Вычислим площадь, «ограниченной» гистограммой.
.
Это аналог свойства нормировки плотности распределения. Оказывается, что гистограмма относительной частоты равна приближенно неизвестной плотности непрерывно распределенной г.с., т.е. гистограмма дает приближенно представление о виде плотности распределения г.с.
Пример 8.1. Дан интервальный статистический ряд
-
(1, 3)
(3, 5)
(5, 7)
(7, 9)
(9, 11)
10
32
20
24
14
Построить график статистической функции распределения и гистограмму относительных частот. Построить, соответственно, приближенные графики неизвестных функции и плотности распределения г.с.
Объем выборки n=100. Длина h частичного промежутка равна 2. Относительные частоты равны n1=10/100=0.1, n2=32/100=0.32, n3=0.2, n4=0.24, n5=0.14.
Вычислим значения статистической функции распределения:
На рисунке 8.1 приведены график статистической функции распределения и приближенно график функции распределения.