- •Теория вероятностей и математическая статистика
- •1.2 События и действия (операции) над ними.
- •1.3 Классическое определение вероятности
- •1.4. Свойства вероятностей
- •1.5. Формула сложения вероятностей
- •Эта формула называется формулой сложения вероятностей для несовместных событий и читается так: вероятность суммы нескольких попарно несовместных событий равна сумме их вероятностей.
- •1.6. Статистическое и геометрическое определения вероятности
- •Геометрическое определение вероятности.Вероятностью событияА называется.
- •1.7. Понятие об аксиоматическом определении вероятности.
- •2.1 Условная вероятность
- •2.2 Формула умножения вероятностей.
- •2.3 Формула полной вероятности
- •2.4 Формула Байеса
- •2.5 Схема и формула Бернулли
- •2.5 Приближенные формулы в схеме Бернулли
- •Лекция 3
- •3.1 Случайная величина
- •3.2 Дискретные случайные величины
- •3.4 Непрерывные случайные величины
- •Свойства плотности вероятности.
- •Смысл дисперсии в том, что она является мерой рассеяния значений случайной величины от математического ожидания. Чем меньше дисперсия, тем меньше разброс значений от математического ожидания.
- •4.4 Свойства дисперсии
- •4.5 Другие числовые характеристики
- •4.6 Нормальное распределение (распределение Гаусса)
- •Лекция 5
- •5.1 Числовые характеристики некоторых распределений
- •Равномерное распределение.
- •Непрерывно распределенные двумерные случайные величины
- •6.3 Корреляционный момент, коэффициент корреляции
- •6.4 Представление о законе больших чисел
- •6.5 Представление о центральной предельной теореме
- •Лекция 7
- •Рассмотрим три закона распределения, которые часто используются в теории вероятностей.
- •1. Распределение (читается “хи в квадрате”). ПустьÎn(0, 1) – независимые нормально распределенные с.В. С.В. Называетсяраспределенной по закону со степенью свободыk.
- •2. Распределение Стьюдента т(k). С.В. , гдеU în(0, 1), называется распределенной по закону Стьюдента со степенью свободы k.
- •3. С.В. , гдеk1, k2 – натуральные числа, называется распределенной по закону Фишера со степенями свободы k1, k2.
- •7.4.1 Доверительный интервал для м.О. Нормально распределенной с.В.
- •7.4.2 Доверительный интервал для дисперсии нормально распределенной г.С.
- •8.1 Предварительная обработка реализации выборки
- •F*(X) – статистическая функция распределенияр(X) – плотность распределения
- •8.2 Основные понятия проверки статистических гипотез
- •Лекция 9. Элементы регрессионного анализа
- •9.1 Парный линейный регрессионный анализ.
- •9.2 Парный обобщенный линейный регрессионный анализ
Лекция 9. Элементы регрессионного анализа
9.1 Парный линейный регрессионный анализ.
Пусть проводится наблюдение над двумерной г.с. (Х, Y).
Если фиксировать значение x случайной величины X, то можно рассмотреть условное математическое ожидание с.в. Y при X=x: M[Y/X=x]. Таким образом, M[Y/X=x] является некоторой детерминированной функцией от x: M[Y/X=x] =j(x). Эта функция называется функцией регрессии Y на X, а график функции y=j(x) кривой регрессии Y на X. Если наблюдаетя с.в. Y при определенных значениях x, то случайную величину Y можно представить в виде Y=j(x)+e, где e – с.в. Пусть наблюдения проводятся при фиксированных значениях x1, x2, …,xn. При этом случайная величина Y приняла соответственно значения y1, y2, …, yn. Тогда можно считать, что имеет место выборка yi = j(xi) + ei, i=1, …, n. В дальнейшем будем считать, что случайные величины ei, i=1, …, n, удовлетворяют следующим условиям.
ei (i=1, …, n) распределены по нормальному закону с математическим ожиданием 0 и дисперсией s2;
они попарно некоррелированны.
Если функция регрессии j(x) линейна, то говорят, что имеет место линейная регрессионная модель. Рассмотрим подробно эту модель.
Пусть Y= b0+b1x+e, yi= b0+b1xi+ei, (i=1, …, n) и выполняются условия 1) – 2).
Задача корреляционного и регрессионного анализа состоит в следующем.
Получить наилучшие точечные и интервальные оценки параметров b0, b1, s линейной модели;
Проверить значимость модели;
Проверить адекватность модели наблюдаемым данным.
Для нахождения точечных оценок применяется метод наименьших квадратов (сокращенно – МНК).
Обозначим искомое уравнение . По МНК коэффициентыищут, такие, чтобы принимала минимальное значение сумма
,
где обозначено .
По необходимому условию экстремума частные производные функции S по переменным должны обратиться в нуль в точке минимума.
Итак, решаем систему
Преобразовав систему, получаем
(9.1)
По методу Крамера, получим
,
где– выборочный корреляционный момент,– выборочная дисперсия с.в.X.
Преобразовав далее, получим
,
где– выборочный коэффициент корреляции.
В итоге получаем формулы для оценок коэффициентов уравнения линейной регрессии:
,. (9.2)
Коэффициент называется выборочным коэффициентом регрессии. Выборочное уравнение регрессии имеет вид
Введем в рассмотрение следующие суммы.
–сумма квадратов отклонений,
–остаточная сумма квадратов,
–сумма квадратов, обусловленная регрессией,
называется остаточной дисперсией.
Теорема 9.1 .
Если параметр = 0, то линейная модель называется незначимой. Для проверки значимости линейной модели выдвигается основная гипотезаH0: = 0 при альтернативной гипотезеH1:¹ 0.
Статистика имеет распределение Фишера с 1 иn–2 степенями свободы, если основная гипотеза верна. Таким образом, если выборочное значение Fв больше квантили распределения Фишера, то основная гипотеза отвергается с вероятностьюa, то есть на уровне значимости a линейная модель статистически значима.
Доверительные интервалы для коэффициентов ,c доверительной вероятностью 1– a имеют вид:
< <,
< <,
где – квантиль распределения Стьюдента порядка 1–a./2 со степенью свободы n–2.
Коэффициентом детерминации называется величина . Чем ближе значение коэффициента детерминации к 1, тем лучше линейная модель описывает наблюдаемые данные. Если имеет место линейная регрессионная модель, то выборочный коэффициент корреляции междуX, Y .