- •С.Н.Дементьев, а.М.Слиденко, с.О.Стрыгина
- •Воронеж
- •Дементьев с.Н.
- •Часть I. Теория вероятностей Введение
- •Основные понятия
- •Классическое определение вероятности
- •Основные понятия комбинаторики
- •Геометрическое определение вероятности
- •Статистическое определение вероятности
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Основные понятия
- •Формула Бернулли
- •Формула Пуассона
- •Локальная формула Лапласа
- •Интегральная формула Лапласа
- •Основные понятия
- •Основные понятия Равномерное распределение
- •Показательное (экспоненциальное) распределение
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Пример решения индивидуального задания
- •Основные понятия
- •Распределение Стьюдента ( распределение)
- •Распределение Фишера ( -распределение)
- •Примеры решения индивидуальных заданий
- •Основные понятия
- •Часть II. Математическая статистика Введение
- •Основные понятия Методика рациональной организации выборки большого объема
- •Нахождение точечных и интервальных статистических оценок неизвестных числовых характеристик теоретических распределений
- •Основные понятия
- •Проверка гипотезы о равенстве дисперсий двух нормально распределенных генеральных совокупностей
- •Проверка гипотезы о равенстве средних
- •Дисперсии которых неизвестны и одинаковы
- •Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
- •«Проверка статистических гипотез»
- •«Проверка статистических гипотез»
- •Основные понятия
- •«Однофакторный дисперсионный анализ»
- •«Однофакторный дисперсионный анализ»
- •Основные понятия
- •Проверка качества модели регрессии с помощью коэффициента детерминации
- •Проверка значимости регрессии по критерию Фишера
- •Построение доверительных интервалов для генеральных параметров регрессии
- •Построение доверительного интервала для прогноза индивидуального значения отклика
- •«Корреляционный и регрессионный анализ»
- •«Корреляционный и регрессионный анализ»
- •Часть III. Примеры лабораторных работ по математической статистике в системе mathcad Темы лабораторных работ и их основные цели
- •Лабораторная работа №1 (листинги 1-5) Распределения, связанные с нормальным законом распределения
- •Лабораторная работа №2 (листинги 6-8) Метод статистических испытаний (метод Монте-Карло)
- •Лабораторная работа №3 (листинги 9-15) Описательные статистики
- •Лабораторная работа №4 (листинги 16-18) Проверка гипотезы о нормальном распределении
- •Лабораторная работа №5 (листинги 19-24) Примеры проверки статистических гипотез
- •Лабораторная работа №6 (листинги 25-27) Однофакторный дисперсионный анализ
- •Лабораторная работа №7 (листинги 28-31) Корреляция и регрессия
- •Продолжение приложения 2
- •Приложение 4
- •Критические точки распределения Фишера
- •Критические точки распределения Фишера
- •Примеры тестовых вопросов по теории вероятностей и математической статистике
- •394087, Воронеж, ул. Мичурина, 1
Проверка качества модели регрессии с помощью коэффициента детерминации
Под адекватностью модели эксперименту понимается тот факт, что никакая альтернативная ей модель не дает значимого улучшения предсказаний отклика. Существует много способов оценки адекватности уравнения регрессии выборочным данным, большинство из которых требуют проведения параллельных опытов с последующим анализом специальных дисперсий. Мы не будем останавливаться на них, а рассмотрим лишь простейший инструмент оценки качества модели, позволяющий судить о ее адекватности исходным данным, коэффициент детерминации . Он ищется по формуле
.
Коэффициент детерминации указывает, какую часть общей вариации отклика Y объясняет регрессия, т.е. какую часть в составляет сумма квадратов отклонений, обусловленная регрессией. Ясно, что . Чем ближе к 1, тем качественнее построенная модель, тем больше оснований считать ее адекватной исходным данным.
Пример 13.2. По данным примера 13.1, используя результаты его решения, получим выборочное уравнение прямой регрессии на и оценим его качество по величине коэффициента детерминации.
Решение.
1. Подставляем результаты решения примера 13.1 в выборочное уравнение прямой регрессии (13.1)
где , и получаем или после простых преобразований
.
2. Находим модельные значения ( ) отклика Y, присоединив их к таблице исходных данных:
|
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
60 |
53 |
50 |
40 |
37 |
33 |
27 |
20 |
|
59,25 |
53,75 |
48,25 |
42,75 |
37,25 |
31,75 |
26,25 |
20,75 |
(здесь, например, ).
Теперь вычисляем
;
;
.
В ы в о д. Полученное значение коэффициента детерминации близко к 1, поэтому полученное выборочное уравнение прямой регрессии хорошо (адекватно) объясняет отклик Y. Подтверждением этому является то, что прямая регрессии, построенная в системе координат вместе с исходными данными в виде точек той же плоскости (рис. 13.2), хорошо «притягивает» эти точки.
Рис. 13.2
Проверка значимости регрессии по критерию Фишера
Существо этой задачи состоит в проверке гипотезы о равенстве нулю коэффициента регрессии в уравнении (13.3), т.е. гипотезы о независимости X и Y .
Для решения этой задачи должен быть реализован следующий алгоритм действий.
1.Вычисляют , и .
2.Задавшись уровнем значимости , по таблицам приложения 5 находят .
3.Если , регрессия признается значимой, если же , то регрессия считается незначимой.
Пример 13.3. По данным примера 13.1, используя результаты решения примера 13.2, проверим с помощью критерия Фишера значимость регрессии при уровне значимости .
Решение.
Вычисляем:
;
.
2. Находим по таблицам приложения 5
.
3. Так как , гипотеза отвергается и регрессия признается значимой.
Построение доверительных интервалов для генеральных параметров регрессии
Как уже известно, точечными оценками генеральных параметров уравнения регрессии (13.3) являются соответственно величины из уравнения (13.2). Доверительные интервалы, покрывающие указанные генеральные параметры с заданной надежностью , имеют соответственно вид
(13.4)
, (13.5)
где значение ищется по таблицам приложения 4, а ошибки вычисляются по формулам
; .
Пример 13.4. По данным примера 13.1, используя результаты решений примеров 13.113.3, построим доверительные интервалы, покрывающие генеральные параметры регрессии с надежностью . Оценим значимость этих параметров.
Решение. Вычисляем
.
Подставляем полученные результаты в формулы (13.4), (13.5):
[75,752,451,66; 75,75 + 2,451,66] [71,68; 79,82];
[5,502,450,24; 5,502,450,24] [6,09; 4,91].
В ы в о д ы. Доверительные интервалы, покрывающие генеральные параметры регрессии с надежностью , имеют соответственно вид [71,68; 79,82] и [6,09; 4,91].
Оба параметра значимо отличаются от нуля, так как ноль не входит в соответствующие доверительные интервалы.
Тот факт, что доверительный интервал для генерального коэффициента регрессии не содержит нулевое значение, еще раз подтверждает гипотезу о значимости регрессии.