- •Глава 6. Основные принципы построения регрессионных моделей
- •6.1 Парная корреляция и регрессия
- •6.2 Определение параметров выборочного уравнения прямой линии
- •6.3 Оценка тесноты линейной корреляционной связи переменных х и y
- •6.4 Оценка точности определения значений зависимой переменной по уравнению регрессии
- •6.5 Коэффициент детерминации
- •6.6 Проверка адекватности уравнения регрессии и ошибки предсказаний
- •6.7 Три показателя корреляции и регрессии, их значение и применение
- •6.8 Множественный корреляционно-регрессионный анализ
- •То есть,
- •6.9 Нелинейная парная регрессия и криволинейная корреляция
- •Пример синтеза линейной регрессионной модели
- •4 5 6 7 Рис 6.1. Исходные данные зависимости плотности прессовок от давления прессования р
- •Исходные данные и вспомогательные расчеты
- •Данные вспомогательных расчетов для вычисления Fрасч.
- •6.11 Пример выбора функциональной зависимости для описания парной нелинейной корреляционной связи переменных
- •Давления прессования р
- •Рассматриваемые функциональные зависимости и их параметры
- •6.12 Вопросы для самоконтроля
6.5 Коэффициент детерминации
Во многих случаях возникает вопрос о том, какую часть наблюдаемой вариации зависимой переменной Y можно объяснить влиянием независимой переменной Х. Для этого служит коэффициент детерминации.
Выборочный коэффициент детерминации при линейной зависимости переменных обозначается dyx и может быть определён из соотношения:
. (6.24)
Он измеряет долю тех элементов вариации в Y, которые содержатся также в Х, т.е. долю в общей вариации переменной Y той её части, которая определена влиянием Х. Коэффициент детерминации часто выражают в %.
6.6 Проверка адекватности уравнения регрессии и ошибки предсказаний
Для проверки адекватности полученного уравнения регрессии экспериментальным данным применяют дисперсионный анализ (введён английским математиком-статистиком Р.А. Фишером).
Метод дисперсионного анализа заключается в расчленении общей суммы квадратов отклонений зависимой переменной от её средней величины на несколько компонентов.
Оценка адекватности уравнения регрессии производится с помощью критерия Фишера, который определяется как отношение дисперсии, обусловленной регрессией, т.е. дисперсии адекватности:
(6.25)
к остаточной дисперсии:
: (6.26)
, (6.27)
где (k + 1) = f1 – число степеней свободы дисперсии адекватности;
(n – k – 1) = f2 – число степеней свободы остаточной дисперсии;
k – число значимых коэффициентов регрессии.
В случае парной линейной регрессии f1 = 2; f2 = n – 2.
Расчётное значение критерия Фишера Fрасч. сравнивают с табличным при выбранном уровне значимости α.
Если выполняется соотношение
, (6.28)
то регрессионная модель признаётся адекватной и может быть использована для предсказания значений зависимой переменной Y при всех значениях независимой переменной Х в пределах наблюдавшихся при эксперименте значений последней.
Определяют стандартную ошибку аппроксимации, т.е. разности , которую можно использовать для оценки ошибки предсказаний зависимой переменной Y по регрессионной линейной модели:
. (6.29)
Рассчитывают также среднюю относительную ошибку аппроксимации (в % от средней величины зависимой переменной Y) по формуле:
. (6.30)
Чем меньше величина ε, тем более точными будут предсказания значений переменной Y по уравнению регрессии.
6.7 Три показателя корреляции и регрессии, их значение и применение
Коэффициент регрессии byx указывает среднее число единиц, на которое увеличивается или уменьшается величина параметра Y при каждом увеличении фактора Х на единицу его измерения.
Коэффициент детерминации измеряет ту долю изменений в величинах измеряемого параметра Y, которая может быть объяснена влиянием фактора Х и оценивается в связи с этим влиянием.
Стандартная ошибка оценки Syx указывает, насколько близко оцененные по регрессионной модели величины совпадают с наблюдаемыми при эксперименте величинами оцениваемого параметра Y.
Эти три коэффициента измеряют различные аспекты отношений взаимосвязи параметров Х и Y.
Какой из этих показателей должен привлечь наибольшее внимание зависит от того, чему придаётся на данном этапе исследования наибольшее значение: абсолютной величине изменений Y – т.е. регрессии, близости соразмерных изменений Х и Y – т.е. корреляции или точности оценки значений переменной Y, характеризуемой величиной стандартной ошибки.
Но все эти показатели имеют своё место при анализе изучаемой корреляционной зависимости Y от X и ни один не должен быть совершенно опущен или забракован.