- •1. Простые и сложные статистические гипотезы.
- •2. Проверка статистических гипотез
- •3. Построение критерия проверки гипотезы.
- •1. Проверка гипотез о значении параметров распределения
- •2. Критерий согласия Пирсона
- •Выборочная линейная среднеквадратическая регрессия
- •Свойства линейной регрессии и коэффициента корреляции.
- •3. О множественной регрессии
- •4. О нелинейной регрессии
-
Выборочная линейная среднеквадратическая регрессия
Линейная регрессия является простейшей регрессионной моделью, согласно которой функция регрессии является линейной 2-параметрической функцией:
,
где - неопределенные коэффициенты, которые оценим по наблюдаемым данным. Пусть имеется двухфакторная выборка n наблюдений за величинами X и Y, которую будем называть корреляционным полем. Помимо выборочных средних значений и выборочных дисперсий , вычислим так же среднее произведение и выборочный (эмпирический) коэффициент корреляции , который является выборочным аналогом теоретического коэффициента корреляции Пирсона .
Построим оценки коэффициентов методом наименьших квадратов. Для этого найдем такие значения , которые минимизируют сумму квадратов отклонения и , то есть ошибки
.
Из необходимых условий минимума найдем искомые оценки :
; ; ,
; ; .
Через выборочный коэффициент корреляции , коэффициент представим в форме , а уравнение выборочной линейной среднеквадратической регрессии имеет одну из следующих форм:
; ;
; .
-
Свойства линейной регрессии и коэффициента корреляции.
Построенная выборочная линейная среднеквадратичная регрессия является простейшим приближение корреляционной зависимости, показывает тенденцию (тренд) этой зависимости и изображается прямой на корреляционном поле, наименее уклоняющейся от его точек. Прямая линия регрессии проходит через точку , отсекает от оси отрезок , и имеет угол наклона с тангенсом равным как это изображено на рис. 15.1.
Рис. 15.1 Прямая линейной среднеквадратической регрессии.
Выборочный коэффициент корреляции характеризует степень корреляционной зависимости наблюдаемых величин Х и У и обладает следующими свойствами:
1. ,
2. для независимых Х и У коэффициент близок к нулю,
3. для линейно зависимых величин он близок к единице.
Геометрически он показывает «тесноту» корреляционного поля возле прямой линии регрессии, что иллюстрирует следующий рисунок для различных значений коэффициента:
.
Рис. 15.2 Корреляционное поле для различных уровней корреляции величин
На рис. 15.2 видно, что некоррелированной выборке соответствует неориентированное шаровое корреляционное поле, с ростом поле сжимается и ориентируется к прямой. Знак коэффициента говорит о нарастающем или убывающем тренде зависимости.
Ошибки регрессии имеют нулевое среднее значение , так как , и минимальную в соответствии с методом наименьших квадратов дисперсию , так называемую остаточную дисперсию, которая тем меньше, чем выше коэффициент корреляции. Величина выборочной дисперсии является статистической оценкой для дисперсии ошибки , однако, это смещенная оценка. Несмещенной (исправленной) оценкой является величина , величина называется стандартной ошибкой регрессии. Ошибки для коэффициентов регрессии вычисляются по формулам:
, .
В корреляционном анализе также вводится понятие коэффициента детерминации , показывающего долю объясненной части дисперсии объясняемой переменной Y. Поскольку , то коэффициент детерминации представим так же в следующем виде
,
показывающем его прямую связь с коэффициентом корреляции.
Известно [9] распределение случайных величин, связанных с введенными выше коэффициентами при условии независимости величин и :
~ распределение Стьюдента с степенями свободы,
~ F-распределение Фишера с степенями свободы.
Эти величины используется для построения критериев значимости выборочных коэффициентов и , и их распределение приводится приложениях 3 и 5 соответственно. Действительно, например, задаваясь уровнем значимости проверяемой гипотезы , соответствующей независимости величин Х и Y, можно сравнить наблюдаемое значение критерия , с критическим значением . Если , то гипотеза принимается, что говорит о не значимости выборочного коэффициента корреляции мало отличного от нуля. Если же , то гипотеза отвергается, то есть выборочный коэффициент корреляции, а значит и уравнение регрессии, значимы. Значимость коэффициента корреляции говорит о том, что полученный по данной выборке коэффициент неслучайно отличен от нуля, а корреляционная зависимость между наблюдаемыми величинами существенна.
Аналогично строится критерий Фищера для проверки гипотезы о значимости коэффициента детерминации :
, гипотеза принимается, т.е. незначим.
Выводы этих критериев значимости и идентичны [9].
Значимость коэффициентов регрессии может быть оценена по уровню значимости по критериям Стьюдента
, .