Дополнительная регрессионая статистика:
Величина |
|
Описание |
se1,se2,...,sen |
|
Стандартные значения ошибок для коэффициентов m1,m2,...,mn. seb Стандартное значение ошибки для постоянной b (seb = #Н/Д, если конст имеет значение ЛОЖЬ). |
r2 |
|
Коэффициент детерминированности. |
sey |
|
Стандартная ошибка для оценки y. |
F |
|
F-статистика, или F-наблюдаемое значение. |
df=n-k |
|
Степени свободы. Степени свободы полезны для нахождения F-критических значений в статистической таблице. |
ssreg |
|
Регрессионая сумма квадратов. |
ssresid |
|
Остаточная сумма квадратов |
Для определения уровня надежности модели нужно сравнить табличные значения критической точки F-статистики (функция FРАСПОБР с заданным уровнем значимости и k-1, n-k степенями свободы, k –число переменных в уравнении, n –число наблюдений), со значением, возвращаемой функцией ЛИНЕЙН.
В приведенной выше таблице показано, в каком порядке возвращается дополнительная регрессионная статистика.
Получить оценки параметров парной регрессии и ее характеристики, используя функцию ЛИНЕЙН (в ячейках Q40 R44).
Найти значения t-статистик для параметров уравнения, равной отношению оценки коэффициента регрессии к его стандартному отклонению (в ячейках Q46 R46)..
Найти критические значение F-статистики (в ячейке U44).и t- статистики (в ячейке U45).с уровнем значимости 0,01. (Наличия линейной связи между переменными нельзя отрицать при Fф > F , где F - значение F-распределения Фишера с (k-1, n-k) степенями свободы).
Сделать выводы о значимости (незначимости) уравнения регрессии и параметра β (в ячейке Р50) .
2.5. Нахождение оценок параметров уравнения парной регрессии можно производить с помощью матричных операций. Для этого вводятся матрицы результатов наблюдений, имеющие в нашем случае вид: Y = ; X= ; и оценок параметров уравнения:= .
С помощью метода наименьших квадратов можно получить оценку b для коэффициентов регрессии :
= ( Xт X )-1 Xт Y
где ( Xт X )-1 - матрица, обратная матрице Xт X, которая, по предположению, существует.
Порядок выполнения работы:
Для реализации указанного метода столбец С расчетного листа «ПарРег» заполняем единицами (если он был занят – вставить столбец).
Для упрощения работы и облегчения выполнения действий с матрицами воспользуемся технологией присвоения имен диапазонам ячеек. Для этого выделите диапазон ячеек, в котором размещена матрица, затем выберите в меню ВставкаÞИмяÞПрисвоить. В появившемся диалоговом окне в поле Имя введите имя Y, Х. Присвоенное имя можно использовать в качестве ссылки на поименованные данные. Можно присвоить имя и объему выборки n.
Тогда, например, для вычисления оценок параметров в соответствующую ячейку достаточно ввести формулу
Формулы вводятся постепенно с использованием редактора формул.
Коэффициент детерминации задается формулой
Рекомендуется при вычислении R2 отдельно подсчитать числитель и знаменатель, используя операции над матрицами.
Для справки при вводе функций можно пользоваться примером расчета, представленном на листе «ПарРег ПРИМЕР»
Для проверки значимости полученного уравнения регрессии вычисляется значение F-статистики Fф, подчиняющейся распределению Фишера:
Fф
2.6. Нахождение доверительных интервалов параметров уравнения парной регрессии с надежностью (1-ε) заключается в определении точности оценок и нижних и верхних границ параметров:
Δα=Sα·tкр(ε/2; n-k) и Δβ= Sβ·tкр(ε/2; n-k)
αнижн =α-Δα; αверх =α+Δα
βнижн =β-Δβ; βверх =β+Δβ
В ячейках Q86, Q87 найти точности оценок параметров, а в ячейках Q89-Q90, Т89-Т90 их нижние и верхние границы с надежностью 0,99.
Для проверки значимости полученного уравнения регрессии вычисляется значение F-статистики Fф, подчиняющейся распределению Фишера:
2.7. Проверка уровня значимости уравнения и коэффициентов при факторных переменных производится нахождением вероятности, с которой соответствующий критерий проверки гипотезы принимает фактическое значение. Для этого используются функции
FРАСП(Fфакт; k;n-k) СТЬЮДРАСП(tфакт; n-k;2)
Определить уровень значимости уравнения и параметра β.
Замечания
Точность аппроксимации с помощью прямой, вычисленной функцией ЛИНЕЙН, зависит от степени разброса данных. Чем ближе данные к прямой, тем более точной является модель, используемая функцией ЛИНЕЙН. Функция ЛИНЕЙН использует метод наименьших квадратов для определения наилучшей аппроксимации данных.
Значимость факторных переменных в уравнении регрессии проверяется сравнением t-статистики, равной отношению оценки коэффициента регрессии к его стандартному отклонению, с ее критическим значением tкр, определяемым по таблицам или с помощью функции СТЬЮДРАСПОБР с заданным уровнем значимости и (n-k) степенями свободы. Незначимые переменные следует исключить из уравнения.