- •Регрессионный анализ
- •Регрессионный анализ данных по диаграмме (Трендовые модели)
- •Инструмент «Регрессия»
- •4) Расчетные (предсказанные) значения y и остатки (разность между фактическим и расчетным y ).
- •Статистические функции определения параметров регрессии, их оценки, прогнозирования
- •Структура результата, возвращаемого функцией лгрфприбл
Инструмент «Регрессия»
Используется для нахождения коэффициентов линейной и полиномиальной регрессии и оценки их достоверности.
Линейная регрессия имеет место при линейной зависимости между исследуемым параметром и переменными: . Таким образом, чтобы получить уравнение регрессии нужно определить коэффициенты mi и константу b. Вычисления проводятся по методу наименьших квадратов.
При заполнении диалога Регрессия задается:
Входной интервал Y — это значения зависимой переменной (1 столбец);
Входной интервал X — это значения независимых переменных (максимум 16 столбцов);
Устанавливается флажок Остатки;
Выходной интервал — указывается верхняя левая ячейка, начиная с которой выводится результат.
Результаты регрессионного анализа выводятся в четырех таблицах:
1) Вывод итогов — содержит значения среднеквадратического отклонения Y — [Y], коэффициента корреляции Пирсона R, коэффициента детерминированности R2, который изменяется в пределах [0;1]. Это величина, характеризующая степень взаимосвязи между зависимой переменной Y и независимыми Х1 Х2, ... Хn. Качественную оценку взаимосвязи можно провести по шкале Чеддока:
R2 |
0,1—0,3 |
0,3—0,5 |
0,5—0,7 |
0,7—0,9 |
0,9—0,99 |
Характеристика силы связи |
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
2) Дисперсионный анализ (ANOVA)
|
df |
SS (сумма квадратов) |
MS-дисперсия |
F-статистика |
Значимость F |
Регрессия |
кол-во Х |
SSreg регрессионная |
SSreg / df1 |
MSreg/MSresid |
F |
Остаток |
число степеней свободы = кол_знач_Х - (кол_Х + 1) |
SSresid остаточная |
SSresid / df2 |
|
|
Итого |
сумм |
сумм |
|
|
|
Параметр F-статистика используется для оценки достоверности уравнения регрессии, т.е. величины R2.
Параметр Значимость F (F) — это вероятность того, что зависимость Y от Xi отсутствует (FРАСП). Тогда вероятность того, что эта зависимость существует, βF = 1 – F
3) Параметры модели — содержит:
1 ст. — коэффициенты уравнения b (строка Y-пересечение) и mi
2 ст. — их среднеквадратические отклонения [b], [mi]
3 ст. — t-статистику, которая используется для оценки достоверности коэффициентов и
4 ст. — параметр Р-значение (t) — это вероятность того, что значения mi и b не достоверны (СТЬЮДРАСП). Тогда вероятность того, что они достоверны (статистически значимы), βt = 1 – t
5-6 ст. — верхнюю и нижнюю границы доверительных интервалов для b и mi
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
b |
[b] |
tb |
1 – tb |
нижняя граница доверительного интервала для b и mi при уровне значимости 95% |
верхняя граница доверительного интервала для b и mi при уровне значимости 95% |
Переменная Х1 |
m1 |
[m1] |
tm1 |
1 – tm1 |
||
… |
… |
… |
… |
… |
||
Переменная Хn |
mn |
[mn] |
tmn |
1 – tm1 |
Значения βF и βt оценивают следующим образом:
> 0,7 |
высокая достоверность уравнения или коэффициентов |
0,7 – 0,5 |
приемлемая достоверность уравнения или коэффициентов |
< 0,5 |
низкая достоверность уравнения или коэффициентов |