- •Глава 14. Прогнозирование и планирование: снижение риска при принятии решений
- •Глава 15. Методы скользящего среднего и сглаживания: количественное прогнозирование
- •Глава 16. Регрессионный анализ: популярная система прогнозирования продаж
- •2. Среднеквадратическая ошибка (стандартное отклонение) для оценки Se и доверительный интервал.
- •3. Стандартное отклонение для коэффициента регрессии Sb и t-статистика
- •Глава 17. Прогнозирование денежного потока: два практических метода
- •Глава 18. Финансовое моделирование: инструменты для бюджетирования и планирования прибыли
- •Подробная финансовая модель
2. Среднеквадратическая ошибка (стандартное отклонение) для оценки Se и доверительный интервал.
Стандартное отклонение для оценки обозначается Se и рассчитывается по формуле среднеквадратичного отклонения:
.
Величина стандартного отклонения характеризует точность прогноза.
Вариант 5. Возвращаясь к данным нашего примера, рассчитаем значение Se:
Предположим, необходимо оценить значение Y для конкретного значения независимой переменной, например, спрогнозировать объем продаж при затратах на рекламу в объеме 10 тыс. долл. Обычно при этом также требуется оценить степень достоверности результата, одним из показателей которого является доверительный интервал для Y.
Граница доверительного интервала для Y при заданной величине X рассчитывается следующим образом:
где Хp – выбранное значение независимой переменной, на основе которого выполняется прогноз. Обратите внимание: t – это критическое значение текущего уровня значимости. Например, для уровня значимости, равного 0,025 (что соответствует уровню доверительности двухстороннего критерия, равному 95%) и числа степеней свободы, равного 10, критическое значение t равно 2, 228 (см. Приложение II). Как можно увидеть, доверительный интервал – это интервал, ограниченный с двух сторон граничными значениями предсказания (зависимой переменной).
Вариант 6. Для нашего примера расходов на рекламу в размере 10 тыс. долл. интервал предсказания зависимой переменной (объема продаж) с уровнем доверительности в 95% находится в пределах [10,5951; 21,8361]. Его границы определяются следующим образом (обратите внимание, что в Варианте 2 Y'=16,2156):
Из приведенного расчета имеем: для заданных расходов на рекламу в объеме 10 тыс. долл., объем продаж изменяется в диапазоне от 10,5951 до 21,8361 тыс. долл. При этом: 10,5951=16,2156-5,6205 и 21,8361=16,2156+5,6205.
3. Стандартное отклонение для коэффициента регрессии Sb и t-статистика
Значения стандартного отклонения для коэффициентов регрессии Sb и значение статистики тесно взаимосвязаны. Sb рассчитываются как
Или в сокращенной форме:
Sb задает интервал, в который попадают. Все возможные значения коэффициента регрессии. t-статистика (или t-значение) – мера статистической значимости влияния независимой переменной Х на зависимую переменную Y определяется путем деления оценки коэффициента b на его стандартное отклонение Sb. Полученное значение затем сравнивается с табличным (см. табл. В Приложении II).
Таким образом, t-статистика показывает, насколько велики величина стандартного отклонения для коэффициента регрессии (насколько оно больше нуля). Практика показывает, что любое t-значение, не принадлежащее интервалу [-2;2], является приемлемым. Чем выше t-значение, тем выше достоверность коэффициента (т.е. точнее прогноз на его основе). Низкое t-значение свидетельствует о низкой прогнозирующей силе коэффициента регрессии.
Вариант 7. Sb для нашего примера равно:
t-статистика определяется:
Так как t=3,94>2, можно заключить, что коэффициент b является статистически значимым. Как отмечалось раньше, табличное критическое значение (уровень отсечения) для 10 степеней свободы равно 2,228 (см. табл. в Приложении 11).
Обратите внимание:
- t-значения играют большую роль для коэффициентов множественной регрессии (множественная модель описывается с помощью нескольких коэффициентов b);
- R2 характеризует общее согласие (всего «леса» невязок на диаграмме разброса), в то время как t-значение характеризует отдельную независимую переменную (отдельное «дерево» невязок).
В общем случае табличное t-значение для заданных числа степеней свободы и уровня значимости используется, чтобы:
- установить диапазон предсказания: верхнюю и нижнюю границы для прогнозируемого значения при заданном значении независимой переменной;
-установить доверительные интервалы для коэффициентов регрессии;
- определить уровень отсечения для t-теста.
РЕГРЕССИОННЫЙ АНАЛИЗ С ПРИМЕНЕНИЕМ ЭЛЕКТРОННЫХ ТАБЛИЦ MS EXCEL
Электронные таблицы, такие как Excel, имеют встроенную процедуру регрессионного анализа, легкую в применении.
Регрессионный анализ с помощью MS Ехсеl требует выполнения следующих действий:
- выберите пункт меню «Сервис - Надстройки»;
- в появившемся окне отметьте галочкой надстройку Analysis ToolPak – VBA нажмите кнопку ОК.
Если в списке Analysis ToolPak - VВА отсутствует, выйдите из MS Ехсеl и добавьте эту надстройку, воспользовавшись программой установки Мiсrosоft Office. Затем запустите Ехсеl снова и повторите эти действия. Убедившись, что надстройка Analysis ToolPak - VВА доступна, запустите инструмент регрессионного анализа, выполнив следующие действия:
- выберите пункт меню «Сервис - Анализ» данных;
- в появившемся окне выберите пункт «Регрессия» и нажмите кнопку ОК. На рисунке 16.3 показано окно ввода данных для регрессионного анализа.
Рисунок 16.3 – Окно ввода данных для регрессионного анализа
Таблица 16.2 показывает выходной результат регрессии, содержащий описанные выше статистические данные.
Примечание: для того чтобы получить поточечный график (ХY график), используйте «Мастер Диаграмм» MS Excel.
Получаем: Y' = 10,5386 + 0,563197 Х (d виде Y' = а + bХ) с R2=0,608373=60,84%.
Все полученные данные ответствуют данным, рассчитанным вручную.
Таблица 16.2 – Результаты регрессионного анализа
в электронных таблицах MS Excel
Вывод итогов | ||||||
Регрессионная статистика |
| |||||
Множественный R |
0,7800 | |||||
R-квадрат |
0,6084 | |||||
Нормированный R-квадрат |
0,5692 | |||||
Стандартная ошибка |
2,3436 | |||||
Наблюдения |
12 | |||||
Дисперсионный анализ |
| |||||
|
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
1 |
85,3243 |
85,3243 |
15,5345 |
0,0028 | |
Остаток |
10 |
54,9257 |
5,4926 |
|
| |
Итого |
11 |
140,2500 |
|
|
| |
|
Коэффи-циенты |
Стандарт-ная ошибка |
t-статистика |
Р- значение* |
Нижние 95% |
Верхние 95% |
Свободный член |
10,5836 |
2,1796 |
4,8558 |
0,0007 |
5,7272 |
15,4401 |
Линейный коэффициент |
0,563197 |
0,1429 |
3,9414 |
0,0028 |
0,2448 |
0,8816 |
*Р – значение для переменной X, равное 0,0028 показывает, что истинное значение переменной коэффициента с 0,28%-ной вероятностью равна нулю, что предполагает высокую точность прогнозируемого значения, равного 0б563197. |
Таблица 16.3 показывает выходной результат регрессии, полученный с применением популярного программного обеспечения Minitab для статистического анализа.
Таблица 16.3 – Результаты регрессионного анализа Minitab
Анализ регрессии Уравнение регрессии: FO=10,6+0,563DLH | |||||
Прогнозируемые параметры |
Коэффициент |
Стандартное отклонение |
t-значение |
P | |
Константа |
10,584 |
2,180 |
4,86 |
0,000 | |
DLH |
0,5632 |
0,1429 |
3,94 |
0,003 | |
s=2,344 |
R-квадрат=60,8% |
R-квадрат (нормированный)=56,9% | |||
Анализ отклонений | |||||
Показатель |
DF |
SS |
MS |
F |
P |
Регрессия |
1 |
85,324 |
85,324 |
15,53 |
0,003 |
Отклонение |
10 |
54,926 |
5,493 |
|
|
Итого |
11 |
140,250 |
|
|
|
ВЫВОДЫ
C помощью регрессионного анализа устанавливается зависимость между изменениями независимых переменных и значениями зависимой переменной. Регрессионный анализ - популярный метод для прогнозирования продаж. В этой главе обсуждался широко распространенный способ оценки значений, так называемый метод наименьших квадратов. Метод наименьших квадратов рассматривался применительно к модели простой регрессии Y = а + bх. Обсуждались различные статистические коэффициенты, характеризующие добротность и надежность уравнения (согласие модели) и помогающие установить доверительный интервал.
Показано применение электронных таблиц MS Ехсеl для проведения регрессионного анализа шаг за шагом. С помощью электронных таблиц можно не только составить уравнение регрессии, но и рассчитать статистические коэффициенты.