- •«Однофакторный регрессионный анализ при помощи системы “Gretl”»
- •Содержание
- •1 Общие понятия регрессионного анализа
- •Коэффициент детерминации
- •Адекватность регрессионного уравнения
- •Оценка качества регрессионного уравнения.
- •2 Порядок построения экономико-математической модели с помощью метода регрессионного анализа
- •3 Однофакторный регрессионный анализ в системе «gretl»
- •4 Пример регрессионного анализа
- •Ход решения задачи
- •5 Задание по выполнению лабораторной работы
- •6 Порядок выполнения работы
- •7. Контрольные вопросы
- •Библиографический список
4 Пример регрессионного анализа
Необходимо оценить эффективность рекламы.
Имеются данные о числе показов рекламы в месяц и натуральном объеме продаж продукции.
Они представлены в таблице 4.1.
Таблица 4.1 – Данные для анализа
-
Продажа (тыс.штук),
Y
Реклама (число показов в месяц),
X
260
5
286
7
279
6
410
9
438
12
315
8
565
11
570
16
426
13
315
7
403
10
220
4
343
9
644
17
520
19
329
9
426
11
343
8
450
13
421
14
Ход решения задачи
Предположим, что объем реализации товаров зависит от числа показов рекламы. Для проверки этого предположения построим график и рассчитаем коэффициент корреляции.
Рисунок 4.1 – Меню построения графика
Рисунок 4.2 – График зависимости продаж от числа показа рекламы
Рисунок 4.3 – Диалоговое окно для расчета коэффициента корреляции
Рисунок 4.4 – Результат расчета коэффициента корреляции между данными
График показывает, что объем продаж возрастает с увеличением числа телевизионных роликов, демонстрируемых ежемесячно. Коэффициент корреляции между данными составляет 0,88, что свидетельствует о сильной положительной связи между переменными.
Построим регрессионные модели вида:
и ,
где – число показов в месяц,
– продажа изделий (тыс. шт.).
Использование команды Model - ordinary least squares даст нам следующий результат:
Model 1: OLS estimates using the 20 observations 2005:01-2006:08
Dependent variable: Q
coefficient std. error t-ratio p-value
---------------------------------------------------------
reklama 36,6019 1,46053 25,06 5,09E-016 ***
Mean of dependent variable = 398,15
Standard deviation of dep. var. = 112,733
Sum of squared residuals = 100189
Standard error of the regression = 72,6163
Unadjusted R-squared = 0,97064
Adjusted R-squared = 0,97064
Centered R-squared = 0,58508
F-statistic (1, 19) = 628,042 (p-value < 0,00001)
Durbin-Watson statistic = 1,61167
First-order autocorrelation coeff. = 0,13405
Log-likelihood = -113,57
Akaike information criterion (AIC) = 229,139
Schwarz Bayesian criterion (BIC) = 230,135
Hannan-Quinn criterion (HQC) = 229,334
Рисунок 4.5 - Результаты регрессионного анализа
Регрессионное уравнение будет иметь вид:
,
где х – число показов рекламы в месяц,
у – объем реализации продукции.
coefficient std. error t-ratio p-value
---------------------------------------------------------
reklama 36,6019 1,46053 25,06 5,09E-016 ***
При уровне значимости 5% принимается гипотеза о значимости коэффициентов регрессионного уравнения (P<0.05).
Standard error of the regression = 72,6163
Стандартная ошибка регрессии – 72,6163, что является достаточно высоким результатом по сравнению со средним значением зависимой переменной – 398,15.
Unadjusted R-squared = 0,97064
Adjusted R-squared = 0,97064
Коэффициент детерминации 97% ‑ это та часть общей вариации зависимой переменной, которая объясняется уравнением регрессии. Значение коэффициента детерминации свидетельствует о высокой степени соответствия построенной модели исходным данным.
F-statistic (1, 19) = 628,042 (p-value < 0,00001)
На основе результатов дисперсионного анализа при уровне значимости в 5% можно принять альтернативную гипотезу, то есть можно утверждать, что уравнение регрессии адекватно отражает зависимость между переменными.
Проведем оценку регрессионного уравнения вида
Результаты представлены ниже.
Model 2: OLS estimates using the 20 observations 2005:01-2006:08 Dependent variable: Q
coefficient std. error t-ratio p-value
--------------------------------------------------------
const 140,009 33,7467 4,149 0,0006 ***
reklama 24,8212 3,03544 8,177 1,79E-07 ***
Mean of dependent variable = 398,15
Standard deviation of dep. var. = 112,733
Sum of squared residuals = 51214,7
Standard error of the regression = 53,341
Unadjusted R-squared = 0,78790
Adjusted R-squared = 0,77612
Degrees of freedom = 18
Durbin-Watson statistic = 2,12506
First-order autocorrelation coeff. = -0,115888
Log-likelihood = -106,859
Akaike information criterion (AIC) = 217,719
Schwarz Bayesian criterion (BIC) = 219,71
Hannan-Quinn criterion (HQC) = 218,107
Как видно из полученных результатов регрессионное уравнение имеет вид:
Standard error of the regression = 53,341
Средняя ошибка регрессии ниже, чем в предыдущем случае и составляет 53,341.
При уровне значимости 5% принимается гипотеза о значимости коэффициентов регрессионного уравнения (P<0.05).
Unadjusted R-squared = 0,78790
Adjusted R-squared = 0,77612
Коэффициент детерминации 78.8% ‑ Значение коэффициента детерминации свидетельствует о более низкой степени соответствия построенной модели исходным данным в отличие от предыдущей.
Analysis of Variance:
Sum of squares df Mean square
Regression 190250 1 190250
Residual 51214,7 18 2845,26
Total 241465 19 13414,7
R^2 = 190250 / 241465 = 0,787900
F(1, 18) = 190250 / 2845,26 = 66,8655 [p-value 1,79e-007]
На основе результатов дисперсионного анализа при уровне значимости в 5% можно принять альтернативную гипотезу, то есть можно утверждать, что уравнение регрессии адекватно отражает зависимость между переменными.
Для выбора модели составим таблицу статистических оценок уравнения регрессии и сравним критерии качества регрессионного уравнения в первом и втором случае.
Таблица 4.2 – Статистические оценки регрессионных моделей
|
|
|
Значимость коэффициентов по критерию Стъюдента |
значим |
значимы |
Адекватность регрессионного уравнения по критерию Фишера |
адекватно |
адекватно |
Стандартная ошибка регрессии |
72,6163 |
53,341 |
Коэффициент детерминации |
0,97064 |
0,78790 |
Log-likelihood |
-113,57 |
-106,859 |
AIC |
229,139 |
217,719 |
BIC |
230,135 |
219,71 |
HQC |
229,334
|
218,107
|
Анализируя характеристики двух моделей, можно прийти к выводу о том, что в первой модели коэффициент детерминации выше, а во второй модели меньше ошибка и лучше показатели качества регрессионного уравнения. Следовательно, более точной является вторая модель.
Таким образом, модель зависимости объема продаж от числа показов рекламы в месяц будет иметь вид:
В случае, если показы рекламных роликов не будут осуществляться, то объемы продаж будут находиться на отметке 140 единиц. Уравнение регрессии показывает, что если число показов в месяц возрастет на единицу, то это приведет к увеличению объемов продаж на 24.8 единиц.