Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб5_регрессия_Gretl_23102008.doc
Скачиваний:
10
Добавлен:
05.05.2019
Размер:
494.59 Кб
Скачать

4 Пример регрессионного анализа

Необходимо оценить эффективность рекламы.

Имеются данные о числе показов рекламы в месяц и натуральном объеме продаж продукции.

Они представлены в таблице 4.1.

Таблица 4.1 – Данные для анализа

Продажа (тыс.штук),

Y

Реклама (число показов в месяц),

X

260

5

286

7

279

6

410

9

438

12

315

8

565

11

570

16

426

13

315

7

403

10

220

4

343

9

644

17

520

19

329

9

426

11

343

8

450

13

421

14

Ход решения задачи

  1. Предположим, что объем реализации товаров зависит от числа показов рекламы. Для проверки этого предположения построим график и рассчитаем коэффициент корреляции.

Рисунок 4.1 – Меню построения графика

Рисунок 4.2 – График зависимости продаж от числа показа рекламы

Рисунок 4.3 – Диалоговое окно для расчета коэффициента корреляции

Рисунок 4.4 – Результат расчета коэффициента корреляции между данными

График показывает, что объем продаж возрастает с увеличением числа телевизионных роликов, демонстрируемых ежемесячно. Коэффициент корреляции между данными составляет 0,88, что свидетельствует о сильной положительной связи между переменными.

  1. Построим регрессионные модели вида:

и ,

где – число показов в месяц,

– продажа изделий (тыс. шт.).

Использование команды Model - ordinary least squares даст нам следующий результат:

Model 1: OLS estimates using the 20 observations 2005:01-2006:08

Dependent variable: Q

coefficient std. error t-ratio p-value

---------------------------------------------------------

reklama 36,6019 1,46053 25,06 5,09E-016 ***

Mean of dependent variable = 398,15

Standard deviation of dep. var. = 112,733

Sum of squared residuals = 100189

Standard error of the regression = 72,6163

Unadjusted R-squared = 0,97064

Adjusted R-squared = 0,97064

Centered R-squared = 0,58508

F-statistic (1, 19) = 628,042 (p-value < 0,00001)

Durbin-Watson statistic = 1,61167

First-order autocorrelation coeff. = 0,13405

Log-likelihood = -113,57

Akaike information criterion (AIC) = 229,139

Schwarz Bayesian criterion (BIC) = 230,135

Hannan-Quinn criterion (HQC) = 229,334

Рисунок 4.5 - Результаты регрессионного анализа

Регрессионное уравнение будет иметь вид:

,

где х – число показов рекламы в месяц,

у – объем реализации продукции.

coefficient std. error t-ratio p-value

---------------------------------------------------------

reklama 36,6019 1,46053 25,06 5,09E-016 ***

При уровне значимости 5% принимается гипотеза о значимости коэффициентов регрессионного уравнения (P<0.05).

Standard error of the regression = 72,6163

Стандартная ошибка регрессии – 72,6163, что является достаточно высоким результатом по сравнению со средним значением зависимой переменной – 398,15.

Unadjusted R-squared = 0,97064

Adjusted R-squared = 0,97064

Коэффициент детерминации 97% ‑ это та часть общей вариации зависимой переменной, которая объясняется уравнением регрессии. Значение коэффициента детерминации свидетельствует о высокой степени соответствия построенной модели исходным данным.

F-statistic (1, 19) = 628,042 (p-value < 0,00001)

На основе результатов дисперсионного анализа при уровне значимости в 5% можно принять альтернативную гипотезу, то есть можно утверждать, что уравнение регрессии адекватно отражает зависимость между переменными.

Проведем оценку регрессионного уравнения вида

Результаты представлены ниже.

Model 2: OLS estimates using the 20 observations 2005:01-2006:08 Dependent variable: Q

coefficient std. error t-ratio p-value

--------------------------------------------------------

const 140,009 33,7467 4,149 0,0006 ***

reklama 24,8212 3,03544 8,177 1,79E-07 ***

Mean of dependent variable = 398,15

Standard deviation of dep. var. = 112,733

Sum of squared residuals = 51214,7

Standard error of the regression = 53,341

Unadjusted R-squared = 0,78790

Adjusted R-squared = 0,77612

Degrees of freedom = 18

Durbin-Watson statistic = 2,12506

First-order autocorrelation coeff. = -0,115888

Log-likelihood = -106,859

Akaike information criterion (AIC) = 217,719

Schwarz Bayesian criterion (BIC) = 219,71

Hannan-Quinn criterion (HQC) = 218,107

Как видно из полученных результатов регрессионное уравнение имеет вид:

Standard error of the regression = 53,341

Средняя ошибка регрессии ниже, чем в предыдущем случае и составляет 53,341.

При уровне значимости 5% принимается гипотеза о значимости коэффициентов регрессионного уравнения (P<0.05).

Unadjusted R-squared = 0,78790

Adjusted R-squared = 0,77612

Коэффициент детерминации 78.8% ‑ Значение коэффициента детерминации свидетельствует о более низкой степени соответствия построенной модели исходным данным в отличие от предыдущей.

Analysis of Variance:

Sum of squares df Mean square

Regression 190250 1 190250

Residual 51214,7 18 2845,26

Total 241465 19 13414,7

R^2 = 190250 / 241465 = 0,787900

F(1, 18) = 190250 / 2845,26 = 66,8655 [p-value 1,79e-007]

На основе результатов дисперсионного анализа при уровне значимости в 5% можно принять альтернативную гипотезу, то есть можно утверждать, что уравнение регрессии адекватно отражает зависимость между переменными.

Для выбора модели составим таблицу статистических оценок уравнения регрессии и сравним критерии качества регрессионного уравнения в первом и втором случае.

Таблица 4.2 – Статистические оценки регрессионных моделей

Значимость коэффициентов по критерию Стъюдента

значим

значимы

Адекватность регрессионного уравнения по критерию Фишера

адекватно

адекватно

Стандартная ошибка регрессии

72,6163

53,341

Коэффициент детерминации

0,97064

0,78790

Log-likelihood

-113,57

-106,859

AIC

229,139

217,719

BIC

230,135

219,71

HQC

229,334

218,107

Анализируя характеристики двух моделей, можно прийти к выводу о том, что в первой модели коэффициент детерминации выше, а во второй модели меньше ошибка и лучше показатели качества регрессионного уравнения. Следовательно, более точной является вторая модель.

Таким образом, модель зависимости объема продаж от числа показов рекламы в месяц будет иметь вид:

В случае, если показы рекламных роликов не будут осуществляться, то объемы продаж будут находиться на отметке 140 единиц. Уравнение регрессии показывает, что если число показов в месяц возрастет на единицу, то это приведет к увеличению объемов продаж на 24.8 единиц.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]