kozinova_a.t._praktikum_po_ekonometrike_fup
.pdfШирина доверительного интервала прогноза производства хлеба и хлебобулочных изделий в РФ, после включения в модель сезонной компоненты, стала значительно меньше, что увеличило привлекательность прогноза для пользователей. В табл. 3.4.3.3 приведены результаты прогнозирования.
Таблица 3.4.3.3
Прогноз производства хлеба и хлебобулочных изделий в РФ
|
|
|
точечный |
|
|
доверительный прогноз |
фактические значения |
||||||||||
|
|
|
|
прогноз |
|
|
|||||||||||
|
|
|
|
|
|
производства хлеба и |
|||||||||||
квартал |
t |
* |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
ˆ |
* = |
S |
+ |
T |
* |
|
ˆ * |
− |
y |
|
ˆ * + |
y |
хлебобулочных изделий |
||||
|
|
|
|
||||||||||||||
|
|
|
|
|
|
(тыс. тонн) |
|||||||||||
|
|
|
y |
|
|
|
|
y |
|
|
y |
|
|||||
1 кв. 2009 |
37 |
|
1753,61 |
|
|
1699,63 |
|
1807,59 |
|
1723 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||
2 кв. 2009 |
38 |
|
1857,05 |
|
|
1803,07 |
|
1911,03 |
|
1809 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||
3 кв. 2009 |
39 |
|
1908,72 |
|
|
1854,74 |
|
1962,70 |
|
1838 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||
4 кв. 2009 |
40 |
|
1860,38 |
|
|
1806,40 |
|
1914,36 |
|
1821 |
|||||||
|
|
|
|
|
|
|
|||||||||||
Нужно отметить то, что |
у модели сезонной компоненты показателя |
||||||||||||||||
Zt = yt − Tt |
имеются недостатки, |
|
а |
именно, |
нарушены |
предпосылки об |
отсутствии автокорреляции остатков и наличии у них нормального закона распределения. Наличие автокорреляции остатков говорит о том, что в модели не были учтены какие-то факторы, существенно влияющие на моделируемый показатель. То, что нарушена предпосылка о нормальном законе распределения остатков (при уровне значимости 5%), сказалось на надежности доверительного интервала прогноза показателя.
Оправдались прогнозы производства хлеба и хлебобулочных изделий в РФ на первый, второй и четвертый кварталы 2009 года. Фактическое значение производства хлеба и хлебобулочных изделий в РФ на 3 квартал 2009 года не попало в доверительный интервал прогноза, полученный с приемлемой надежностью 95%. Прогноз оказался завышенным и не подтвердился. Однако, разница между нижней границей доверительного интервала и фактическим значением исследуемого показателя не велика, а именно, менее 1%.
Следует отметить то, что ограничиваться только описанием тренда производства хлеба и хлебобулочных изделий в РФ при наличии ярко выраженной сезонной компоненты, явно нельзя. Для анализа данного показателя более полезна аддитивная модель, включающая тренд и сезонную компоненту. Остается открытым вопрос о других факторах, существенно влияющих на изучаемый показатель.
Пример 3.4.4. Рассмотрим данные Федеральной службы государственной статистики Российской Федерации по макроэкономическому показателю – индекс потребительских цен в России за 2000 – 2008 годы, представленные в процентах к предыдущему кварталу в табл. 3.5.2.3.
51
Определим структуру временного ряда индекса потребительских цен. Согласно коррелограмме на рис. 3.4.4.1, у показателя имеется сезонная компонента, т.к.:
r4 = max rk = 0,67 ≈ r8 = 0,64 ≈ 0,7 . k =1,9
Рис. 3.4.4.1. Коррелограмма временного ряда
Так как r1 = 0,28 < 0,3 < max rk , то нельзя сразу предположить наличие k
линейного тренда у индекса потребительских цен в РФ, и это не следует из графика поведения данного показателя на рис. 3.4.4.2.
Рис. 3.4.4.2. Индекс потребительских цен в РФ (%)
Оценивая сезонную компоненту с помощью фиктивных показателей и МНК, реализованного в инструменте «Регрессия» надстройки «Анализ Данных» MS EXCEL, получим модель:
yˆ t = St = 104,87 −1,67 Ft 2 − 3,32 Ft3 −1,46 Ft 4
Модель отражает реальную картину, а именно, существенное влияние сезонного фактора (R2 ≈ 0,5185) на индекс потребительских цен в РФ.
52
Модель значима в целом согласно критерию Фишера (F ≈ 11,49) с
приемлемым уровнем значимости (α ≈ 2,8 *10−05 << 0,05).
Предположение о незначимости всех параметров отклоняется, согласно критерию Стьюдента, с приемлемым уровнем значимости (maxα ≈ 0,015 < 0,05)
.
Остатки модели случайны, поскольку их график имеет большое количество локальных экстремумов (21).
M (ε ) ≈ ε ≈ 2,25 *10−14 ≈ 0 .
Практически не нарушено предположение о наличии нормального закона распределения у остатков модели:
εt ≤ 2,12 ( t = 1,36).
SE
Однако нарушена предпосылка об отсутствии автокорреляции остатков, согласно критерию Дарбина Уотсона, т.к.:
d ≈ 0,85 < dL ; α = 0,05; n = 36; m = 3; dL = 1,29 .
Рассмотрим показатель – индекс потребительских цен в России за 2000 – 2008 годы за вычетом сезонной компоненты:
Zt = yt − St .
Рис. 3.4.4.3. Моделирование тренда индекса потребительских цен |
в РФ (%) без сезонной компоненты (2000 – 2008 г.) |
Коэффициенты детерминации моделей тренда показателя после исключения сезонной компоненты значительно выросли. Прежде, чем выбрать какую-либо функцию тренда для индекса потребительских цен в РФ без сезонной компоненты (рис.3.4.4.3) из двух вариантов, выполним анализ их
53
качества (табл. 3.4.4.1), используя инструмент «Регрессия» надстройки «Анализ Данных» MS EXCEL и статистические критерии.
Обе модели тренда значимы в целом и по параметрам с приемлемым уровнем значимости. Однако модели не могут использоваться для анализа и прогнозов индекса потребительских цен в РФ, т.к. нарушены предпосылки МНК:
у первой модели имеется существенная автокорреляция соседних остатков;
у второй модели нельзя говорить о наличии нормального закона распределения остатков.
Таблица 3.4.4.1
Анализ моделей тренда для индекса потребительских цен в РФ без сезонной компоненты (2000 – 2008 г.)
модель |
Tt = 1,04 − 0,0562 t |
T = 2,1455 − 0,2308t + 0,0047t 2 |
||||||||||||
|
|
|
|
|
|
|
|
|
t |
|||||
F - статистика |
12,24 |
|
|
12,21 |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
уровень |
|
|
|
|
|
|
|
|
|
|
|
|
||
значимости |
0,0013 |
|
|
0,0001 |
|
|
||||||||
F - статистики |
|
|
|
|
|
|
|
|
|
|
|
|
||
максимальный |
|
|
|
|
|
|
|
|
|
|
|
|
||
уровень |
|
|
|
|
|
|
|
|
|
|
|
|
||
значимости |
0,0044 |
|
|
0,0005 |
|
|
||||||||
t -статистик |
|
|
|
|
|
|
|
|
|
|
|
|
||
параметров |
|
|
|
|
|
|
|
|
|
|
|
|
||
число локальных |
|
|
|
|
|
|
21 |
|
|
|||||
экстремумов |
21 |
|
|
|
|
|||||||||
остатков |
|
|
|
|
|
|
|
|
|
|
|
|
||
M (ε ) ≈ |
|
≈ |
|
|
|
|
|
|
|
|
|
|
|
|
ε |
|
|
|
1,05*10-16≈0 |
|
|
|
5,55*10-16≈0 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
α = 0,05 |
|
m = 1; |
m = 2; |
|||||||||||
n = 36 |
|
d ≈ 1,16 < dL = 1,4 |
2 < d ≈ 2,05 < 4 − dU = 2,41 |
|||||||||||
наличие |
|
εt |
|
≤ 2 ( t = |
|
) |
|
εt |
|
≤ 2 ( t = |
|
) |
||
|
|
|
|
|
|
|||||||||
распределения |
|
|
1,36 |
|
|
2,36 |
||||||||
|
SE |
SE |
||||||||||||
Гаусса у остатков |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Согласно графику (рис.3.4.4.3), наибольшие колебания значений индекса потребительских цен без сезонной компоненты имелись в 2000г. Исключение данных за этот период может положительно повлиять на процесс моделирования показателя.
Определим структуру временного ряда индекса потребительских цен в РФ за 2001–2008 г. Согласно коррелограмме, у показателя имеется сезонная компонента, т.к.:
r4 = max rk = 0,73 > 0,7 . k =1,9
54
Оценивая сезонную компоненту с помощью фиктивных показателей и МНК, реализованного в инструменте «Регрессия» надстройки «Анализ Данных» MS EXCEL, получим модель:
yˆ t = St = 104,96 − 2,03 Ft 2 − 3,74 Ft3 − 1,80 Ft 4
Модель отражает реальную картину, а именно, существенное влияние
сезонного фактора (R2 ≈ 0,6594) на индекс потребительских цен в РФ.
Модель значима в целом согласно критерию Фишера (F ≈ 18,07) с
приемлемым уровнем значимости (α ≈ 1,01*10−06 << 0,05).
Предположение о незначимости всех параметров отклоняется, согласно критерию Стьюдента, с приемлемым уровнем значимости (maxα ≈ 0,001 < 0,05)
.
Остатки модели случайны, поскольку их график имеет большое количество локальных экстремумов (21).
M (ε ) ≈ ε ≈ 7,11*10−15 ≈ 0 .
Однако нарушена предпосылка об отсутствии автокорреляции остатков, согласно критерию Дарбина Уотсона, т.к.:
d ≈ 1,06 < dL ; α = 0,05; n = 32; m = 3; dL = 1,24 .
Рассмотрим показатель – индекс потребительских цен в России за 2001 – 2008 годы за вычетом сезонной компоненты: Zt = yt − St .
Рис. 3.4.4.4. Моделирование тренда индекса потребительских цен |
в РФ (%) без сезонной компоненты (2001 – 2008 г.) |
Анализ двух лучших функций тренда для индекса потребительских цен в РФ без сезонной компоненты за 2001 – 2008 годы приведен в табл. 3.4.4.2. Обе модели практически не отличаются по качеству, удачны с точки зрения статистических критериев и могут использоваться для анализа индекса потребительских цен.
55
Таблица 3.4.4.2
Анализ моделей тренда для индекса потребительских цен в РФ без сезонной компоненты (2001 – 2008 г.)
|
|
|
|
|
|
|
|
|
|
|
T = 3,713 −1,488t + 0,234t 2 |
|||||||
модель |
Tt = 1,889 − 0,254t + 0,006t |
2 |
t |
|
|
|
|
|
||||||||||
− 0,017 t3 + 0,0006t 4 − 0,0000t5 |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
R2 |
|
|
|
0,4277 |
|
|
|
|
|
|
0,5083 |
|
|
|||||
F - статистика |
|
|
|
10,84 |
|
|
|
|
|
|
5,37 |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
уровень |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
значимости |
|
|
|
0,0003 |
|
|
|
|
|
|
0,0016 |
|
|
|||||
F - статистики |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
максимальный |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
уровень |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
значимости |
|
|
|
0,0009 |
|
|
|
|
|
|
0,0636 |
|
|
|||||
t -статистик |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
параметров |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
число локальных |
|
|
|
|
|
|
|
|
|
|
|
21 |
|
|
||||
экстремумов |
|
|
|
21 |
|
|
|
|
|
|
|
|
||||||
остатков |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
M (ε ) ≈ |
|
≈ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ε |
|
|
|
|
2,71*10-16≈0 |
|
|
|
|
-2,48*10-14≈0 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
α = 0,05 |
m = 2; |
|
m = 5; |
|
|
|
|
|
||||||||||
n = 32 |
dU = 1,58< d ≈ 1,83 < 2 |
|
2 < d ≈ 2,05 < 4 − dU = 2,14 |
|||||||||||||||
наличие |
|
ε |
|
|
|
|
|
|
|
ε |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
распределения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
t |
|
≤ 2 ( t = 1,32) |
|
t |
|
≤ 2 ( t = 2,32) |
|||||||||||
Гаусса у |
|
SE |
|
|
|
SE |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
остатков |
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Используя количественное представление сезонной компоненты и тренда, можно дать две аддитивные модели индекса потребительских цен в РФ:
yˆ t = St + Tt = 104,96 Ft1 + 102,94 Ft 2 + 101,23 Ft3 + 103,16 Ft 4 +
(3.4.4.1)
+ 0,006t 2 − 0,254t + 1,889
yˆ t = St + Tt = 104,96 Ft1 + 102,94 Ft 2 + 101,23 Ft3 + 103,16 Ft 4 −
(3.4.4.2)
− 0,00001t5 + 0,0006t 4 − 0,017t3 + 0,234t2 − 1,488t + 3,713
Коэффициенты детерминации и первой (R2 ≈ 0,8051) и второй
(R2 ≈ 0,8325) моделей достаточно близки к единице. Получим прогнозы показателя на 2009 год и сравним их с фактическими данными на этот период. На рис.3.4.4.5 и в табл. 3.4.4.3 приведены результаты прогнозирования.
56
Рис. 3.4.4.5. Моделирование индекса потребительских цен в РФ (%) (2001–2008 г.)
Согласно сезонной компоненте предложенных моделей, значения индекса потребительских цен в РФ составляют в среднем на 104,96% в первом квартале 102,92% во втором, 101,23% в третьем и на 103,16% в четвертом кварталах каждого года. Сточки зрения тренда индекса потребительских цен на 2009 год, следует отметить то, что имеется тенденция увеличения, согласно первой модели тренда, и уменьшения, согласно второй.
|
|
|
|
|
Таблица 3.4.4.3 |
|
|
Прогноз индекса потребительских цен в РФ (в %) |
|
||||
|
|
точечный прогноз (yˆ * = S + T * ) |
|
|||
|
|
|
|
|
фактические |
|
|
t* |
используется |
используется |
используется |
||
квартал |
значения |
|||||
средняя |
||||||
|
|
первая |
вторая |
арифметическая |
показателя |
|
|
|
функция |
функция |
|||
|
|
|
||||
|
|
величина двух |
|
|||
|
|
тренда |
тренда |
|
||
|
|
функций тренда |
|
|||
|
|
|
|
|
||
1 кв. 2009 |
33 |
105,49 |
104,33 |
104,91 |
105,4 |
|
|
|
|
|
|
|
|
2 кв. 2009 |
34 |
103,64 |
101,41 |
102,53 |
101,9 |
|
|
|
|
|
|
|
|
3 кв. 2009 |
35 |
102,12 |
98,35 |
100,24 |
100,6 |
|
|
|
|
|
|
|
|
4 кв. 2009 |
36 |
104,26 |
98,39 |
101,33 |
100,7 |
|
|
|
|
|
|
|
|
Отклонение от |
y ≈ 1,55 |
y ≈ 1,52 |
|
|
||
точечного прогноза |
|
|
|
|
Не по всем кварталам фактические значения индекса потребительских цен попали в доверительный интервал прогноза, полученный с приемлемой надежностью 95% с помощью предложенных моделей (3.4.4.1) и (3.4.4.2). Использование средней арифметической величины двух вариантов функции тренда явно дает лучший прогноз.
57
3.5.Задания для самостоятельной работы
Задание 3.5.1. Используя данные Федеральной службы государственной статистики РФ, представленные в табл. 2.7.1 для макроэкономических показателей ( I RT , I RR , I NWP , I RWP , I PC , IPC F , IPC G , IPC S ),
представленных в виде временных рядов:
определить структуру временных рядов;
построить модели временных рядов, оценить их качество;
получить прогнозы показателя на следующие два месяца (январь, февраль) с помощью удачных моделей, сточки зрения статистических
критериев; сравнить прогнозы с фактическими значениями моделируемых показателей.
Все расчеты по моделированию макроэкономических показателей выполнить на промежутках времени один год:
I RT , I RR , I NWP , I RWP (2008г., 2009г.)
I PC , IPC F , IPC G , IPC S (2008г.)
Задание 3.5.2. Используя данные Федеральной службы государственной статистики РФ, представленные в таблицах для макроэкономических показателей, представленных в виде временных рядов:
определить структуру временного ряда;
построить модель временного ряда, оценить ее качество;
получить прогнозы показателя на 2009 год; сравнить прогнозы с фактическими значениями моделируемого показателя.
Все расчеты по моделированию макроэкономического показателя выполнить на разных промежутках времени: i = n0, n; n = 36; n0 = 5,15 .
Таблица 3.5.2.1
Оборот розничной торговли в России (в %)
год |
|
|
кварталы |
|
|
|
|
|
|
|
|
I |
II |
|
III |
IV |
|
|
|
||||
|
|
|
|
|
|
2000 |
92,4 |
101,3 |
|
105,8 |
110,5 |
|
|
|
|
|
|
2001 |
91,1 |
105 |
|
105,7 |
110,8 |
|
|
|
|
|
|
2002 |
89,2 |
103,4 |
|
107,5 |
110,6 |
|
|
|
|
|
|
2003 |
89,4 |
103,3 |
|
105,2 |
111,1 |
|
|
|
|
|
|
2004 |
92,4 |
104,5 |
|
106 |
112,3 |
|
|
|
|
|
|
2005 |
89 |
107,5 |
|
105,4 |
112,4 |
|
|
|
|
|
|
2006 |
87,5 |
109,6 |
|
107 |
112,5 |
|
|
|
|
|
|
2007 |
87 |
110,6 |
|
107,9 |
112,5 |
|
|
|
|
|
|
2008 |
87,4 |
108,4 |
|
108 |
106,3 |
|
|
|
|
|
|
2009 |
80,7 |
102,5 |
|
104 |
109,9 |
|
|
|
|
|
|
|
|
58 |
|
|
|
Таблица 3.5.2.2 Производство хлеба и хлебобулочных изделий в России (тыс. тонн)
год |
|
|
кварталы |
|
|
|
|
|
|
|
|
I |
II |
|
III |
IV |
|
|
|
||||
|
|
|
|
|
|
2000 |
2146 |
2266 |
|
2331 |
2262 |
|
|
|
|
|
|
2001 |
2044 |
2139 |
|
2217 |
2175 |
|
|
|
|
|
|
2002 |
1989 |
2124 |
|
2174 |
2101 |
|
|
|
|
|
|
2003 |
1998 |
2114 |
|
2183 |
2095 |
|
|
|
|
|
|
2004 |
1979 |
2061 |
|
2110 |
2069 |
|
|
|
|
|
|
2005 |
1904 |
2008 |
|
2050 |
2005 |
|
|
|
|
|
|
2006 |
1869 |
1957 |
|
2012 |
1977 |
|
|
|
|
|
|
2007 |
1856 |
1951 |
|
1977 |
1973 |
|
|
|
|
|
|
2008 |
1793 |
1889 |
|
1920 |
1882 |
|
|
|
|
|
|
2009 |
1723 |
1809 |
|
1838 |
1821 |
|
|
|
|
|
|
Таблица 3.5.2.3
Индекс потребительских цен в России (в %)
год |
|
|
кварталы |
|
|
|
|
|
|
|
|
I |
II |
|
III |
IV |
|
|
|
||||
|
|
|
|
|
|
2000 |
104,1 |
105,3 |
|
104,1 |
105,4 |
|
|
|
|
|
|
2001 |
107,1 |
105,3 |
|
101,1 |
104,1 |
|
|
|
|
|
|
2002 |
105,4 |
103,4 |
|
101,2 |
104,3 |
|
|
|
|
|
|
2003 |
105,2 |
102,6 |
|
100,6 |
103,1 |
|
|
|
|
|
|
2004 |
103,5 |
102,5 |
|
101,8 |
103,4 |
|
|
|
|
|
|
2005 |
105,3 |
102,6 |
|
100,6 |
102,1 |
|
|
|
|
|
|
2006 |
105,0 |
101,1 |
|
101,0 |
101,7 |
|
|
|
|
|
|
2007 |
103,4 |
102,2 |
|
101,8 |
104,1 |
|
|
|
|
|
|
2008 |
104,8 |
103,8 |
|
101,7 |
102,5 |
|
|
|
|
|
|
2009 |
105,4 |
101,9 |
|
100,6 |
100,7 |
|
|
|
|
|
|
59
Глава 4. Корреляционный и регрессионный анализ временных рядов с учетом их структуры
Оценка тесноты связи и аналитическое описание взаимосвязей количественных экономических показателей, представленных в виде временных рядов, желательно проводить с учетом их структуры.
4.1.Примеры корреляционного и регрессионного анализа временных рядов макроэкономических показателей РФ
Рассмотрим данные Федеральной службы государственной статистики
Российской Федерации за 2000 – 2008 гг., представленные в табл. 4.2, в
процентах к предыдущему кварталу, по макроэкономическим показателям: IRSN – оборот общественного питания (y ),
IPC F – индекс потребительских цен на продукты питания (x1), IRR – денежные доходы в среднем на душу населения (x2 ).
Оценим тесноту связи данных показателей, с помощью линейных коэффициентов парной корреляции и частных коэффициентов корреляции. Определим структуру временных рядов показателей и оценим ее влияние на тесноту связи данных показателей. Используем результаты корреляционного анализа, для моделирования оборота общественного питания в РФ и прогноза данного показателя на 2009-2010гг.
Расчеты выполним с использованием надстройки «Анализ Данных» MS EXCEL. Вначале выполним корреляционный анализ данной группы макроэкономических показателей. Результаты расчета линейных коэффициентов парной корреляции приведены в табл. 4.1.1.
|
|
|
Таблица 4.1.1 |
|
|
Корреляционный анализ |
|
||
коэффициенты |
IRSN (y ) |
IPC F (x1) |
I RR (x2 ) |
|
корреляции |
||||
|
|
|
||
|
|
|
|
|
IRSN (y ) |
1 |
|
|
|
|
|
|
|
|
IPC F (x1) |
-0,246 |
1 |
|
|
I RR (x2 ) |
0,934 |
-0,0352 |
1 |
Согласно приведенной табл. 4.1.1, можно сделать следующие выводы:
наблюдалась сильная прямая связь между оборотом общественного питания и денежными доходами в среднем на душу населения;
имелась слабая обратная связь между оборотом общественного питания и потребительскими ценами на продукты питания;
практически отсутствовала связь между потребительскими ценами на продукты питания и денежными доходами в среднем на душу населения.
60