- •А.С. Березина анализ данных
- •Предисловие
- •Лекция 1. Априорный анализ компонент временного ряда
- •1.1. Понятие временного ряда. Виды временных рядов
- •Производство молока в Кемеровской области
- •Численность работников здравоохранения, перед которыми организация имеет просроченную задолженность по заработной плате работников в Российской Федерации в 2013 году
- •Индекс потребительских цен в Кемеровской области (декабрь к декабрю предыдущего года; в процентах)
- •Потребление сахара (кг) на душу населения в Кемеровской области
- •1.2. Методы оценки однородности исходных данных
- •1.3. Методика выявления и анализа аномальных наблюдений
- •Краткосрочные экономические показатели рф
- •Расчётная таблица примера 1.1.
- •1.4. Абсолютные, относительные и средние показатели в анализе временных рядов
- •ЛЕкция 2. Моделирование тенденции
- •2.1. Проверка гипотезы о существовании тренда
- •Промежуточные расчетные значения кумулятивного т-критерия
- •2.2. Методы выявления тенденции
- •Численность населения на одного врача в Кемеровской области
- •Расчетная таблица метода Фостера-Стюарта
- •2.3. Выбор формы тренда
- •Критерии выбора класса, выравнивающих кривых
- •Лекция 3. Моделирование периодической компоненты
- •3.1. Аддитивные и мультипликативные тренд-сезонные модели Алгоритм построения модели временного ряда, содержащего сезонные колебания:
- •Поквартальные данные по розничному товарообороту компании
- •Расчет коэффициента автокорреляции
- •Коррелограмма временного ряда товарооборота
- •Расчет оценок сезонной компоненты в аддитивной модели
- •Расчет значений сезонной компоненты в аддитивной модели
- •Расчет значений t и ошибок e в аддитивной модели.
- •Расчет оценок сезонной компоненты в мультипликативной модели
- •Расчет значений сезонной компоненты в мультипликативной модели
- •Расчет значений t и ошибок e в мультипликативной модели
- •Лекция 4. Простейшие методы прогнозирования
- •4.1. Метод среднего уровня ряда
- •4.2. Метод среднего абсолютного прироста
- •Расчетная таблица для определения прогнозных значений методом среднего абсолютного прироста
- •4.3. Метод среднего темпа роста
- •4.4. Оценка точности и надежности прогнозов
- •Лекция 5. Методы выбора трендовой модели прогноза
- •5.1. Прогнозирование на основе кривых роста
- •5.2. Прогнозирование на основе экстраполяции тренда
- •Лекция 6. Адаптивные модели прогнозирования
- •6.1. Сущность адаптивных методов
- •6.2. Экспоненциальное сглаживание
- •Индекс потребительских цен Кемеровской области
- •Экспоненциальные средние
- •6.3. Метод гармонических весов
- •Параметры уравнений отдельных фаз движения текущего тренда
- •Лекция 7. Прогнозирование динамических рядов, не имеющих тенденции.
- •Распределение знаков отклонений
- •Расчетная таблица для определения знаков отклонений
- •Распределение знаков отклонений
- •8. Метод экспертных оценок
- •8.1. Методы и модели экспертных оценок
- •Матрица опроса
- •Матрица преобразованных рангов
- •Оценки вкусовых качеств продукта
- •Оценки вкусовых качеств продукта
- •Матрица преобразованных рангов
- •8.2. Методы и модели выбора альтернатив
- •Частные критерии трех операторов
- •Нормализованные критерии
- •Лекция 9. Статистические методы обработки результатов экспертизы
- •9.1. Оценка согласованности мнений экспертов
- •9.2. Обобщение мнений экспертов
- •Список литературы
- •Содержание
- •Анализ данных
- •650992, Г. Кемерово, пр. Кузнецкий, 39
Коррелограмма временного ряда товарооборота
Лаг |
Коэффициент автокорреляции уровней |
Коррелограмма |
1 |
0,382 |
**** |
2 |
0,206 |
** |
3 |
0,179 |
** |
4 |
0,919 |
********* |
5 |
0,330 |
*** |
6 |
0,540 |
***** |
7 |
0,253 |
*** |
8 |
0,855 |
********* |
4. Построимаддитивную модельвременного рядаY=T+S+E.
Шаг 1.Анализируя коррелограмму и график временного ряда, мы определили, что ряд содержит сезонную компоненту.
Шаг 2.Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
а) просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условный годовой товарооборот компании (таблица 6.4 столбец 3);
Например: 52+66+50+30 = 198; 66+50+30+62 = 208 и т. д.
б) разделив полученные суммы на 4, найдем скользящие средние (таблица 3.4 столбец 4). Полученные таким образом выровненные значения уже не содержат сезонной компоненты;
в) Найдем центрированные скользящие средние. Для этого: последовательно суммируем скользящие средние по две и делим каждую сумму на два (таблица 3.4 столбец 5);
Например: ;и т. д.
Шаг 3.Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда (таблица 3.4 столбец 2) и центрированными скользящими средними (таблица 3.4 столбец 5). Данные расчетов запишем в столбец 6 таблицы 3.4.
Построим новую таблицу 3.5. Последовательно занесем полученные в столбце 6 таблицы 3.4 оценки сезонной компоненты в строки таблицы 3.5. Просуммируем по каждому кварталу и найдем средние за каждый квартал оценки сезонной компоненты – .
Таблица 3.4
Расчет оценок сезонной компоненты в аддитивной модели
№ квартала, t |
Товарооборот % к предыдущему периоду, yt |
Итого за четыре квартала |
Скользящая средняя за четыре квартала |
Центрированная скользящая средняя |
Оценка сезонной компоненты |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
52 |
|
|
|
|
2 |
66 |
198 |
49,50 |
|
|
3 |
50 |
208 |
52,00 |
50,750 |
-0,750 |
4 |
30 |
217 |
54,25 |
53,125 |
-23,125 |
5 |
62 |
235 |
58,75 |
56,500 |
5,500 |
6 |
75 |
253 |
63,25 |
61,000 |
14,000 |
7 |
68 |
263 |
65,75 |
64,500 |
3,500 |
8 |
48 |
284 |
71,00 |
68,375 |
-20,375 |
9 |
72 |
299 |
74,75 |
72,875 |
-0,875 |
10 |
96 |
309 |
77,25 |
76,000 |
20,000 |
11 |
83 |
309 |
77,25 |
77,250 |
5,750 |
12 |
58 |
307 |
76,75 |
77,000 |
-19,000 |
13 |
72 |
314 |
78,50 |
77,625 |
-5,625 |
14 |
94 |
320 |
80,00 |
79,250 |
14,750 |
15 |
90 |
|
|
|
|
16 |
64 |
|
|
|
|
Таблица3.5
Расчет значений сезонной компоненты в аддитивной модели
Показатели |
Год |
№ квартала, i | |||
|
|
I |
II |
III |
IV |
|
1 |
- |
- |
-0,750 |
-23,125 |
|
2 |
5,500 |
14,000 |
3,500 |
-20,375 |
|
3 |
-0,875 |
20,000 |
5,750 |
-19,000 |
|
4 |
-5,625 |
14,750 |
- |
- |
Итого |
|
-1,000 |
48,750 |
8,500 |
-62,500 |
|
-0,333 |
16,250 |
2,833 |
-20,833 | |
Si |
|
0,188 |
16,771 |
3,354 |
-20,313 |
Сезонные воздействия за период (в нашем случае – год) должны взаимопогашаться. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю. Однако это не всегда выполняется, например, для нашей модели имеем: -0,333 + 16,250 + 2,833 – 20,833 = -2,083
Поэтому рассчитаем корректирующий коэффициент k:
k= -2,083/4 = -0,521.
И определим скорректированные значения сезонной компоненты как разность между ее средней оценкой и корректирующим коэффициентом k:, гдеi =1,2,3,4.
Теперь сумма значений сезонной компоненты равна нулю, т.е. сезонные воздействия взаимопогашаютя:
0,188 + 16,771 + 3,354 – 20,313 = 0.
Таким образом, получены следующие значения сезонной компоненты:
I квартал:S1= 0,188;II квартал:S2= 16,771;
III квартал:S3= 3,354;IV квартал:S4= -20,313.
Занесем полученные данные в 3 столбец таблицы 3.6.
Шаг 4Устраним влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного ряда. Получим величиныT+E=Y–S(таблица 3.6 столбец 4). Теперь исходный ряд содержит только тренд и случайную компоненту.
Шаг 5Определим трендовую компонентуTданной модели. Параметры уравнения линейного трендаT=a + b·tможно легко найти, воспользовавшись функциейЛИНЕЙН (приложение). В качестве аргументов функции следует взять:
Известные_значения_y – диапазон, содержащий выровненныеданные T+E(таблица 3.6 столбец 4);
Известные_значения_x – диапазон, содержащий данные t (таблица 3.6 столбец 1).
Линейный тренд для данной модели будет следующим:
T= 46,267 + 2,498·t.
Подставляя в это уравнение значения t= 1,…, 16, найдем уровниTдля каждого момента времени, т. е. найдем теоретические значения уровней ряда (таблица 3.6 столбец 5).
Таблица 3.6