Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Назаметдинов Анализ данных 2012

.pdf
Скачиваний:
10
Добавлен:
12.11.2022
Размер:
5.66 Mб
Скачать

Две последние модели задают кривые тренда S-образной формы, представляя процессы с нарастающим темпом роста в начальной стадии с постепенным замедлением в конце.

При подборе подходящей функциональной зависимости, иначе спецификации тренда, весьма полезным является графическое представление временного ряда.

Отметим также, что тренд, отражая действие долговременных факторов, является определяющим при построении долговременных прогнозов.

7.3.2. Модели сезонной компоненты

Сезонный эффект во временном ряде проявляется на «фоне» тренда и его выделение оказывается возможным после предварительной оценки тренда. (Здесь не рассматриваются методы спектрального анализа, позволяющего выделить вклад сезонной компоненты в спектр без вычисления других компонент ряда.) Действительно, линейно растущий ряд помесячных данных будет иметь схожие эффекты в одноименных точках – наименьшее значение в январе и наибольшее в декабре; однако вряд ли здесь уместно говорить о сезонном эффекте: исключив линейный тренд, мы получим ряд, в котором сезонность полностью отсутствует. В то же время ряд, описывающий помесячные объемы продаж новогодних открыток, хотя и будет иметь такую же особенность (минимум продаж в январе и максимум в декабре) будет носить скорее всего колебательный характер относительно тренда, что позволяет специфицировать эти колебания как сезонный эффект.

В простейшем случае сезонный эффект может проявляться в виде строго периодической зависимости:

st = st+τ, для любого t, где – период сезонности.

В общем случае, значения, отстоящие на , могут быть связаны функциональной зависимостью, т.е.

st f (st ,t) .

К примеру, сезонный эффект сам может содержать трендовую составляющую, отражающую изменение амплитуды колебаний.

141

Если сезонный эффект входит в ряд

аддитивно, т.е.

yt gt st ut , модель сезонного эффекта можно записать как

st c1z1,t c2 z2,t ... c z ,t

,

где z1,t, z2,t,…,zτ,t – булевы, иначе индикаторные, переменные, по одной на каждый такт внутри периода сезонности. Так, для ряда месячных данных z1,t = 0 для всех t, кроме января каждого года, для которого z1,t=1, и так далее. Коэффициент c1 при z1,t показывает отклонение январских значений от тренда, c2 – отклонение февральских значений и так далее. Чтобы снять неоднозначность в значениях коэффициентов сезонности ci ,i 1,2,..., , вводят дополни-

тельное ограничение, так называемое условие репараметризации,

обычно ci 0 .

i1

Втом случае, когда сезонный эффект носит мультипликативный

характер, т.е.

yt gt st ut ,

модель ряда с использованием индикаторных переменных можно записать в виде

yt gt (c1z1,t c2 z2,t ... c z ,t ) ut .

Коэффициенты ci, i=1,2,…, в этой модели принято называть сезонными индексами.

Для полностью мультипликативного ряда yt gt stut обычно проводят процедуру линеаризации операцией логарифмирования

ln yt ln gt ln st ln ut .

Условимся называть представленные модели сезонного эффекта «индикаторными». Если сезонный эффект достаточно «гладкий» – близок к гармонике, используют «гармоническое» представление

st d sin(ωt α) ,

где d – амплитуда, – угловая частота (в радианах в единицу вре-

мени), – фаза волны. Поскольку фаза обычно заранее неизвестна, последнее выражение записывают как

st Asin ωt Bcosωt ,

142

где A=d cosα , A=d sinα.

Параметры А и В можно оценить с помощью обычной регрессии. Угловая частота считается известной. Если качество подгонки окажется неудовлетворительным, наряду с гармоникой основной волны в модель включают дополнительно первую гармонику (с удвоенной основной частотой 2 ), при необходимости и вторую и так далее гармоники. В принципе, из двух представлений: индикаторного и гармоничного – следует выбирать то, которое потребует меньшего числа параметров.

7.4. Методы выделения тренда

Приведенные в п. 7.3.1 спецификации тренда являются параметрическими функциями времени. Оценивание параметров может быть проведено по методу наименьших квадратов так же, как в регрессионном анализе. Хотя статистические предпосылки регрессионного анализа во временных рядах часто не выполняются (особенно это касается предпосылки 5 – некоррелированность возмущений), тем не менее оценки тренда оказываются приемлемыми, если модель специфицирована правильно и среди наблюдений нет больших выбросов. Нарушение предпосылок регрессионного анализа сказывается не столько на оценках коэффициентов, сколько на их статистических свойствах, в частности, искажаются оценки дисперсии случайной составляющей и доверительные интервалы для коэффициентов модели.

В условиях коррелированности возмущений предпочтительным является обобщенный МНК, однако его применение требует дополнительной информации о поведении случайного компонента.

Главная проблема при выделении тренда состоит в том, что подобрать единую спецификацию для всего временного часто невозможно, поскольку меняются условия протекания процесса. Учет этой изменчивости особенно важен, если тренд вычисляется для целей прогнозирования. Здесь сказывается особенность именно временных рядов: данные, относящиеся к «далекому прошлому», будут неактуальными, бесполезными или даже «вредными» для оценивания параметров модели текущего периода. Вот почему при

143

анализе временных рядов широко используются процедуры взвешивания данных.

Для учета изменчивости условий модель ряда часто наделяют свойством адаптивности, по крайней мере, на уровне оценок параметров. Адаптивность понимается в том смысле, что оценки параметров легко пересчитываются по мере поступления новых наблюдений. Конечно, и обычному методу наименьших квадратов можно придать черты адаптивности, пересчитывая оценки каждый раз, вовлекая в процесс вычислений старые данные плюс свежие наблюдения. Однако при этом каждый новый пересчет ведет к изменению прошлых оценок, тогда как адаптивные алгоритмы свободны от этого недостатка.

7.4.1. Скользящие средние

Метод скользящих средних – один из самых старых и широко известных способов выделения детерминированной составляющей временного ряда. Суть метода состоит в усреднении исходного ряда на интервале времени, длина которого выбрана заранее. При этом сам выбранный интервал скользит вдоль ряда, сдвигаясь каждый раз на один такт вправо (отсюда название метода). За счет усреднения удается существенно уменьшить дисперсию случайной составляющей.

Ряд новых значений становится более гладким, вот почему подобную процедуру называют сглаживанием временного ряда.

Процедуру сглаживания рассмотрим вначале для ряда, содержащего лишь трендовую составляющую, на которую аддитивно наложена случайная компонента.

Как известно, гладкая функция может быть локально представлена в виде полинома с довольно высокой степенью точности. Отложим от начала временного ряда интервал времени длиной (2m+1) точек, построим полином степени m для отобранных значений и используем этот полином для определения значения тренда в (m+1)-й, средней, точке интервала.

Построим для определенности полином 3-го порядка для интервала из семи наблюдений. Для удобства дальнейших преобразований занумеруем моменты времени внутри выбранного интервала

144

так, чтобы его середина имела нулевое значение, т.е. t = -3, -2, -1, 0, 1, 2, 3. Запишем искомый полином:

yt a0 a1t a2t2 a3t3 .

Для оценки a0 ,...,a3 воспользуемся методом наименьших квадратов:

3

~

 

 

 

 

 

 

 

SR

a1t a2t

2

a3t

3

)

2

min .

( yt a0

 

 

 

t 3

Находим производные SR по коэффициентам a :

SR

2

3

~

a1t a2t

 

a3t

 

 

 

0, i 0,1,2,3 .

 

2

3

)t

i

ai

( yt a0

 

 

 

 

t 3

 

 

 

 

 

 

 

 

Поскольку суммы нечетных порядков t от -3 до +3 равны 0, уравнения сводятся к виду:

 

 

 

 

~

 

 

7a0

28a2 ;

 

 

 

 

 

 

yt

 

 

 

 

 

 

 

 

~

 

 

 

 

 

28a1

 

 

 

196a3 ;

 

 

 

 

 

tyt

 

 

 

 

 

 

 

 

 

 

t

2

~

28a0

196a2 ;

 

 

 

 

 

 

yt

 

 

 

 

 

t

3

~

 

196a1

 

 

1588a3 .

 

 

 

 

 

 

 

yt

 

 

 

Используя первое и третье из уравнений, получаем при t=0:

 

 

 

 

 

 

 

 

1

 

 

3 ~

3

2

 

 

 

 

 

 

 

a0

 

 

 

(7

yt t

 

yt )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

21

t 3

t 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

~

~

 

 

 

 

~

~

~

 

~

2 y3 ) .

(7.1)

 

 

 

( 2 y 3

3y 2

6 y 1

7 y0

6 y1

3y2

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, значение тренда в точке t=0 равно средневзвешенному значению семи точек с данной точкой в качестве цен-

тральной и весами 211 ( 2,3,6,7,6,3, 2) .

Для того чтобы вычислить значение тренда в следующей, (m+2)-й точке исходного ряда (в нашем случае – пятой), следует воспользоваться формулой (7.1), где значения наблюдений берутся из интервала, сдвинутого на такт вправо, и так далее до точки N-m.

145

Можно вывести формулы для построения трендов на четном числе точек, однако при этом были бы получены значения трендов в серединах временных тактов. Значение тренда в точках наблюдений можно определить в этом случая как среднее двух соседних значений тренда.

Следует отметить, что при четном числе 2m тактов в интервале усреднения (двадцать четыре часа в сутки, четыре недели в месяце, двенадцать месяцев в году), широко практикуется простое усреднение. Пусть имеются, например, наблюдения на последний день каждого месяца с января по декабрь. Простое усреднение 12 точек с весами 1/12 дает значение тренда в середине июля. Чтобы получить значение тренда на конец июля, надо взять среднее значение тренда в середине июля и середине августа. Легко видеть, что это эквивалентно усреднению 13-месячных данных, но значения на краях интервала берут с весами 1/2. Итак, если интервал сглаживания содержит четное число 2m точек, в усреднении задействуют не 2m, а 2m+1 значений ряда:

ˆ

 

 

1 1

~

~

~

 

1

~

 

y

 

 

 

 

y

y

... y

 

 

y

.

 

 

 

 

t

 

2m 2

t m

t m 1

t m 1

 

2

t m

Скользящие средние, сглаживая исходный ряд, оставляют в нем трендовую и циклическую составляющие. Выбор величины интервала сглаживания должен делаться из содержательных соображений. Если ряд содержит сезонный компонент, то величина интервала сглаживания выбирается равной или кратной периоду сезонности. В отсутствие сезонности интервал сглаживания подбирается эмпирически по результам визуального анализа сглаженной кривой и составляет обычно в диапазоне три–девять.

Эффект Слуцкого−Юла

Рассмотрим, как влияет сглаживание на случайную составляющую ряда, относительно которой будем полагать, что она центрирована и соседние члены ряда некоррелированы.

 

m

ˆ

at j xt j .

Скользящее среднее случайного ряда x есть xt

 

j m

146

Найдем математическое ожидание и дисперсию скользящего среднего, а также ковариацию членов ряда, отстоящих на k тактов.

В силу центрированности x и отсутствия корреляций между членами исходного ряда имеем:

 

 

 

 

Dxt σ

 

m

 

ˆ

 

 

2

2

 

Mxt 0,

 

at j .

 

 

 

 

 

 

j m

Далее,

 

 

 

 

 

 

ˆ ˆ

ˆ ˆ

] σ

2

(a1a1 k a2a2 k ... a2m k 1a2m 1) .

cov (xt xt k ) M[xt xt k

 

Из полученных соотношений видно, что усреднение приводит к уменьшению дисперсии колебаний: Dxt σ2 , поскольку

m

at2 j 1. Кроме того, члены ряда, полученные в результате

j m

усреднения, не являются теперь независимыми. Производный, сглаженный, ряд имеет ненулевые автокорреляции (корреляции между членами ряда, разделенных k-1 наблюдениями) вплоть до порядка 2m. Таким образом, производный ряд будет более гладким, чем исходный случайный ряд, и в нем могут проявляться систематические колебания. Этот эффект называется эффектом Слуцкого−Юла.

7.4.2. Определение порядка полинома методом последовательных разностей

Если имеется ряд, содержащий полином (или локально представляемый полиномом) с наложенным на него случайным элементом, то исключить полиномиальную часть можно вычислением последовательных разностей ряда. Действительно, разности полинома порядка k представляют собой полином порядка k-1. Далее, если ряд содержит полином порядка p, то переход к разностям, повторенный (p+1) раз, исключает его и оставляет элементы, связанные со случайной компонентой исходного ряда.

Взятие разностей преобразует случайную компоненту xt ряда:

xt xt 1 xt ;

147

2 xt xt 1 xt xt 2 xt 1 xt 1 xt xt 2 2xt 1 xt ;

r xt xt r Cr1xt r 1 Cr2 xt r 2 ... ( 1)r xt .

M[ r xt ] 0 ;

D[ r xt ] σ2[1 (Cr1 )2 (Cr2 )2 ... 1] C2rr σ2 .

Из последнего соотношения получаем

σ2 D[ r xt ]C2rr .

Следовательно, метод последовательных разностей переменной состоит в вычислении первых, вторых, третьих и т.д. разностей, подсчете суммы квадратов, делении на соответствующее число со-

четаний C21 , C42 , C63 и т.д. и обнаружения момента, когда это отно-

шение становится постоянным. Таким образом, мы получаем оценки порядка полинома и дисперсии случайной компоненты.

7.4.3. Методы экспоненциального сглаживания

Методы построения функций для описания наблюдений до сих пор основывались на критерии наименьших квадратов, в соответствии с которым все наблюдения имеют равный вес. Однако можно предположить, что в задачах прогнозирования недавним точкам следует придавать больший вес, а наблюдения, относящиеся к далекому прошлому, должны иметь по сравнению с ними меньшую ценность.

Рассмотрим ряд весов, пропорциональных множителю (<1), а именно 1,β,β2 3 ,... . Сумма весов должна равняться единице (в противном случае сглаживание ряда, состоящего из констант, не

будет

давать

ту

же константу). Бесконечный ряд весов

дает

 

 

 

 

 

 

 

 

 

β j

 

 

1

 

,

так

что весами будут (1 β),(1 β)β,(1 β)β2

и т.д.

 

 

 

j 0

1

β

 

 

 

 

 

 

 

 

 

 

 

(предполагается, что 0< < 1).

148

Простое экспоненциальное сглаживание

Рассмотрим простейший ряд yt , равный сумме постоянной а (уровень) и случайной компоненты xt :

yt a xt .

(7.2)

Относительно возмущений полагаем, что они центрированы и не-

 

 

2

приk 0;

 

 

коррелированы, т.е. Mxt = 0 и cov(xt , xt k )

 

 

приk 0.

 

0

 

Будем считать, что ряд имеет бесконечную предысторию, т. е. время принимает значения t,t-1,t-2,...,- . Найдем оценку а, воспользовавшись минимизацией взвешенной суммы квадратов:

 

 

 

 

 

~

 

ˆ

2

β

i

.

 

 

 

 

 

 

 

SR ( yt i

a)

 

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

 

 

 

Взяв производную по aˆ , проведем преобразования:

 

 

 

SR

 

~

ˆ

i

0;

ˆ

 

 

 

β

i

~

i

;

 

ˆ

 

 

 

 

 

 

 

 

 

2 ( yt i a

 

a

 

yt iβ

 

 

a

i 0

 

 

 

 

 

 

i 0

 

 

i 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

~

 

 

i

.

 

 

 

 

 

 

 

 

 

a (1 β) yt iβ

 

 

 

 

 

 

 

 

 

 

 

 

i =0

 

 

 

 

 

 

 

 

 

 

 

Полученную оценку а на момент t обозначим aˆt . Сглаженное

значение aˆt можно

выразить

через

сглаженное значение aˆt 1 в

 

 

 

 

 

 

 

~

 

 

 

прошлый момент t-1 и новое наблюдение yt :

 

 

 

ˆ

~

 

i

 

 

~

~

~

2

...)

at (1 β) yt iβ

 

(1 β)(yt

yt 1β yt 2β

 

~

i 0

~

~

 

 

~

 

 

β(1

 

 

 

ˆ

(1 β) yt

β)(yt 1

yt 2β ...)

(1 β) yt

βat 1.

Полученное соотношение

 

 

~

 

 

 

 

 

ˆ

 

 

ˆ

 

 

 

 

 

 

at

βat 1

(1 β) yt

 

 

 

перепишем несколько иначе, введя так называемую постоянную сглаживания α=1-β (0 1):

ˆ

ˆ

~

ˆ

~

ˆ

(7.3)

at (1

α)at 1

αyt at 1

α( yt at 1) .

149

Из полученного соотношения видно, что новое сглаженное значение получается из предыдущего коррекцией последнего на долю ошибки, рассогласования, между новым и прошлым сглаженным (оно же, в соответствии с моделью ряда, и прогнозное) значениями ряда. Происходит своего рода адаптация уровня ряда к новым данным.

Для того чтобы удостовериться в «эффекте сглаживания», найдем дисперсию aˆ . С учетом модели ряда (7.2) имеем:

ˆ

 

~

i

 

at (1

β) yt iβ

 

(1 β) (a

 

i 0

 

 

i 0

(1 β)a βi (1 β) xt iβi a (1

i 0

i 0

xt i i

β) xt iβi .

i0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

ˆ

a (1 β) xt

iβ

i

.

 

 

 

 

 

 

 

Отсюда Mat a

и at

 

 

 

 

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

 

Полученные соотношения приводят к

 

 

 

 

 

 

 

 

 

 

 

 

 

] M[(1 β)

 

 

 

 

]

ˆ

ˆ

 

2

2

 

i

)

2

Dat M[(at a0 )

 

 

( xt iβ

 

 

 

 

 

 

 

 

 

 

i 0

 

 

 

 

 

 

 

 

 

 

(1 β)

2

 

 

 

(1 β)

 

 

 

 

 

 

(1 β)2 M[xt2 i 2i σ2

 

σ2

 

σ2

α

.

2

 

1 β

 

i 0

 

 

 

 

1 β

 

 

 

 

 

 

 

2 α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку α ≤ 1, дисперсия сглаженных значений оказывается меньше дисперсии σ2 исходного ряда. Чем меньше α, тем меньше дисперсия экспоненциальной средней. Вот почему экспоненциальное сглаживание часто интерпретируют как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются сглаженные значения. С уменьшением α степень фильтрации увеличивается, так как флуктуации ряда все более подавляются.

Для того чтобы воспользоваться рабочей формулой (7.3) в начальный момент t=1, необходимо знать aˆ0 . Обычно в качестве

aˆ0 берут среднее арифметическое всех имеющихся точек либо нескольких от начала ряда.

150