книги / Статистический анализ временных рядов
..pdf3.3. СГЛАЖИВАНИЕ 73
Если долговременный тренд h (t) меняется медленно, то (43) близко
к h (f), |
В частном случае, когда функция h (t) линейна, (43) в |
точ |
||
ности равно h (t). |
|
соот |
||
При Т |
= hti функцию g (t) можно определить однозначно |
|||
ношением |
|
|
|
|
(44) |
g (0 |
= 4-2 f(t + |
n D — 4-2 f(s), t = l, |
|
|
|
п i= 0 |
' s=l |
|
Сезонный эффект декабря равен, например, разности между сред ним по всем декабрям и средним по всем данным. Оценкой функции g (0 служит в этом случае
(45) |
4 - 2 yt+nj— 4 |
- 2 ys> |
< = i, . . . . я. |
|
|
п /=О |
1 |
S=I |
, |
Эта оценка является несмещенной и имеет дисперсию
,46)
Альтернативный метод оценивания состоит в использовании отклонений от сглаженных значений. Если п = 2т , то соответствуй ющие оценки для g (t) следующие:
1 |
h~X |
^ = 1, ••• у |
ffl9 |
|
h_1 |
2 |
(yt+nj y^rifh |
||
(47) |
h—2 |
|
|
|
|
|
|
||
-j-ZTT 2 |
(#+«/ — tft+J* |
t = m + l, |
. . . , 2m. |
|
|
/“ 0 |
|
|
Ввиду того что в сглаживаемых рядах отсутствуют m первых и m
последних членов, средние (47) должны |
основываться |
на Л — 1 |
|||||||
отклонениях. В более подробной записи они имеют вид |
|
|
|||||||
|
h—1 |
j |
/ Т - m |
- l + t |
, |
j |
|
\ |
|
|
2 yt+nf — 9— I |
2 |
ys + |
~2 ~У‘+т"Ь~о~Ут—т+*) > |
|||||
|
/=1 |
гт |
\s = < -fm + l |
i |
1 |
|
J |
||
(48) |
|
|
/Т—3m |
|
|
t = |
1, |
, m, |
|
1 |
ft-2 |
j |
l+< |
j |
j |
|
\ |
||
$ > У*+Я,~~~%Г { 4=S+. У* + |
|
yt~m+ Т |
|
|
|||||
h— 1 |
T |
Ут~3m+ t j[ |
|||||||
Дисперсия |
оценки |
(48) равна |
|
|
|
t = m-\- 1, . . . , |
2m. |
||
|
|
|
|
|
|
||||
^ |
|
[ T — n |
2 ( Г — n ) 2 ] |
|
|
|
|
Может показаться, что оценка (48) несколько предпочтительнее, так как применение скользящего среднего является более гиб
74 |
ТРЕНДЫ И СГЛАЖИВАНИЕ |
Гл. 3. |
ким подходом, чем точное описание тренда. Однако разница между (48) и (45) заключается только в использовании крайних членов, именно в отбрасывании (2т — 1) крайних членов и использовании половинных значений двух других крайних членов. Легко прове рить, что (49) больше чем (46). [См. Дурбин (1963).]
При рассмотрении многих экономических временных рядов ста тистики полагают, что составляющие ряд воздействия перемножа ются. Иными словами, они предполагают, что ряд имеет вид
(50) |
Y(t) = G(t)H(t)U(t), |
где Н (t) — тренд, |
G (t) — сезонный фактор, U (/) — случайный |
фактор, причем все сомножители положительны. Применяемое в этом случае так называемое «отношение к скользящему среднему» (ratio-to-moving average) заключается в последовательном образо вании ряда скользящих средних (42) и использовании отношений У (t + nj)/Y*(t + nj) вместо разностей из (47). Для получения оцен ки сезонного фактора, соответствующей суммам (47), производится усреднение образованных отношений при каждом значении t (или находится медиана этих отношений). Если произведение 2т сред них (или медиан) указанных отношений не равно 1, как это обычно и бывает (в то время как сумма оценок (48) должна была бы всегда равняться нулю, если бы не влияние крайних членов), то каждое отношение умножается на одно и то же число, так чтобы результи рующее произведение равнялось 1. Альтернатива к этой процедуре состоит в использовании логарифмов. При этом
/51) |
yt = log Y (t), |
g (0 = |
log G (t), |
|
ht = log H(t), |
ut = |
log U (/). |
Если полученные ряды и их компоненты удовлетворяют сделанным ранее предположениям, то для оценивания функции g (t) =
— log G (t) можно использовать (45) или (48). Этот метод представ ляется более предпочтительным. Дело в том, что метод отношений к скользящему среднему не имеет строгого математического обо снования. Более того, чувствуется, что он не является безукоризнен ным в этом отношении, поскольку использует аддитивные методы при мультипликативных факторах (это проявляется в необходи мости видоизменять оценки, принудительным образом домножая их произведение до 1).
Мы определили сезонное изменение g (t) в (44) чисто формальным образом. Экономист обычно представляет себе сезонное изменение как проявление определенного поведения, обусловленного тем или иным временем года, а тренд — как долговременную тенденцию,
Мы понимаем здесь под «трендом» всякое систематическое изменение ож и даемого значения, не связанное с сезонными изменениями. Экономисты часто понимают «тренд» ка к долговременное изменение, противопоставляя егр «цикли ческим изменениям», коротким по времени.
3; 3. СГЛАЖИВАНИЕ 75
обусловленную более устойчивыми воздействиями. При этом f (t)
является суммой сезонного воздействия g(t) и долговременного |
|||
тренда h (it), |
причем (по крайней мере субъективно) g(t) и h (t) |
оп |
|
ределяются |
независимо. При таком подходе функция g(t) |
может |
|
и не быть строго периодической, медленно меняя со временем |
свой |
||
вид. Можно предположить, например, что |
|
|
|
(52) |
g(t + nj) |
|
|
где g** (j) — медленно меняющаяся функция. Мы, однако, |
не бу |
дем развивать далее это направление. Метод анализа сезонных изме нений, основанный на подобной модели, предложен Вальдом (1936). Изменяющиеся сезонные колебания рассматривались затем Хеннаном (1964), Боксом и Дженкинсом (1970).
Статистики иногда рассматривают экономический временной ряд как ряд, складывающийся из долговременного тренда, цикли ческого изменения, сезонного воздействия и нерегулярной состав ляющей. Тренд является долговременной тенденцией изменения, обусловленной ростом популяции, технологическими изменениями и другими достаточно долговременными воздействиями. Циклическое же изменение связано с колебаниями, известными под названием цикла деловой активности. С этой точки зрения циклическое из менение не обязательно периодично, как это имело место у сезонного изменения в (38). Тем не менее иногда предполагают, что скользя щее среднее устраняет влияние циклического изменения при оце нивании тренда. Вопрос об эффективности этой процедуры мы рас смотрим позднее.
Сглаживающие формулы могут быть основаны не только на по линомах, но и на других выравнивающих функциях. Кроме того, эти функции не обязательно должны подбираться с использованием равных весов. Значения в точках s = 0, ± 1, .... ±т могут быть обработаны так, как если бы они имели возрастающую дисперсию.
Задачу получения сглаженных значений на концах рядов можно решать различными способами. Значения в начале ряда могут не играть особой роли. Значения же непосредственно в конце ряда обычно наиболее существенны. Если сглаживающая формула осно вывается на подборе полинома степени q по 2т + 1 точкам, то по лином, подобранный по значениям Ут-Чт, УТ-Чт+1....... Ут, можно
использовать для |
получения значений у* сглаженного ряда и при |
|||
t — Т — m + 1, |
Т — пг + 2, |
..., |
Т, и при t = Т — ш. Эти сгла |
|
женные значения |
у] также |
являются линейными |
комбинациями |
|
значений ут-чт, .... Ут■ [Коуден |
(1962) приводит соответствующие |
|||
коэффициенты для <7 = 1, ..., |
5 |
и m = 1, ..., 12.1 |
Другой подход |
состоит в применении сглаживающих процедур, основывающихся на использовании в конце ряда меньших значений т и к . При таком подходе у'т — ут(поскольку и т, и k должны быть равны в этом
76 |
ТРЕНДЫ И СГЛАЖИВАНИЕ |
Гл. 3. |
случае нулю), что является не вполне удовлетворительным. Оба эти метода дают сглаженные значения, обладающие в конце ряда большей вариабельностью, чем в его середине.
3.4.МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ
3.4.1.Введение
Метод переменных разностей был предложен для оценивания дисперсии случайной составляющей при гладком характере тренда. При 'дальнейшем развитии метод стал применяться и для решения вопроса о степени гладкости тренда. Обе эти статистические задачи рассматриваются применительно к модели yt = / (t) + Щ, где ut некоррелированы, имеют нулевые средние и дисперсии а2, а функ ция f(f) является гладкой в том смысле, что ее можно хорошо приблизить в последовательных интервалах времени полиномом не большой степени.
Другое применение переменных разностей состоит в проверке отсутствия корреляции. Такие задачи рассматриваются в гл. 6 для иной вероятностной модели.
В настоящем параграфе будет развита некоторая общая тео рия, рассмотрены оценивание величины а2 и критерии для проверки гипотез о гладкости, а также будет выяснена связь указанного ме тода со сглаживанием. Некоторые из этих результатов использу ются в дальнейшем при изучении сериальной корреляции.
Впервые разности были использованы, по-видимому, Кейв- Браун-Кейвом (1904) и Хукером (1905) для изучения корреляции между двумя рядами. Метод был развит затем Стьюдентом (1914). О. Андерсон (1929) и Тинтнер (1940) интенсивно изучали его приме нительно к оцениванию дисперсии.
3.4.2. Вычисление последовательных разностей
Метод переменных разностей основан на вычислении последо вательных разностей элементов временного ряда. Установим си стему обозначений для таких вычислений и отметим некоторые их свойства. Пусть ^ — оператор, определяемый соотношением
(1)9ut = ut+u * = . . . , — 1, 0, 1..........
По любой заданной последовательности ..., ы_i, ы0, их, ... этот опе ратор строит новую последовательность, индексы в которой сдви нуты на единицу. Мы будем писать также Ф {«,} = {«<+i}.
Оператор такого рода есть функция, аргументами и значениями которой являются последовательности. Оператор О называется
3 .4 . |
МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ |
77 |
линейным, если для любой последовательности {щ} и для |
любого |
|
действительного числа с |
|
|
(2) |
0 {cut} = сб {щ} |
|
и, |
кроме того, для любой пары последовательностей {ut} и {vt} |
|
(3) |
0 {«, + »,} =£>{«,} + |
|
Очевидно, что ЧРявляется линейным оператором. Мы будем исполь зовать запись (1), понимая ее и как результат применения опера тора ЧР к целой последовательности, и как результат операции над отдельным элементом ut последовательности.
Определим ЧР° = 1 как тождественный оператор (4P9ut = щ), а
оператор ЧР1определим рекуррентно как |
ЧР(ЧР1-1), |
т. е. |
|||||
(4) |
|
ЧР1щ = |
4P(4Pl~xut), |
п = |
2, |
3.......... |
|
По индукции можно вывести, что |
|
|
|
|
|||
(5) |
|
|
ЧР U ( = |
U iA -n - |
|
|
|
Оператор сЧР задается |
соотношением |
|
|
|
|||
(6) |
|
|
(c4P)ut =c(4Pul). |
|
|
||
Определим далее сумму операторов соотношением |
|
||||||
(7) |
( с ^ + |
••• |
= |
|
|
••• |
+ c k4F*u, |
Как следует из (7), |
|
|
|
|
|
||
(8) |
(^ЧР1' + |
••• + |
ck4P"k) ut = |
|
+ |
• • • |
+ ckut+4. |
Таким образом, определен полином от ЧР(с действительными коэф фициентами). Операции над этими полиномами (умножение и т. д.) согласуются с операциями над полиномами от абстрактной пере менной. (Сумма бесконечного числа операторов есть предел левой части (8), если правая часть сходится в некотором смысле.)
В частности, представляет интерес полином А = ЧР— 1 (раз ность первого порядка), действующий следующим образом:
(9)Aut = (ЧР— 1) и( = ЧРщ— ut — ut+ 1 — ut.
Разность второго порядка есть
(10)А*щ = (ЧР— 1)*и( = (ЧР* — 2ЧР+1)щ,
или, что эквивалентно,
(И) |
Д(Дыг) — Аыж — Ащ = ut+2 — 2и(+) -J- иг |
78 |
|
ТРЕНДЫ И СГЛАЖИВАНИЕ |
Гл. 3. |
Разности более высоких порядков определяются как |
|
||
(12) |
дч = |
у щ = i ( - ir / Q ^ «/ = |
|
/=0 \//
Для удобства вычислений мы можем предпочесть определение
Агщ = A (Ar~lut). Для заданной последовательности {ut\ в этом случае следовало бы поочередно вычислять: Ащ, А2щ — А (Ащ) и т. д.
Важным свойством операции вычисления разностей является результат ее воздействия на последовательность, образованную полиномами от t. Мы имеем
(13) |
|
|
|
|
|
|
|
|
A(a0 + a1t+ |
|
+ aktk) = |
|
|
|
|
|
|
= а 0 + |
+ |
1) + |
••• + |
+ |
l)ft—■ |
|
|
|
|
|
|
|
— |
К |
+ а Д + |
• • • |
4 " а /^*1 = |
= |
+ |
«2IV + |
1)2- |
t 2] + а3 [(* + |
1)з _ |
/3] + ... |
||
|
|
|
|
|
|
... + a ft[((+ |
!)* -(*] = |
|
= k |
a |
+ |
|
|
а*-1 tk~2 + |
|
|
|
... + |
|
k — l |
|
1 + |
+ |
^ + |
||
|
+ |
|
||||||
|
|
[ ( ■ |
> |
k — 2 |
|
|
|
+ a2+ aj. |
|
|
|
|
+ [a*+ a k- i + |
■■■ |
Существенным моментом является здесь то, что применение разност ного оператора к полиному понижает степень последнего на едини цу. Из этого факта следует, что если f (t) — полином степени k, то
(14)А? (0 = 0, r = k + l , k + 2..........
Ранее мы рассмотрели тренды, которые или являются полиномами, или хорошо аппроксимируются полиномами на интервалах. С по мощью операции вычисления разностей такие тренды редуцируют ся к нулю или к функции, близкой к тождественному нулю. (Более полно об исчислении разностей см. Жордан (1939) или Миллер (I960)).
3.4. |
МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ |
79 |
3.4.3. Вычисление последовательных разностей наблюдаемых рядов
Рассмотрим наблюдаемый временной ряд {yt}, о котором пред полагается, что он складывается из тренда f(f) и случайной ошибки щ. Поскольку оператор А линейный, то
(15) |
Ayt = А [/ (0 + ut\ = Af (0 + Aut, |
(16) |
Aryt = Arf(t) + Arut. |
Если f (f) — полином от t степени меньшей, чем г, то Д7 (f) = 0 и %Аryt — 0. Во всяком случае,
(17) |
g A ^ = A7(*). |
Обратимся теперь к дисперсии величины Aryt. Она равна дис персии случайной величины
(18) А Ч = |
D 4 = |
‘ ‘ |
У ] “*= |
|
= Щ+г-- ( j Щ+г—1+ |
• • * + |
(--- 1)ГЩ- |
Для дальнейшего будет полезна
Л емма 3.4.1. Пусть Р (х) и Q (х) — полиномы степени р и q соответственно. Тогда %P{&)ut Q (&)ut равно умноженному на о2
коэффициенту при хя в выражении xqP (х) Q {х~~1) или, что равно сильно, коэффициенту при х? в у?Р (л:"”1) Q (х).
Д оказательство. Пусть |
|
|
|
|
|
|
||
(19) |
/>(*) = 2 |
а / , |
Q(x) = |
2 |
Ь,х>. |
|
||
|
1=0 |
|
|
/=О |
|
|||
Тогда |
|
Р |
Я |
|
|
|
min(p,q) |
|
(20) |
g Р (9) utQ (9) «, = |
afij^ut+i щ+t = о-2 |
||||||
2 |
2 |
2 apt, |
||||||
|
|
i=0 /=0 |
|
|
i=0 |
|||
поскольку %utus = 0, t Ф s. |
Однако это |
и |
есть |
умноженный на |
||||
а2 коэффициент при хя в выражении |
|
|
|
|||||
(21) |
Р (х) x4Q(дГ1) = 2 |
|
|
2 Ь,х«ч = |
2 |
2 |
|
|
|
i=0 |
|
/=0 |
i=01=0 |
|
Доказательство завершается выписыванием второго полинома,®
80 ТРЕНДЫ И СГЛАЖИВАНИЕ Гл. 3.
Дисперсия величины Дгщ выражается соотношением
(22) |
g (Д Ч )2 = |
S (& — 1)г |
|
и, = |
|
|
= |
сг* |
= О2 |
(2г) 1 |
|
|
И)2 |
• |
Это связано с тем, что правая часть (22) есть умноженный на а* ко эффициент при х? в выражении
(23)( * - 1)г(1 - * ) '= ( - 1 ) '( д г - 1)2г =
=2 ( - O '+ 'P V .
|
/=0 |
\ / |
|
|
Ковариация величин Агщ и Агщ+$ есть |
|
|
|
|
(24) |
gAr« ,A 4 +s = g (3>— l)r щ (2>— 1 |
= |
|
|
|
2г |
s = 0, |
1, , |
Г, |
|
<х2(— l)s |
|||
|
r + s |
s = r + |
1, |
|
|
О, |
|
Скользящее среднее является линейным оператором и может
быть представлено в виде полинома от оператора |
|
|
|||||
(25) |
2 |
c^ + s = |
2 |
S^ |
+SU - |
|
|
|
с« |
|
|
|
|||
Аналогичным образом можно |
записать |
сглаживающие |
формулы |
||||
из разд. 3.3.1, а также остаток от скользящего среднего |
|
||||||
(26) |
й - 2 |
<*»+.=■ f a - - |
2 |
|
|
|
|
|
s= — т |
\ |
|
s= — т |
/ |
|
|
Если |
сглаживающая |
формула |
(25) |
использует |
полином |
степени |
|
2k + |
1, то оператор (26) аннулирует (т. е. обращает в нуль) всякий |
||||||
полином степени 2k + |
1 или меньшей. Покажем, |
что отсюда сле |
дует, что этот оператор действует (исключая сдвиг во времени) как линейная комбинация разностей Д2*+2, ..., Д2т.
Л е м м а 3.4.2. Если Q (.х) — полином от х степени п uQ (^) анну лирует всякий полином степени р (< п), то Q ($7(j можно предста
вить в виде линейной комбинации операторов Др+1, ..., А",
Д оказательство. Пусть |
Q (у + 1) = dnyn -f dn_xyn~l -f . . . |
|
. ,, |
+ dxy + d0. Поскольку |
= A + 1, то |
(27) |
Q (V )f(t)= dnbnf(t) + dn„lAn- 'f(t)+ . .. + d lAf(t) + d0f(t). |
3.4. |
МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ |
81 |
Если / (t) = t \ 0 < q < р, то |
|
|
(28) |
Q (P )f(t)= d gA r + dq^ A g- 'tg+ . .. + ^ |
+ < y * = 0 |
ввиду того, что Дrtq = 0 для г > |
q. Поочередное рассмотрение (28) |
|
для 9 = 0, 1, ..., р показывает, что d0 = 0, dx = 0, |
= 0. Это |
|
и доказывает лемму. в |
|
|
С ледствие 3.4.1. Остаток (26) |
сглаживающей формулы с 2т + 1 |
|
членами, использующей полином степени 2k или 2& + |
1, является |
результатом применения линейной комбинации операторов Д2/г+2,...
.... Д2т к 0_*.
В случае т = k + 1 указанный оператор1) имеет степень 2т —
=2k + 2 и поэтому он должен быть пропорционален (Р — 1)2*+2 =
=A2fc+2, т. е. равен C'A2k+2. Значение С' определяется путем сравнения двух выражений для дисперсии величины
*+i |
„ .„ |
(29)и,— 2 c su ‘+ * = C'A2*+V -fc-i.
s— -(ft+l)
Мы имеем иг (22)
(30)g (C'A2k+2ut„k-if = C 2( l k + t)
Далее,
(31) |
g U - |
2 |
/ |
= 8 ^ - 8 ( |
S |
|
\ |
s= —(fc-H) |
|
\s==— |
= a2 — a2c0.
Это следует из теоремы 3.3.1 и из некоррелированности оценки ре грессии и остатка от нее. Поскольку 1 — с0является коэффициентом
при / +| в разложении С (л: — l)2ft+2, то
(32) |
(— l)ft+1C' 2k+ 2 |
Ak + 4\ |
|
k + 1 |
2k + 2 j' |
Поэтому
(33)
(34)
m
^ Оператор <3sfn —2 в (26). — П р и м , перев,
s= — m
82 ТРЕНДЫ И СГЛАЖИВАНИЕ Гл. 3.
При этом
|
(2k + 2 \ { 2k + 2 \ |
(35) |
с—S = cs = (— 1)S + I U + 1/ U + 1+ s) |
|
(4k + 4\ |
\2fe+ 2/
Эти же выражения были приведены ранее в формулах (19), (20), (21) § 3.3.
3.4.4. Оценивание дисперсии ошибки
Мы показали, что если тренд / (t) на коротких интервалах бли зок к полиному низкой степени, то полученная последовательность разностей имеет средние, близкие к нулю. Если эти средние значе ния равны нулю, то
(36) |
|
|
|
|
|
|
2 |
( W |
|
|
|
|
|
|
У .— |
* ' |
|
|
|
||
является несмещенной оценкой а2. Для произвольного тренда |
||||||||||
|
|
|
|
|
|
|
*2 |
(д7(0? |
|
|
(37) |
|
|
|
gVr = a2 + |
t=1 |
|
|
|||
|
|
|
|
|
|
|
(Т |
- |
О |
|
|
|
|
|
|
|
|
|
|
||
Пусть |
К, = |
11 ( Т - г) |
|
. Тогда дисперсия Vr при А7 (0 = 0, |
||||||
t = 1, ..., Т — г, равна произведению Кг на величину |
||||||||||
(38) |
g |
Г2 |
(ДЧ)а - ( 7 , - ' - ) ( 2^ |
2]2 = |
|
|||||
|
|
|
|
|
|
= 2"8(АЧ)2(АЧ)2—(71—rf (2r)2a1. |
||||
|
|
|
|
|
n |
<.S=1 |
|
|
\ r) |
|
Л емма 3.4.3. Пусть |
|
|
|
|
где К — симметричная |
|||||
2 |
ацЩЩ — |
и ’ А и , |
||||||||
матрица, |
%ut — 0, |
|
i,/=! |
а2, |
Лы(ы/ = 0, |
i Ф /, %и\ = х4 + За2, |
||||
Ви? = |
||||||||||
Тогда |
= a4, |
i Ф /, |
и %ulujutu l — 0, |
если индексы не равны попарно. |
||||||
|
|
|
|
|
|
|
|
|
|
|
(39) |
|
|
g |
2 |
aijUiUi = |
° 2 2 |
= |
° 2 trA> |
||
|
|
|
|
/,/=! |
|
|
i=l |
|