Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ временных рядов

..pdf
Скачиваний:
2
Добавлен:
19.11.2023
Размер:
47.02 Mб
Скачать

3.3. СГЛАЖИВАНИЕ 73

Если долговременный тренд h (t) меняется медленно, то (43) близко

к h (f),

В частном случае, когда функция h (t) линейна, (43) в

точ­

ности равно h (t).

 

соот­

При Т

= hti функцию g (t) можно определить однозначно

ношением

 

 

 

(44)

g (0

= 4-2 f(t +

n D — 4-2 f(s), t = l,

 

 

 

п i= 0

' s=l

 

Сезонный эффект декабря равен, например, разности между сред­ ним по всем декабрям и средним по всем данным. Оценкой функции g (0 служит в этом случае

(45)

4 - 2 yt+nj— 4

- 2 ys>

< = i, . . . . я.

 

п /=О

1

S=I

,

Эта оценка является несмещенной и имеет дисперсию

,46)

Альтернативный метод оценивания состоит в использовании отклонений от сглаженных значений. Если п = 2т , то соответствуй ющие оценки для g (t) следующие:

1

h~X

^ = 1, ••• у

ffl9

h_1

2

(yt+nj y^rifh

(47)

h—2

 

 

 

 

 

-j-ZTT 2

(#+«/ — tft+J*

t = m + l,

. . . , 2m.

 

/“ 0

 

 

Ввиду того что в сглаживаемых рядах отсутствуют m первых и m

последних членов, средние (47) должны

основываться

на Л — 1

отклонениях. В более подробной записи они имеют вид

 

 

 

h—1

j

/ Т - m

- l + t

,

j

 

\

 

2 yt+nf 9— I

2

ys +

~2 ~У‘+т~о~Ут—т+*) >

 

/=1

гт

\s = < -fm + l

i

1

 

J

(48)

 

 

—3m

 

 

t =

1,

, m,

1

ft-2

j

l+<

j

j

 

\

$ > У*+Я,~~~%Г { 4=S+. У* +

 

yt~m+ Т

 

 

h— 1

T

Ут~3m+ t j[

Дисперсия

оценки

(48) равна

 

 

 

t = m-\- 1, . . . ,

2m.

 

 

 

 

 

 

^

 

[ T n

2 ( Г — n ) 2 ]

 

 

 

 

Может показаться, что оценка (48) несколько предпочтительнее, так как применение скользящего среднего является более гиб­

74

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

ким подходом, чем точное описание тренда. Однако разница между (48) и (45) заключается только в использовании крайних членов, именно в отбрасывании (2т — 1) крайних членов и использовании половинных значений двух других крайних членов. Легко прове­ рить, что (49) больше чем (46). [См. Дурбин (1963).]

При рассмотрении многих экономических временных рядов ста­ тистики полагают, что составляющие ряд воздействия перемножа­ ются. Иными словами, они предполагают, что ряд имеет вид

(50)

Y(t) = G(t)H(t)U(t),

где Н (t) — тренд,

G (t) — сезонный фактор, U (/) — случайный

фактор, причем все сомножители положительны. Применяемое в этом случае так называемое «отношение к скользящему среднему» (ratio-to-moving average) заключается в последовательном образо­ вании ряда скользящих средних (42) и использовании отношений У (t + nj)/Y*(t + nj) вместо разностей из (47). Для получения оцен­ ки сезонного фактора, соответствующей суммам (47), производится усреднение образованных отношений при каждом значении t (или находится медиана этих отношений). Если произведение сред­ них (или медиан) указанных отношений не равно 1, как это обычно и бывает (в то время как сумма оценок (48) должна была бы всегда равняться нулю, если бы не влияние крайних членов), то каждое отношение умножается на одно и то же число, так чтобы результи­ рующее произведение равнялось 1. Альтернатива к этой процедуре состоит в использовании логарифмов. При этом

/51)

yt = log Y (t),

g (0 =

log G (t),

 

ht = log H(t),

ut =

log U (/).

Если полученные ряды и их компоненты удовлетворяют сделанным ранее предположениям, то для оценивания функции g (t) =

log G (t) можно использовать (45) или (48). Этот метод представ­ ляется более предпочтительным. Дело в том, что метод отношений к скользящему среднему не имеет строгого математического обо­ снования. Более того, чувствуется, что он не является безукоризнен­ ным в этом отношении, поскольку использует аддитивные методы при мультипликативных факторах (это проявляется в необходи­ мости видоизменять оценки, принудительным образом домножая их произведение до 1).

Мы определили сезонное изменение g (t) в (44) чисто формальным образом. Экономист обычно представляет себе сезонное изменение как проявление определенного поведения, обусловленного тем или иным временем года, а тренд — как долговременную тенденцию,

Мы понимаем здесь под «трендом» всякое систематическое изменение ож и­ даемого значения, не связанное с сезонными изменениями. Экономисты часто понимают «тренд» ка к долговременное изменение, противопоставляя егр «цикли­ ческим изменениям», коротким по времени.

3; 3. СГЛАЖИВАНИЕ 75

обусловленную более устойчивыми воздействиями. При этом f (t)

является суммой сезонного воздействия g(t) и долговременного

тренда h (it),

причем (по крайней мере субъективно) g(t) и h (t)

оп­

ределяются

независимо. При таком подходе функция g(t)

может

и не быть строго периодической, медленно меняя со временем

свой

вид. Можно предположить, например, что

 

 

(52)

g(t + nj)

 

 

где g** (j) — медленно меняющаяся функция. Мы, однако,

не бу­

дем развивать далее это направление. Метод анализа сезонных изме­ нений, основанный на подобной модели, предложен Вальдом (1936). Изменяющиеся сезонные колебания рассматривались затем Хеннаном (1964), Боксом и Дженкинсом (1970).

Статистики иногда рассматривают экономический временной ряд как ряд, складывающийся из долговременного тренда, цикли­ ческого изменения, сезонного воздействия и нерегулярной состав­ ляющей. Тренд является долговременной тенденцией изменения, обусловленной ростом популяции, технологическими изменениями и другими достаточно долговременными воздействиями. Циклическое же изменение связано с колебаниями, известными под названием цикла деловой активности. С этой точки зрения циклическое из­ менение не обязательно периодично, как это имело место у сезонного изменения в (38). Тем не менее иногда предполагают, что скользя­ щее среднее устраняет влияние циклического изменения при оце­ нивании тренда. Вопрос об эффективности этой процедуры мы рас­ смотрим позднее.

Сглаживающие формулы могут быть основаны не только на по­ линомах, но и на других выравнивающих функциях. Кроме того, эти функции не обязательно должны подбираться с использованием равных весов. Значения в точках s = 0, ± 1, .... ±т могут быть обработаны так, как если бы они имели возрастающую дисперсию.

Задачу получения сглаженных значений на концах рядов можно решать различными способами. Значения в начале ряда могут не играть особой роли. Значения же непосредственно в конце ряда обычно наиболее существенны. Если сглаживающая формула осно­ вывается на подборе полинома степени q по + 1 точкам, то по­ лином, подобранный по значениям Ут-Чт, УТ-Чт+1....... Ут, можно

использовать для

получения значений у* сглаженного ряда и при

t — Т m + 1,

Т пг + 2,

...,

Т, и при t = Т ш. Эти сгла­

женные значения

у] также

являются линейными

комбинациями

значений ут-чт, .... Ут■ [Коуден

(1962) приводит соответствующие

коэффициенты для <7 = 1, ...,

5

и m = 1, ..., 12.1

Другой подход

состоит в применении сглаживающих процедур, основывающихся на использовании в конце ряда меньших значений т и к . При таком подходе у'т — ут(поскольку и т, и k должны быть равны в этом

76

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

случае нулю), что является не вполне удовлетворительным. Оба эти метода дают сглаженные значения, обладающие в конце ряда большей вариабельностью, чем в его середине.

3.4.МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

3.4.1.Введение

Метод переменных разностей был предложен для оценивания дисперсии случайной составляющей при гладком характере тренда. При 'дальнейшем развитии метод стал применяться и для решения вопроса о степени гладкости тренда. Обе эти статистические задачи рассматриваются применительно к модели yt = / (t) + Щ, где ut некоррелированы, имеют нулевые средние и дисперсии а2, а функ­ ция f(f) является гладкой в том смысле, что ее можно хорошо приблизить в последовательных интервалах времени полиномом не­ большой степени.

Другое применение переменных разностей состоит в проверке отсутствия корреляции. Такие задачи рассматриваются в гл. 6 для иной вероятностной модели.

В настоящем параграфе будет развита некоторая общая тео­ рия, рассмотрены оценивание величины а2 и критерии для проверки гипотез о гладкости, а также будет выяснена связь указанного ме­ тода со сглаживанием. Некоторые из этих результатов использу­ ются в дальнейшем при изучении сериальной корреляции.

Впервые разности были использованы, по-видимому, Кейв- Браун-Кейвом (1904) и Хукером (1905) для изучения корреляции между двумя рядами. Метод был развит затем Стьюдентом (1914). О. Андерсон (1929) и Тинтнер (1940) интенсивно изучали его приме­ нительно к оцениванию дисперсии.

3.4.2. Вычисление последовательных разностей

Метод переменных разностей основан на вычислении последо­ вательных разностей элементов временного ряда. Установим си­ стему обозначений для таких вычислений и отметим некоторые их свойства. Пусть ^ — оператор, определяемый соотношением

(1)9ut = ut+u * = . . . , — 1, 0, 1..........

По любой заданной последовательности ..., ы_i, ы0, их, ... этот опе­ ратор строит новую последовательность, индексы в которой сдви­ нуты на единицу. Мы будем писать также Ф {«,} = {«<+i}.

Оператор такого рода есть функция, аргументами и значениями которой являются последовательности. Оператор О называется

3 .4 .

МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

77

линейным, если для любой последовательности {щ} и для

любого

действительного числа с

 

(2)

0 {cut} = сб {щ}

 

и,

кроме того, для любой пары последовательностей {ut} и {vt}

(3)

0 {«, + »,} =£>{«,} +

 

Очевидно, что ЧРявляется линейным оператором. Мы будем исполь­ зовать запись (1), понимая ее и как результат применения опера­ тора ЧР к целой последовательности, и как результат операции над отдельным элементом ut последовательности.

Определим ЧР° = 1 как тождественный оператор (4P9ut = щ), а

оператор ЧР1определим рекуррентно как

ЧР(ЧР1-1),

т. е.

(4)

 

ЧР1щ =

4P(4Pl~xut),

п =

2,

3..........

По индукции можно вывести, что

 

 

 

 

(5)

 

 

ЧР U ( =

U iA -n -

 

 

 

Оператор сЧР задается

соотношением

 

 

 

(6)

 

 

(c4P)ut =c(4Pul).

 

 

Определим далее сумму операторов соотношением

 

(7)

( с ^ +

•••

=

 

 

•••

+ c k4F*u,

Как следует из (7),

 

 

 

 

 

(8)

(^ЧР1' +

••• +

ck4P"k) ut =

 

+

• • •

+ ckut+4.

Таким образом, определен полином от ЧР(с действительными коэф­ фициентами). Операции над этими полиномами (умножение и т. д.) согласуются с операциями над полиномами от абстрактной пере­ менной. (Сумма бесконечного числа операторов есть предел левой части (8), если правая часть сходится в некотором смысле.)

В частности, представляет интерес полином А = ЧР— 1 (раз­ ность первого порядка), действующий следующим образом:

(9)Aut = (ЧР— 1) и( = ЧРщut — ut+ 1 ut.

Разность второго порядка есть

(10)А*щ = (ЧР— 1)*и( = (ЧР* — 2ЧР+1)щ,

или, что эквивалентно,

(И)

Д(Дыг) — Аыж — Ащ = ut+2 — 2и(+) -J- иг

78

 

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

Разности более высоких порядков определяются как

 

(12)

дч =

у щ = i ( - ir / Q ^ «/ =

 

/=0 \//

Для удобства вычислений мы можем предпочесть определение

Агщ = A (Ar~lut). Для заданной последовательности {ut\ в этом случае следовало бы поочередно вычислять: Ащ, А2щ — А (Ащ) и т. д.

Важным свойством операции вычисления разностей является результат ее воздействия на последовательность, образованную полиномами от t. Мы имеем

(13)

 

 

 

 

 

 

 

 

A(a0 + a1t+

 

+ aktk) =

 

 

 

 

 

= а 0 +

+

1) +

••• +

+

l)ft—■

 

 

 

 

 

 

К

+ а Д +

• • •

4 " а /^*1 =

=

+

«2IV +

1)2-

t 2] + а3 [(* +

1)з _

/3] + ...

 

 

 

 

 

 

... + a ft[((+

!)* -(*] =

= k

a

+

 

 

а*-1 tk~2 +

 

 

... +

 

k — l

 

1 +

+

^ +

 

+

 

 

 

[ ( ■

>

k — 2

 

 

 

+ a2+ aj.

 

 

 

 

+ [a*+ a k- i +

■■■

Существенным моментом является здесь то, что применение разност­ ного оператора к полиному понижает степень последнего на едини­ цу. Из этого факта следует, что если f (t) — полином степени k, то

(14)А? (0 = 0, r = k + l , k + 2..........

Ранее мы рассмотрели тренды, которые или являются полиномами, или хорошо аппроксимируются полиномами на интервалах. С по­ мощью операции вычисления разностей такие тренды редуцируют­ ся к нулю или к функции, близкой к тождественному нулю. (Более полно об исчислении разностей см. Жордан (1939) или Миллер (I960)).

3.4.

МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

79

3.4.3. Вычисление последовательных разностей наблюдаемых рядов

Рассмотрим наблюдаемый временной ряд {yt}, о котором пред­ полагается, что он складывается из тренда f(f) и случайной ошибки щ. Поскольку оператор А линейный, то

(15)

Ayt = А [/ (0 + ut\ = Af (0 + Aut,

(16)

Aryt = Arf(t) + Arut.

Если f (f) — полином от t степени меньшей, чем г, то Д7 (f) = 0 и %Аryt — 0. Во всяком случае,

(17)

g A ^ = A7(*).

Обратимся теперь к дисперсии величины Aryt. Она равна дис­ персии случайной величины

(18) А Ч =

D 4 =

‘ ‘

У ] “*=

 

= Щ+г-- ( j Щ+г—1+

• • * +

(--- 1)ГЩ-

Для дальнейшего будет полезна

Л емма 3.4.1. Пусть Р (х) и Q (х) полиномы степени р и q соответственно. Тогда %P{&)ut Q (&)ut равно умноженному на о2

коэффициенту при хя в выражении xqP (х) Q {х~~1) или, что равно­ сильно, коэффициенту при х? в у?Р (л:"”1) Q (х).

Д оказательство. Пусть

 

 

 

 

 

 

(19)

/>(*) = 2

а / ,

Q(x) =

2

Ь,х>.

 

 

1=0

 

 

/=О

 

Тогда

 

Р

Я

 

 

 

min(p,q)

(20)

g Р (9) utQ (9) «, =

afij^ut+i щ+t = о-2

2

2

2 apt,

 

 

i=0 /=0

 

 

i=0

поскольку %utus = 0, t Ф s.

Однако это

и

есть

умноженный на

а2 коэффициент при хя в выражении

 

 

 

(21)

Р (х) x4Q(дГ1) = 2

 

 

2 Ь,х«ч =

2

2

 

 

i=0

 

/=0

i=01=0

 

Доказательство завершается выписыванием второго полинома,®

80 ТРЕНДЫ И СГЛАЖИВАНИЕ Гл. 3.

Дисперсия величины Дгщ выражается соотношением

(22)

g (Д Ч )2 =

S (& — 1)г

 

и, =

 

=

сг*

= О2

(2г) 1

 

 

И)2

Это связано с тем, что правая часть (22) есть умноженный на а* ко­ эффициент при х? в выражении

(23)( * - 1)г(1 - * ) '= ( - 1 ) '( д г - 1)2г =

=2 ( - O '+ 'P V .

 

/=0

\ /

 

 

Ковариация величин Агщ и Агщ+$ есть

 

 

 

(24)

gAr« ,A 4 +s = g (3>— l)r щ (2>— 1

=

 

 

 

s = 0,

1, ,

Г,

 

<х2(— l)s

 

r + s

s = r +

1,

 

 

О,

 

Скользящее среднее является линейным оператором и может

быть представлено в виде полинома от оператора

 

 

(25)

2

c^ + s =

2

S^

+SU -

 

 

 

с«

 

 

 

Аналогичным образом можно

записать

сглаживающие

формулы

из разд. 3.3.1, а также остаток от скользящего среднего

 

(26)

й - 2

<*»+.=■ f a - -

2

 

 

 

 

s= — т

\

 

s= — т

/

 

 

Если

сглаживающая

формула

(25)

использует

полином

степени

2k +

1, то оператор (26) аннулирует (т. е. обращает в нуль) всякий

полином степени 2k +

1 или меньшей. Покажем,

что отсюда сле­

дует, что этот оператор действует (исключая сдвиг во времени) как линейная комбинация разностей Д2*+2, ..., Д2т.

Л е м м а 3.4.2. Если Q (.х) — полином от х степени п uQ (^) анну­ лирует всякий полином степени р (< п), то Q ($7(j можно предста­

вить в виде линейной комбинации операторов Др+1, ..., А",

Д оказательство. Пусть

Q (у + 1) = dnyn -f dn_xyn~l -f . . .

. ,,

+ dxy + d0. Поскольку

= A + 1, то

(27)

Q (V )f(t)= dnbnf(t) + dn„lAn- 'f(t)+ . .. + d lAf(t) + d0f(t).

3.4.

МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

81

Если / (t) = t \ 0 < q < р, то

 

(28)

Q (P )f(t)= d gA r + dq^ A g- 'tg+ . .. + ^

+ < y * = 0

ввиду того, что Дrtq = 0 для г >

q. Поочередное рассмотрение (28)

для 9 = 0, 1, ..., р показывает, что d0 = 0, dx = 0,

= 0. Это

и доказывает лемму. в

 

 

С ледствие 3.4.1. Остаток (26)

сглаживающей формулы с 2т + 1

членами, использующей полином степени 2k или 2& +

1, является

результатом применения линейной комбинации операторов Д2/г+2,...

.... Д2т к 0_*.

В случае т = k + 1 указанный оператор1) имеет степень 2т —

=2k + 2 и поэтому он должен быть пропорционален — 1)2*+2 =

=A2fc+2, т. е. равен C'A2k+2. Значение С' определяется путем сравнения двух выражений для дисперсии величины

*+i

„ .„

(29)и,— 2 c su ‘+ * = C'A2*+V -fc-i.

s— -(ft+l)

Мы имеем иг (22)

(30)g (C'A2k+2ut„k-if = C 2( l k + t)

Далее,

(31)

g U -

2

/

= 8 ^ - 8 (

S

 

\

s= —(fc-H)

 

\s==—

= a2 — a2c0.

Это следует из теоремы 3.3.1 и из некоррелированности оценки ре­ грессии и остатка от нее. Поскольку 1 — с0является коэффициентом

при / +| в разложении С (л: — l)2ft+2, то

(32)

(— l)ft+1C' 2k+ 2

Ak + 4\

 

k + 1

2k + 2 j'

Поэтому

(33)

(34)

m

^ Оператор <3sfn 2 в (26). — П р и м , перев,

s= — m

82 ТРЕНДЫ И СГЛАЖИВАНИЕ Гл. 3.

При этом

 

(2k + 2 \ { 2k + 2 \

(35)

с—S = cs = (— 1)S + I U + 1/ U + 1+ s)

 

(4k + 4\

\2fe+ 2/

Эти же выражения были приведены ранее в формулах (19), (20), (21) § 3.3.

3.4.4. Оценивание дисперсии ошибки

Мы показали, что если тренд / (t) на коротких интервалах бли­ зок к полиному низкой степени, то полученная последовательность разностей имеет средние, близкие к нулю. Если эти средние значе­ ния равны нулю, то

(36)

 

 

 

 

 

 

2

( W

 

 

 

 

 

У .—

* '

 

 

 

является несмещенной оценкой а2. Для произвольного тренда

 

 

 

 

 

 

 

*2

(д7(0?

 

(37)

 

 

 

gVr = a2 +

t=1

 

 

 

 

 

 

 

 

 

-

О

 

 

 

 

 

 

 

 

 

 

Пусть

К, =

11 ( Т - г)

 

. Тогда дисперсия Vr при А7 (0 = 0,

t = 1, ..., Т — г, равна произведению Кг на величину

(38)

g

Г2

(ДЧ)а - ( 7 , - ' - ) ( 2^

2]2 =

 

 

 

 

 

 

 

= 2"8(АЧ)2(АЧ)2—(71—rf (2r)2a1.

 

 

 

 

 

n

<.S=1

 

 

\ r)

Л емма 3.4.3. Пусть

 

 

 

 

где К симметричная

2

ацЩЩ

и А и ,

матрица,

%ut — 0,

 

i,/=!

а2,

Лы(ы/ = 0,

i Ф /, %и\ = х4 + За2,

Ви? =

Тогда

= a4,

i Ф /,

и %ulujutu l — 0,

если индексы не равны попарно.

 

 

 

 

 

 

 

 

 

 

(39)

 

 

g

2

aijUiUi =

° 2 2

=

° 2 trA>

 

 

 

 

/,/=!

 

 

i=l