Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika 2.doc
Скачиваний:
10
Добавлен:
26.11.2019
Размер:
957.44 Кб
Скачать

3.2. Методы выделения тренда

Выделение тренда: методы регрессии. Рассмотрим применение метода регрессии при прогнозировании временных рядов на примере деятельности компании АПИ в Северной Америке, данные по годовому объему продаж моторного масла приведены в табл. 4.

Т а б л и ц а 4

Объем продаж компании АПИ

Год

Годовой объем продаж (млн.$)

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

170

120

105

156

189

107

167

205

178

755

189

235

203

267

239

Как видно из графика на рис. 3, имеются существенные колебания показателей объема продаж. Однако отмечается видимая тенденция к увеличению объема продаж, и соответствующий тренд можно выделить с помощью методов регрессии. Линия регрессии показана на графике.

Рис.3. Данные объема продаж компании АПИ

Из графика видно, что зависимость определена не столь четко, как в предыдущем примере. Так, коэффициент корреляции для этих данных будет значительно меньше по величине, и вообще может оказаться незначимым. Долговременный тренд может быть линейным или нелинейным. Эти данные трудно анализировать из-за сильных расхождений между соседними значениями. Часто, когда мы имеем дело с такого рода данными, необходимо сгладить колебания, и только потом можно сделать какой-либо имеющий смысл прогноз. Методы сглаживания данных временных рядов будут более подробно рассмотрены в последующих разделах.

Выделение тренда: скользящие средние

Метод скользящих средних позволяет «сгладить» ряд значений с тем, чтобы выделить тренд. При использовании этого метода берется среднее (обычно среднее арифметическое) фиксированного числа значений. Затем это вычисление повторяется по всему ряду значений. Полученные скользящие средние обозначат общий тренд временного ряда. Число значений, которое используется при вычислении среднего, определяет результат сглаживания. В целом, чем больше точек берется, тем сильнее сглаживаются данные.

С помощью скользящих средних можно сгладить колебания объемов продаж на временных промежутках. Например, в нижеприведенной таблице представлены исходные объемы продаж, а также скользящие средние, рассчитанные по каждым 3 (трем) значениям (так называемые трехточечные скользящие средние). Данные примера представлены на рис.5.

Т а б л и ц а 5

Год

Годовой объем продаж, млн.$

Трехточечные скользящие средние

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

170

120

105

156

189

107

167

205

178

755

189

235

203

267

239

131,67

127,00

150,00

150,67

154,33

159,67

183,33

179,67

174,33

193,33

209,00

235,00

236,33

Эти скользящие средние рассчитаны следующим образом. Первые три значения объема продаж (1984—1986 гг.) складываются, а затем делятся на три: получаем значение первого скользящего среднего. Итак,

Первое скользящее среднее = (170+120+105)/3=395/3=131,67

Это значение записывается по центру значений, по которым рассчитывалось среднее значение, и поэтому в таблице значение скользящего среднего, полученное первым, стоит против 1985 г. Следующее значение скользящего среднего рассчитывается так:

Второе скользящее среднее=(120+105+156)/3=381/3=127

Полученное значение ставится в центр диапазона, т. е. в таблице оно стоит против 1986 г. Далее проводим аналогичные вычисления по трем значениям вплоть до последнего набора значений за 1996—1998 гг., где значение скользящего среднего равно 236.33. И вновь, обратите внимание, что последнее полученное значение записывается по центру диапазона, т. е. напротив 1997 г.

Рис. 4. Объемы продаж компании АПИ и скользящие средние

Т а б л и ц а 6

Год

Годовой объем продаж, млн.$

Семиточечные скользящие средние

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

170

120

105

156

189

107

167

205

178

755

189

235

203

267

239

144,86

149,86

158,14

165,43

170,14

176,71

190,43

204,71

209,57

На рис.4 показано, как трехточечные скользящие средние существенно сгладили график. Были сняты многие колебания исходных данных, и полученный набор значений более четко показывает тренд данных. Таким образом, можно делать прогнозы исходя из оценок линии регрессии, составленной по значениям скользящих средних. Однако трехточечные скользящие средние все еще выказывают некоторые колебания. Ряд можно сгладить еще больше, если увеличить число точек при вычислении значений скользящих средних. Так, например, в табл. 6 приведены значения скользящих средних, рассчитанные по 7 точкам на основе тех же самых данных.

Семиточечные скользящие средние дают консистентный тренд для этого ряда данных. На графике (рис.5) показаны трех- и семиточечные скользящие средние. Мы видим, что семиточечные скользящие средние образуют более сглаженную линию с меньшими колебаниями, чем трехточечные.

Рис. 5. Объемы продаж компании АПИ и два набора скользящих средних

Увеличение числа точек при вычислении скользящих средних ведет к большему сглаживанию линии тренда. Поэтому можно утверждать, что чем больше точек взято для вычисления скользящих средних, тем линия тренда «лучше». Но при этом может возникнуть вопрос: а почему не рассчитать средние по 10, 11 или даже 15 точкам? Дело в том, что чем больше точек мы берем для вычисления скользящих средних, тем меньше конечных значений мы получаем. Так, сравним два набора скользящих средних, рассчитанных в нашем примере. Мы получили 13 трехточечных скользящих средних и только девять семиточечных скользящих средних.

Посчитайте, сколько значений скользящих средних вы получите, если при вычислении возьмете 9 или 11 точек. Отсюда, когда необходимо решить, сколько точек брать для вычислений, то следует найти компромисс между их большим числом (чтобы обеспечить относительную сглаженность графика) и малым (чтобы получить достаточное количество значений). Задача такого рода упрощается в ситуациях, когда имеется очевидная периодичность данных. Рассмотрите, например, значения, которые циклично повторяются каждые пять точек: скажем, объем продаж товара достигает своего пика на 5-й, 10-й и 15-й год. В этом случае данные можно сгладить пятиточечными скользящими средними.

Выделение тренда: центрированные скользящие средние

При вычислении скользящих средних по четному количеству точек может возникнуть сложность с тем, как расположить результаты. Как мы уже отмечали в предыдущих примерах, значение скользящего среднего ставится по центру диапазона взятых значений. Если у нас четное число значений, то это значит, что фактически скользящее среднее должно быть поставлено по срединной точке между строк. Например, возьмем данные по объему продаж, которые мы рассматривали в предыдущем разделе. Рассчитаем четырех-точечные скользящие средние и сведем их в таблицу. Чтобы упростить пример, возьмем только несколько первых значений.

Т а б л и ц а 7

Год

Годовой объем продаж, млн.$

Четырехточечные скользящие средние

1984

1985

1986

1987

1988

1989

1990

1991

170

120

105

156

189

107

167

205

137,75

142,50

139,25

154,75

167,00

Обратите внимание, что значения скользящих средних приведены по центру соответствующего диапазона значений. Так, первое скользящее среднее, рассчитанное по значениям за 1984-1987 гг., поставлено посередине между 1985 и 1986 годами. Аналогичным образом записываются и другие четырехточечные скользящие средние. Последнее скользящее среднее за период 1988- 1991 гг. поставлено по центру этого диапазона между 1989 и 1990 гг.

При дальнейшем анализе этих данных нам придется рассматривать скользящие средние и соответствующие фактические значения. Для этого вычисляются центрированные скользящие средние. Они рассчитываются путем нахождения среднего каждой пары значений скользящих средних. Это есть — двухточечная скользящая средняя скользящих средних. Полученные значения приведены в таблице ниже.

Т а б л и ц а 8

Год

Годовой объем продаж, млн.$

Четырехточечные скользящие средние

Центрированные скользящие средние

1984

1985

1986

1987

1988

1989

1990

1991

170

120

105

156

189

107

167

205

137,75

142,50

139,25

154,75

167,00

140,88

147,00

160,88

А теперь центрированные скользящие средние можно использовать для прогнозирования тренда. Значения, если их нанести на график, совпадут по горизонтальной оси с исходными данными. Рассчитайте самостоятельно четырехточечные скользящие средние, а затем центрированные скользящие средние для всех данных таблицы объема продаж (1984-1998).

Выделение тренда: экспоненциальное сглаживание

Альтернативный подход к устранению колебаний в ряде значений состоит в использовании метода экспоненциального сглаживания. Каждое сглаженное значение рассчитывается путем сочетания предыдущего сглаженного значения и текущего значения временного ряда. В этом случае текущее значение временного ряда взвешивается с учетом сглаживающей константы, обычно обозначаемой .

Сам расчет производится по следующей формуле:

,

где - текущее сглаженное значение;

- текущее значение временного ряда;

- предыдущее сглаженное значение;

- сглаживающая константа.

Значение всегда находится в пределах от 0 до 1, и в каждом конкретном случае необходимо выбрать наиболее приемлемое значение.

Реальный механизм вычисления сглаженных значений с использованием экспоненциального сглаживания не сложнее тех вычислений, что мы применяли при определении значений скользящих средних в предыдущем разделе. Рассмотрим этот вопрос вновь на примере объемов продаж компании АПИ. В таблице приведены соответствующие объемы продаж, а также сглаженные значения при сглаживающей константе а = 0,1.

Т а б л и ц а 9

Год

Объем продаж (млн.$)

Экспоненциальное сглаженное значение (=0,1)

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

170

120

105

156

189

107

167

205

178

755

189

235

203

267

239

170,00

165,00

159,00

158,70

161,73

156,26

157,33

162,10

163,69

162,92 165,53

172,47

175,53

184,67

190,11

Сглаженные значения, которые приведены в третьей колонке таблицы, все рассчитаны по значению текущему, а также предыдущему сглаженному. Первое сглаженное значение (1984 г.) — просто чистая копия значения объема продаж, так как предыдущее значение отсутствует. При вычислении используется общая формула .

Значение  = 0,1 и поэтому выражение принимает следующий вид:

Так, сглаженное значение в 1985 г. рассчитывается следующим обаразом:

Итак, сглаженное значение в 1984г. есть =170. Далее, значение объема продаж в 1985 г. есть =120. Отсюда сглаженное значение в 1985г.:

.

Аналогичным образом рассчитаны и остальные сглаженные значения, приведенные в этой таблице.

На рис.6 показаны исходные значения объема продаж, а также экспоненциально сглаженные значения при  = 0.1. Как видно из графика на рис. 6, метод экспоненциального сглаживания действительно существенно сглаживает ряд значений. И вполне логично использовать эти значения для оценки тренда в последующие годы. Однако, некоторые сложности возникают при использовании столь малых значений, как 0.1, например. Основной недостаток состоит в том, что между изменениями в исходном ряду значений и соответствующими изменениями в ряду сглаженных значений отмечается лаг (или запаздывание). Так, мы видим, что анализируемые данные демонстрируют восходящий тренд объема продаж. Однако скользящие средние «медленно» обозначают этот тренд. Обратите внимание, что на графике (рис. 6) все сглаженные значения за последние пять лет находятся под фактическими значениями объема продаж.

Рис.6. Объемы продаж компании АПИ и экспоненциально сглаженные значения

В целом, чем меньше значение , тем менее оно чувствительно к изменениям тренда в данном временном ряду. Чтобы решить эту проблему, мы можем взять большее значение . Рассмотрим, например, значение сглаживающей константы, равное  = 0.3. В табл. 10 приведены сглаженные значения, рассчитанные по этой константе.

Т а б л и ц а 10

Год

Объем продаж (млн.$)

Экспоненциальное сглаженное значение (=0,1)

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

1997

1998

170

120

105

156

189

107

167

205

178

755

189

235

203

267

239

170,00

155,00

140,00

144,80

158,06

142,74

150,02

166,51

169,96

165,77 172,47

191,42

194,89

216,52

223,27

Они получены по той же самой методике. Так, первое сглаженное значение в 1985 г. просто копирует значение объема продаж. Далее сглаженные значения рассчитываются по уже рассмотренной нами формуле.

На рис.7 даны в сравнении ряды сглаженных значений, полученных при различных сглаживающих константах с целью выделения тренда.

Рис. 7. Два ряда сглаженных значений объемов продаж компании АПИ

При анализе расхождений результатов применения двух сглаживающих констант при выделении тренда следует обратить внимание на два момента. Во-первых, временной лаг, который очевиден при =0.1, гораздо менее выражен при =0.3. В целом, чем больше значение при вычислении сглаженных значений, тем последние более чувствительны к изменениям в последних значениях временного ряда. То есть в этом случае сглаженные значения отстают от значений временного ряда не столь сильно, как это происходит при более малых значениях сглаживающей константы. Этот фактор не играет никакой роли, если отсутствует существенное изменение в общем тренде временного ряда. Однако он крайне важен при составлении прогнозов, когда отмечается значимое восхождение или нисхождение общего тренда временного ряда. Значения, полученные в нашем примере при =0.3, лучше отражают общий тренд, чем те, которые рассчитаны при =0.1, что видно из рис.19.

И, во-вторых, необходимо учитывать то, что при более низких значениях достигается большее сглаживание данных, а это позволяет выделять тренд с большей точностью. Ряд значений, полученных при сглаживающей константе =0.3, при относительной сглаженности все же выказывает гораздо больше отклонений, чем ряд, полученный при =0.1.

Следовательно, для каждого конкретного случая придется выбирать наиболее приемлемое значение сглаживающей константы. Малое значение приводит к большему сглаживанию значений, а большое значение более точно отражает изменения тренда. В большинстве случаев значение сглаживающей константы лежит в пределах от 0.1 до 0.3, однако в ряде случаев возможно использование и других значений , находящихся вне этого диапазона.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]