- •1. Общие положения
- •1.1. Цель и задачи кп
- •1.2. Содержание и объём кп
- •1.3. Этапы выполнения кп
- •2. Теоретические основы методов, применяемых в кп
- •2.1. Предварительная обработка статистических данных
- •2.2. Вейвлет анализ временного ряда
- •2.3. Сингулярный спектральный анализ временного ряда
- •2.4. Методы ssa-прогнозирования
- •2.4.1. Рекуррентное ssa-прогнозирование
- •2.4.2. Векторное ssa-прогнозирование
- •2.4.3. Формирование доверительных интервалов
- •2.5. Основы аналитического подхода к оценке риска спектральными методами
- •2.5.1. Относительные меры риска
- •Спектральная плотность Fu(ω) распределения дисперсии ущерба
- •Энергетические спектры ущерба Fu(ω) и гармонического сигнала Fг
- •2.5.2. Расчет прогностической меры риска
- •Ряд прогноза y[n]
- •3. Этапы выполнения основной части кп
- •4. Пример анализа временного ряда предложенными методами
- •4.1. Статистика количества почтовых писем, классифицированных как спам
- •4.1.1. Предварительная обработка статистических данных
- •4.1.2. Вейвлет анализ временного ряда
- •4.1.3. Сингулярный спектральный анализ временного ряда
- •4.1.4. Расчет прогностической меры риска
- •Исходный ряд и ряд прогноза
- •Ряд прогноза
- •4.2. Статистика случаев мошенничества с кредитными картами
- •4.2.1. Предварительная обработка статистических данных
- •4.2.2. Вейвлет анализ временного ряда
- •4.2.3. Сингулярный спектральный анализ временного ряда
- •4.2.4. Расчет прогностической меры риска
- •Восстановленный ряд и ряд прогноза
- •Прогноз ущерба от мошеннических операций с распределенными платежными системами на 2012 год
- •Распределения вероятностей нанесения ущербов
- •5. Требования к оформлению и объему кп
- •5.1. Общие требования
- •5.2. Правила оформления текстовых документов
- •5.3. Правила нумерации страниц
- •5.4. Правила оформления иллюстраций
- •5.5. Оформление таблиц
- •5.6. Приложение
- •5.7. Типичные ошибки при выполнении кп
- •5.8. Дополнительные рекомендации по выполнению кп
- •6. Порядок оценки работы
- •Библиографический список Основная литература
- •Дополнительная литература
- •Оглавление
- •394026 Воронеж, Московский просп., 14
2.3. Сингулярный спектральный анализ временного ряда
Сингулярный спектральный анализ зародился в 70х-80х годах прошлого столетия из теории динамических систем. В его основе лежит трансформация временного ряда в матрицу и ее сингулярное разложение [23]. После идентификации компонент сингулярного разложения происходит их группировка, приводящая к разложению исходного ряда на аддитивные компоненты, такие как тренд, колебания (периодики) и шум. При этом метод не требует стационарности ряда, знания модели тренда, а также сведений о наличии в ряде периодических составляющих и их периодах. Также с помощью данного метода можно определить модель тренда и использовать это знание для дальнейшей обработки ряда уже с известной моделью тренда. В зарубежной литературе метод наиболее известен под названием SSA (SingularSpectrumAnalysis).
Математической основой метода SSA является сингулярное разложение [20]. Для успешного применения метода SSA следует последовательно пройти несколько шагов. Пусть имеется вещественнозначный временной ряд F = (fo,…,fN-1) длины N, N > 2. Алгоритм можно разбить на четыре шага: вложение, сингулярное разложение, группировка и диагональное усреднение. Первые два в совокупности называются разложением, последние - восстановлением. Основным параметром алгоритма служит так называемая длина окна L, 1 <L< N. Результатом алгоритма является разбиение временного ряда на аддитивные составляющие.
Первым шагом является процедура вложения, которая переводит исходный временной ряд в последовательность многомерных векторов.
Пусть L — некоторое целое число (длина окна), 1 <L< N. Процедура вложения образует K = N — L +1 векторов вложения
имеющих размерность L.
L – траекторная матрица ряда F
состоит из векторов вложения в качестве столбцов.
Другими словами, траекторная матрица — это матрица
.
Очевидно, что aij = fi+j-2 и матрица X имеет одинаковые элементы на «диагоналях» i + j =const. Таким образом, траекторная матрица является ганкелевой. Существует взаимно-однозначное соответствие между ганкелевыми матрицами размерности и рядами длины N = L + K- 1.
Из-за того, что нет общих рекомендаций по выбору ширины окна, параметр L зависит от решаемой задачи и предварительной информации, известной о ряде. Например, для выделения тренда рекомендуется выбирать ширину окна не слишком большой. С другой стороны, для выделения гармонических колебаний рекомендуется большая ширина окна.
Далее проводится сингулярное разложение матрицы A. Обозначим . Матрица симметричная и неотрицательно определенная, а значит ее собственные числа вещественны и неотрицательны. Представленные в виде собственные числа называют сингулярными значениями матрицы А. Пусть – соответствующие им ортонормированные собственные вектора. Будем называть порядком сингулярного разложения. Обозначим
. (2) Тогда сингулярным разложением матрицы A называется ее представление в виде суммы элементарных матриц
. (3)
Каждая из матриц имеет ранг, равный единице. Поэтому их можно назвать элементарными матрицами. Вектор называют k-м левым сингулярным вектором или просто k-м собственным вектором, вектор – правым сингулярным вектором.
Набор будем называть k-ой собственной тройкой.
Этап группировки. Вид левых и правых сингулярных векторов, трактуемых в SSA как временные ряды, является очень важным для следующего шага метода – группировки [4]. При этом для одномерного SSA левые и правые сингулярные вектора обладают определенной симметрией, так как в этих случаях сингулярные разложения траекторных матриц с длиной окна и эквивалентны.
Процедура группировки формально одинакова для всех разновидностей SSA. На основе разложения (3) процедура группировки делит все множество индексов на непересекающихся подмножеств .
Пусть Тогда результирующая матрица , соответствующая группе , определяется как .Такие матрицы вычисляются для , тем самым разложение (3) может быть записано в сгруппированном виде:
.
Процедура выбора множеств и называется группировкой собственных троек.
Этап диагонального усреднения. На последнем шаге базового алгоритма каждая матрица сгруппированного разложения переводится в новый ряд длины . Для произвольной матрицы X процедуру приведения ее к ганкелевому виду и последующему преобразованию в ряд (обозначим его как Gв) выразим следующим образом. Пусть – матрица размера с элементами , , . Положим , и . Пусть , если и в остальных случаях. Тогда диагональное усреднение переводит матрицу в ряд по формуле
Это выражение соответствует усреднению элементов матрицы вдоль побочных диагоналей : выбор дает , для получаем и т. д. Применив диагональное усреднение к матрицам, полученным на этапе группировки, приходим к разложению исходного ряда в сумму рядов [21].