- •Министерство образования и науки Республики Казахстан
- •1. Учебная программа дисциплины – Syllabus
- •1. 1. Данные о преподавателях:
- •1.1 Данные о дисциплине:
- •Выписка из учебного плана
- •1.5. Краткое описание дисциплины
- •1.6. Перечень и виды заданий и график их выполнения:
- •Виды заданий и сроки их выполнения
- •1.7. Список литературы
- •1.8. Контроль и оценка знаний
- •Распределение рейтинговых баллов по видам контроля
- •Календарный график сдачи всех видов контроля
- •Оценка знаний студентов
- •2. Содержание Активного раздаточного материала
- •2.1 Тематический план курса составляется в виде таблицы, где указываются наименование темы и количество академических часов, предусмотренных для каждой темы. Тематический план курса
- •2.2 Конспект лекционных занятий
- •Глава 1. Основные понятия и определения статистики
- •Тема 2. Показатели описательной статистики. Среднее, дисперсия, стандартное отклонение, эксцесс, асимметрия, интервалы. Компьютерные технологии получения дескриптивной статистики.
- •Глава 2. Выборки.
- •Тема 5. Анализ одной выборки. Анализ однородности выборки. Доверительные интервалы для среднего. Доверительные интервалы для средних выборок. Компьютерные технологии анализа.
- •Тема 6. Анализ двух выборок. Выявление достоверности различий. Параметрические и непараметрические методы анализа выборок. Компьютерные технологии анализа одной выборки.
- •Глава 3. Анализ статданных.
- •Тема 7. Дисперсионный анализ статданных. Однофакторный дисперсионный анализ статистических данных. F- тест для для дисперсий. Компьютерные технологии анализа.
- •Тема 8. Корреляционный анализ статданных. Коэффицент корреляции Пирсона. Коэффициент ранговой корреляции. Ложная и истинная корреляция Компьютерные технологии анализа.
- •Глава 4. Регрессионный анализ.
- •Тема 9. Регрессионный анализ статданных. Простая линейная регрессии. Оценивание параметров линейной регрессиии методом наименьших квадратов, коэффициент детерминации.
- •Тема 10. Оценка существенности параметров линейной регрессии. Оценка качества регрессии f-критерий Фишера, t-статистика. Проверка значимости параметров регрессии. Понятие нелинейной регрессии.
- •Тема 11. Множественная регрессия. Многомерная регрессионая модель. Фиктивные переменные. Кодирование значений качественных переменных. Мультиколлинеарность.
- •Глава 5. Анализ временных рядов.
- •Тема 12. Анализ статданных в виде временных рядов. Временные ряды и их характеристики. Аддитивная и мультипликативная модель. Декомпозиция временного ряда.
- •Тема 13. Анализ и получение тренда. Методы аналитического выравнивания. Метод скользящего среднего. Метод экспоненциального сглаживания. Оценка точности трендовой модели.
- •Тема 14. Модели временных рядов. Понятие об авторегрессионных моделях временных рядов. Коэффицент автокорреляции и автокорреляционная функция.Тест Дарбина-Уотсона.
- •Тема 15. Анализ моделей временных рядов. Решение проблемы автокорреляции. Учет сезонности. Коинтеграция временных рядов.Тест Энгла - Гренжера. Современные тенденции статанализа.
- •2.3 Планы лабораторных занятий
- •Технология построения трендов в Microsoft Excel Порядок выполнения лабораторной работы
- •Форматирование метки линии тренда.
- •Задание на выполнение лабораторной работы:
- •Задание на выполнение лабораторной работы
- •2.4 Планы занятий в рамках самостоятельной работы студентов под руководством преподаватля (срсп)
- •Тема 1. Функции распределения дискретной случайной величины. Биномиальное распределение. Применение компьютерных технологий при статистическом исследовании биномиального распределения. (2 ч.)
- •Тема 3. Функции распределения дискретной случайной величины. Распределение Пуассона. Применение компьютерных технологий при статистическом исследовании распределения Пуассона. (2 ч.)
- •Тема 4. Функции распределения непрерывной случайной величины. Гауссово распределение. Применение компьютерных технологий при статистическом исследовании Гауссово распределения. (2 ч.)
- •Тема 5. Функции распределения непрерывной случайной величины. Распределение хи-квадрат. Применение компьютерных технологий при статистическом исследовании распределения хи-квадрат. (2 ч.)
- •Тема 6. Функции распределения непрерывной случайной величины. Распределение Стьюдента. Применение компьютерных технологий при статистическом исследовании распределения Стьюдента. (2 ч.)
- •Тема 7. Функции распределения непрерывной случайной величины. Распределение Фишера. Применение компьютерных технологий при статистическом исследовании распределения Фишера. (2 ч.)
- •Тема 9. Генерация случайных чисел. Применение компьютерных технологий при генерации случайных чисел. (2 ч.)
- •Тема 10. Статистические гипотезы. Одновыборочный z-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного z-теста для средних величин. (2 ч.)
- •Тема 11. Статистические гипотезы. Двухвыборочный z-тест для средних величин. Применение компьютерных технологий при проведении двухвыборочного z-теста для средних величин. (2 ч.)
- •Тема 12. Статистические гипотезы. Одновыборочный t-тест для средних величин. Применение компьютерных технологий при проведении одновыборочного t-теста для средних величин. (2 ч.)
- •Тема 15. Статистические гипотезы. Парный двухвыборочный t-тест для средних величин. Применение компьютерных технологий при проведении парного двухвыборочного t-теста для средних величин. (2 ч.)
- •2.5 Планы занятий в рамках самостоятельной работы студентов (срс)
- •Тема 1. Регрессионный анализ с применением компьютерных технологий. Интерпретация результатов.
- •Тема 2. Регрессионный анализ. Метод наименьших квадратов (мнк).Интерпретация результатов.
- •Тема 3. Регрессионный анализ. Анализ вариации зависимой переменной.
- •Тема 4. Регрессионный анализ. Условия Гаусса-Маркова по классической нормальной линейной регрессионной модели.
- •Тема 5. Регрессионный анализ. Стандартная ошибка регрессии.
- •Тема 6. Регрессионный анализ. Стандартные ошибки коэффициентов регрессии.
- •Тема 7. Регрессионный анализ. Проверка гипотез по коэффициентам регрессии.
- •Тема 8. Регрессионный анализ. Нелинейные регрессии.
- •Тема 9. Регрессионный анализ. Прогнозирование в регрессионных моделях.
- •Тема 10. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Получение тренда. Интерпретация результатов.
- •Тема 11. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Исследование автокорреляции данных временного ряда.
- •Тема 12. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест Дарбина-Уотсона.
- •Тема 13. Временные ряды. Анализ временных рядов с применением компьютерных технологий. Тест на коинтеграцию на основе критерия Энгла-Грэнжера.
- •Тема 14. Статистический программный инструментарий. Обзор статистических функций ms Excel.
- •Тема 15. Статистический программный инструментарий. Обзор возможностей пакета "Анализа данных" ms Excel.
- •2.6. Тестовые задания для самоконтроля с указанием ключей правильных ответов
- •24. Имеют ли в общем случае смысловую нагрузку свободный член уравнения линейной регрессии?
- •25. Что такое корреляционные поля?
- •26. Что такое авторегрессионая модель временного ряда?
- •27. Что означает регрессионная модель с лагированными переменными?
- •28. Какой показатель определяется отношением дисперсии результативного признака регрессии к общей дисперсии результативного признака?
- •29. Какой критерий применяется для проверки гипотезы - средние двух выборок относятся к одной и той же совокупности?
- •30. Какой метод применяется для проверки гипотезы - относится та или иной вариант к данной статистической совокупности?
- •Перечень экзаменационных вопросов по пройденному курсу
- •Глоссарий
- •Выходные сведения
Тема 14. Модели временных рядов. Понятие об авторегрессионных моделях временных рядов. Коэффицент автокорреляции и автокорреляционная функция.Тест Дарбина-Уотсона.
Периодическая и сезонная зависимость (сезонность) представляет собой другой общий тип компонент временного ряда. Периодическая зависимость может быть формально определена как корреляционная зависимость порядка k между каждым i-м элементом ряда и ik-м элементом. Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда). Величину k обычно называют лагом (иногда используют другие термины: сдвиг, запаздывание). Если ошибка измерения не слишком большая, то сезонность можно определить визуально, рассматривая поведение членов ряда через каждые k временных единиц.
Автокорреляция данных временного ряда
Автокорреляция — это корреляционная связь между значениями одного и того же случайного процесса X(t) в моменты времени и. Функция, характеризующая эту связь, называетсяавтокорреляционной. Корреляционная связь в этом случае измеряется с помощью коэффициента автокорреляции.
При анализе временных рядов автокорреляционная функция характеризует внутреннюю зависимость между значениями временного ряда и значениями того же самого ряда, но сдвинутыми на некоторый промежуток (лаг) времени. Иначе говоря, это корреляция членов ряда и передвинутых на L единиц времени членов того же ряда: и. ЗапаздываниеL называется лагом и представляет собой положительное целое число. Поскольку самое широкое распространение получили модели с лагом, равным одному году, то иногда автокорреляция определяется как корреляционная зависимость между значениями для одноименных месяцев года временного ряда. Обычный тип автокорреляции, который можно еще назвать серийной корреляцией первого порядка, характеризуется тем, что слагаемое ошибки в текущий момент времени прямо связано со слагаемым ошибки в предыдущий момент времени. В этом случае, используя для обозначения времени индекс t, модель простой линейной регрессии можно записать в виде:
с условием (*)
где - величина ошибки в моментt;
- коэффициент автокорреляции с запаздыванием на один период, измеряющий корреляцию между последовательными слагаемыми ошибки;
—нормально распределенные независимые ошибки с математическим ожиданием 0 и дисперсией .
Уравнение (*) показывает, что величина одного слагаемого ошибки непосредственно влияет на величину следующего. Значение коэффициента автокорреляции, где -1 << 1, указывает на степень серийной корреляции. Еслиравно 0, то серийной корреляции нет и значения ошибок независимы (=).
Коэффициент автокорреляции может использоваться для того, чтобы определить, являются ли данные случайными, имеется ли тренд (нестационарность), являются ли данные стационарными, есть ли в них сезонные колебания.
Коэффициент автокорреляции с запаздыванием на к моментoв наблюдения, т.е. между наблюдениями иопределяется по формуле:
где - коэффициент автокорреляции для запаздывания на к периодов;
- среднее значение ряда;
- наблюдение в момент времени t;
- наблюдение в момент времени t - k
По аналогии, коэффициент автокорреляции с запаздыванием на один период , корреляция междуи(корреляция первого порядка), вычисляется по формуле:
Коэффициент автокорреляции с запаздыванием на два периода , или корреляция междуи(корреляция второго порядка), вычисляется по формуле:
В том случае, если ряд данных случаен, коэффициенты автокорреляции между идля любого запаздывания близки к нулю. Последовательные значения временного ряда не связаны друг с другом.
Если у ряда имеется тренд, то значения иимеют сильную корреляцию, причем коэффициенты автокорреляции существенно отличны от нуля для первых нескольких периодов запаздывания, а с увеличением периода постепенно убывают до нуля.
В том случае, если ряд имеет сезонную компоненту, значительный коэффициент автокорреляции будет наблюдаться для периодов запаздывания, равных сезонному периоду или кратных ему. Сезонный период запаздывания равен 4 для ежеквартальных данных и 12 для ежемесячных данных.
Коэффициент автокорреляции имеет выборочное распределение, которое может быть аппроксимировано нормальной кривой со средним значением, равным нулю, и среднеквадратическим отклонением 1/.
Для того чтобы графически показать автокорреляционную функцию, используют коррелограмму (автокоррелограмму), представляющую значения коэффициентов автокорреляции для последовательности лагов из определенного диапазона (например, от 1 до 30).
При изучении коррелограмм следует помнить, что автокорреляции последовательных лагов формально зависимы между собой. Рассмотрим следующий пример. Если первый член ряда тесно связан со вторым, а второй с третьим, то первый элемент может также каким-то образом зависеть от третьего и т.д. Это приводит к тому, что периодическая зависимость может существенно измениться после удаления автокорреляций первого порядка, т.е. после взятия разности с лагом 1. Взятие разности также удаляет тренд, который обычно подавляет другие автокорреляции. Например, если имеется устойчивый линейный тренд, то каждое наблюдение в значительной степени является линейной функцией предыдущего наблюдения.
Тест Дарбина-Уотсона
Автокорреляция затрудняет применение ряда классических методов анализа временных рядов. В моделях регрессии, описывающих зависимости между случайными значениями взаимосвязанных величин, она снижает эффективность применения метода наименьших квадратов. Поэтому были выработаны и широко применяются специальные статистические приемы для ее выявления (например, критерий Дарбина-Уотсона) и исключения (например, преобразование временного ряда в ряд значений разностей между соседними членами), а также для модификации самого метода наименьших квадратов.
Статистика Дарбина-Уотсона предназначена для обнаружения автокорреляции первого порядка. Она основана на изучении остатков уравнения регрессии и определяет, можно ли считать равным нулю параметр , имеющийся в уравнении. Для этого выбирается одна из двух гипотез.
,
.
В качестве альтернативной гипотезы выбирается > 0, поскольку временные ряды, которые обычно рассматриваются в бизнесе и экономике, чаще всего имеют положительную автокорреляцию.
В том случае, если регрессионная модель не свободна, остатки будут автокоррелирующими. Поэтому в критерии Дарбина-Уотсона выводы строятся на основании величин остатков, полученных при регрессионном анализе. Статистика Дарбина-Уотсона определяется следующим равенством:
где -остаток для периода времени t;
- остаток для периода времени t- 1.
Критерий Дарбина-Уотсона изменяется в диапазоне 0<DW<4. При отсутствии автокорреляции DW= 2. Поэтому, если выполняется указанное условие, можно сделать следующий вывод:
• 0 < DW < нижняя граница, в ряду есть положительная автокорреляция;
• (4 - нижняя граница) < DW< 4, в ряду есть отрицательная автокорреляция;
• нижняя граница < DW< (4 - верхняя граница), автокорреляция в ряду отсутствует;
• нижняя граница<DW<верхняя граница или (4-верхняя граница)<DW<(4-нижняя граница), нужны дополнительные исследования.
Упоминаемые выше граничные значения обычно приводятся в специальных таблицах, называемых "Граничные значения для статистик Дарбина-Уотсона".
Литература:
1осн. [349-389], 2осн. [208-240], 3осн. [272-281], 4осн. [72-83], 4доп. [163-168].
Контрольные вопросы:
1. Что означает наличие корреляционной зависимости во временных рядах?
2. Как проявляются автокорреляции данных временного ряда?
3. Что означает понятие лага при анализе временных рядов?
4. Назовите основные модели, выражающими тенденцию развития временного ряда?
5. Для чего применяется тест Дарбина-Уотсона ?