- •Конспект лекций По предмету «Статистика»
- •Содержание
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения………………………………………………………………………......4
- •Глава 2 Статистический анализ рядов распределения…………………….….14
- •Глава 3 Выборочное наблюдение………………………………………………..26
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ………………………………………………………………………………..33
- •Глава 5 Статистический анализ временных рядов……………………………45
- •Глава 1 Введение. Понятие статистики, предмет и методология. Основные определения.
- •1.1 Понятие статистики. Предмет и объект изучения статистики
- •1.2 Методология статистики
- •1.3 Этапы статистического исследования
- •1.3.1 Статистическое наблюдение
- •1.3.2 Сводка и группировка данных
- •1.4 Статистические показатели
- •1.4.1 Средняя арифметическая простая
- •1.4.2 Средняя арифметическая взвешенная
- •1.4.3 Средняя гармоническая
- •1.4.4 Средняя геометрическая
- •1.4.5 Средняя квадратическая
- •Глава 2 Статистический анализ рядов распределения
- •2.1 Построение ряда распределения
- •2.2 Графическое изображение вариационных рядов
- •2.3 Показатели центра и структуры распределения
- •2.4 Показатели вариации
- •Среднее линейное отклонение
- •3. Дисперсия
- •4. Среднее квадратическое (стандартное) отклонение
- •Относительное линейное отклонение
- •2.5 Характеристика формы распределения
- •2.6 Выравнивание эмпирических распределений и оценка соответствия эмпирического распределения теоретическому
- •Глава 3 Выборочное наблюдение
- •3.1 Способы отбора единиц в выборочную совокупность
- •3.2 Виды выборки
- •3.3 Ошибка репрезентативности (ошибка выборки)
- •3.4 Правило сложения дисперсий
- •3.5 Ошибка выборки для доли
- •3.6 Определение объема выборки
- •3.7 Особенности малой выборки
- •Глава 4 Статистическое изучение связей. Корреляционно-регрессионный анализ
- •Функционально (жестко-детерминированная) связь
- •2) Статистические связи и зависимости (стохастически детерминированная).
- •4.1 Причины возникновения корреляционной зависимости
- •4.2 Условия применения методов корреляционно-регрессионного анализа
- •4.3 Графическое изображение корреляционной зависимости
- •Показатели корреляции
- •Коэффициент корреляции
- •Коэффициент детерминации
- •Корреляционное отношение
- •Индекс корреляции
- •4.5 Регрессионный анализ. Парное и множественное уравнение регрессии
- •4.5.1 Уравнение парной регрессии
- •4.5.2 Уравнение множественной регрессии
- •4.5.3 Построение матрицы парных коэффициентов корреляции. Отбор факторов
- •4.5.4 Коэффициенты эластичности и β-коэффициенты
- •4.6 Оценка статистической значимости уравнения регрессии и его параметров
- •4.6.1 Оценка статистической значимости уравнения регрессии
- •4.6.2 Оценка статистической значимости параметров уравнения
- •Глава 5 Статистический анализ временных рядов (рядов динамики)
- •5.1 Показатели изменения уровней временного ряда
- •1) Абсолютный прирост;
- •4) Абсолютное значение 1% прироста.
- •Абсолютный прирост
- •1. Абсолютный цепной прирост
- •2. Абсолютный прирост базисный
- •Темп роста (коэффициент роста)
- •5.3.2 Изучение основной тенденции временного ряда. Выравнивание рядов динамики
- •5.3.3 Экстраполяционное прогнозирование на основе трендовых моделей
- •5.4 Автокорреляция в рядах динамики (автокорреляция уровней временных рядов)
- •5.5 Корреляция рядов динамики
- •5.6 Изучение сезонности в динамических рядах
- •5.7 Статистические индексы. Индексный анализ
- •1) Индивидуальные (I)
- •2) Общие индексы (сводные, I)
- •5.7.1 Агрегатные индексы
- •5.7.2 Индексы Ласпейреса и Пааше
- •5.7.3 Идеальный индекс Фишера
- •5.7.4 Индексы средние из индивидуальных
- •5.7.3 Индексы-дефляторы
5.3.2 Изучение основной тенденции временного ряда. Выравнивание рядов динамики
Существует два метода выравнивания:
механическое;
аналитическое.
Любое выравнивание предполагает замену фактических уровней изучаемого ряда на теоретические, полученные в результате определенных расчетов и в той или иной мере очищенные от влияния случайных колебаний.
Механическое выравнивание осуществляется двумя способами:
укрупнение интервалов
метод скользящей средней
Пример: имеются данные о выпуске продукции на предприятии по месяцам.
месяц |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
Выпуск продукции (млн. руб.) |
5,1 |
5,4 |
5,2 |
5,3 |
5,6 |
5,8 |
5,6 |
5,9 |
6,1 |
6,0 |
5,9 |
6,2 |
1) Метод укрупнения интервалов предполагает объединение временных периодов и расчет по ним либо суммарных значений показателей, либо средних величин.
Результат укрупнения интервалов будет выглядеть:
квартал |
Выпуск продукции (млн. руб) |
|
в абсолютном выражении |
среднемесячный |
|
I |
15,7 |
5,2 |
II |
16,7 |
5,6 |
III |
17,6 |
5,9 |
IV |
18,1 |
6,0 |
2) Метод скользящей средней.
Предполагает расчеты среднего уровня за определенный временной интервал и дальнейшее продвижение интервала на один шаг.
Рассчитанные средние (выровненные) уровни относятся к середине интервала, по которому рассчитываются средние
Если период скольжения – четная величина, то применяют прием центрирования.
Прием центрирования выражается в подсчете средней арифметической величины из значений, полученных по двум шагам скольжения.
Увеличение периода скольжения позволяет более отчетливо проявиться основной тенденции, однако существенно укорачивает изучаемый временной ряд, что неблагоприятно может сказаться на качестве трендовой модели.
Аналитическое выравнивание позволяет не только выявить основную тенденцию ряда, но и получить аналитическую форму тренда. Уравнение тренда – это парное уравнение регрессии, в качестве фактора в котором выступает время:
, где y – уровень временного ряда
a, b – параметры уравнения тренда
t – время.
Расчет параметров трендовой модели осуществляется с использованием метода наименьших квадратов.
Прежде чем получить трендовую модель, нужно выбрать уравнение тренда, лучшим образом описывающее реальную тенденцию изучаемого ряда. Выбор уравнения тренда может быть осуществлен:
На основе графического представления временного ряда. На графике по оси абсцисс откладываются периоды или моменты времени, по оси ординат – уровни временного ряда.
Теоретический анализ объекта исследования и анализ показателей изменения уровней динамического ряда. Очень часто используется метод конечных разностей. Так если примерно постоянными являются первые разности (абсолютные приросты), то можно использовать полином первой степени (линейную функцию). Если примерно постоянными являются вторые разности (ускорение), то следует использовать полином второй степени и так далее.
В настоящее время выбор лучшей функции для описания тренда формализован, то есть осуществляется с использованием пакетов прикладных программ на основе определенных критериев.
Поскольку основная задача построения уравнения тренда – это лучшая аппроксимация имеющихся фактических данных, то среди критериев отбора можно выделить следующие:
минимизация суммы квадратов отклонений фактических значений от значений, полученных в уравнении тренда
, где
- фактические уровни ряда;
- теоретические, выровненные, полученные на основе уравнения тренда уровни ряда.
стандартная ошибка
, где
n – длина динамического ряда;
m – число факторов, включенных в анализ.
среднее линейное (абсолютное) отклонение.
Средняя ошибка аппроксимации
F-критерий Фишера → max
коэффициент детерминации R2 → max
Основным критерием качества трендовой модели является оценка остатков трендовой модели на наличие автокорреляции. Остатки – это разность между фактическими значениями уровней временного ряда и выровненными значениями, то есть полученными по уравнению тренда.
Автокорреляция в остатках – зависимость последующих остатков от предшествующих.
Оценка автокорреляции в остатках может быть проведена с использованием парного коэффициента корреляции или специального критерия – критерия Дарвина-Уотсона (D-W).
-
-
-
…
-
- остаток;
- фактическое значение;
- теоретическое значение.
- остаток периода, предшествующего периоду t.
Корреляционная зависимость между lt и lt-1 – автокорреляция в остатках.
Наличие автокорреляции в остатках свидетельствует о наличии тенденции в остатках. Поскольку трендовая модель должна полностью описывать основную тенденцию ряда, то сохранение тенденции в остатках говорит о том, что модель не может быть признана удовлетворительной.
Коэффициент автокорреляции Езекиэла и Фокса
, -1 ≤ rq ≤ 1
Близость значения коэффициента к нулю означает отсутствие автокорреляции. Если величина близка к единице – наличие автокорреляции в остатках.
Критерий Дарвина-Уотсона
Между критерием Дарвина-Уотсона и коэффициентом автокорреляции существует соотношение:
D-W ≈ 2(1 – ra)
Исходя из этого соотношения:
если в остатках нет автокорреляции (то есть ra =0), то D-W = 2
если в остатках фиксируется полная положительная корреляция, то D-W = 0
если ra = -1 , то D-W = 4
0 ≤ D-W ≤ 4
Близость к нулю и к четырем – присутствие автокорреляции в остатках от трендовой модели, к 2 – отсутствие.
Чтобы избежать субъективности оценок, обычно пользуются таблицами критерия D-W. По таблицам исходя из длины динамического ряда (числа уровней в динамическом ряду) и числа факторов в уравнении тренда находят границы критерия D-W1 и D-W2.
D-Wфакт < D-W1 - автокорреляция в остатках присутствует
D-Wфакт > D-W2 - автокорреляция в остатках отсутствует
D-W1 ≤ D-W факт ≤ D-W2 - ситуация неопределенности, что требует дальнейшее исследование ряда и в частности построение ряда в условиях увеличения длины ряда.