- •Три этапа развития статистики
- •Основные этапы развития статистики
- •2. Предмет и задачи статистики
- •3.Основные понятия теории статистики
- •Сбор информации;
- •1.Организационные и методологические вопросы статистического наблюдения
- •2. Ошибки статистического наблюдения
- •Классификация ошибок статистического наблюдения
- •3. Организационные формы, виды и способы статистического наблюдения
- •1. Сводка и группировка (понятие и основные виды)
- •2.Ряды распределения: атрибутивные и вариационные
- •3.Статистические таблицы и графики, требования к составлению таблиц
- •Макет таблицы
- •4. Классификация как особый вид группировки. Роль классификаций в статистике
- •2. Классификация относительных показателей
- •Классификация относительных показателей
- •3. Понятие «средняя величина» и основные виды средних величин в статистике Понятие «средняя величина»
- •Различные виды средних величин и способы их расчета
- •В табл. 4.2 те же обозначения, что и в табл. 4.1.
- •Вспомогательная таблица для расчета простой и взвешенной средней арифметической
- •Исходные данные и вспомогательные расчеты для определения средней гармонической
- •1. Понятие вариации и основные виды показателей вариации
- •Вспомогательная таблица для расчета показателей вариации
- •На основе исходных данных вначале подсчитываются средние величины, а затем находятся отклонения от средних. Рекомендуется в расчетах показателей вариации пользоваться формулой средней взвешенной.
- •2.Свойства средней арифметической и дисперсии
- •Свойства дисперсии
- •(Свойство минимальности).
- •3. Изучение структурных характеристик вариационного ряда
- •2. Показатели концентрации и дифференциации
- •3. Показатели структурных сдвигов
- •Лекция №7. Методология организации выборочных наблюдений5.
- •1.Задачи выборочного наблюдения и различные способы формирования выборки
- •Способы отбора единиц из генеральной совокупности
- •2. Понятие «ошибка выборки» и способы ее расчета
- •3. Расчет оптимальной численности выборки
- •Лекция №8. Методы и показатели оценки тесноты статистических взаимосвязей.
- •1.Понятие «статистическая взаимосвязь»
- •2. Классификация методов оценки тесноты статистических связей
- •3. Аналитические показатели оценки тесноты взаимосвязей между количественно измеримыми признаками
- •Вспомогательная таблица для расчета рангового коэффициента корреляции Спирмена
- •4.Способы оценки тесноты взаимосвязей между качественными признаками
- •Лекция №9. Статистическое изучение динамики социально -экономических процессов и явлений.
- •2. Аналитические показатели динамики
- •Аналитические показатели динамики
- •3. Сглаживание (выравнивание) динамических рядов: механическое и аналитическое сглаживание
- •Лекция №10. Построение уравнений тренда и уравнений парной линейной регрессии
- •1. Сущность метода наименьших квадратов
- •2. Построение уравнений регрессии
- •Расчет параметров парной линейной регрессии
- •3. Построение уравнений тренда
- •Вспомогательная таблица для расчета параметров уравнений линейного и квадратического тренда
- •4. Расчет корреляционного отношения на основе уравнения регрессии
- •Способы отбора факторных переменных.
- •Исходные данные для построения уравнений регрессии
- •После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:
- •Матрица коэффициентов парной корреляции
- •Использование метода наименьших квадратов для построения нелинейных уравнений регрессии
- •Нелинейные относительно оцениваемых параметров
- •1. Понятие «статистический индекс»
- •2.Различные виды статистических индексов и способы их расчета
- •Различные виды агрегатных индексов
- •Вспомогательная таблица для расчета агрегатных индексов по формулам Ласпейреса и Пааше
- •3. Сущность индексного метода в статистике
- •Примеры решения задач индексным методом.
- •1. Понятие «прогноз» и виды прогнозов
- •2. Сущность статистических методов прогнозирования и требования к исходной статистической информации
- •3.Прогнозирование на основе уравнений тренда
- •1.Кластерный анализ
- •Дискриминантный анализ
- •3.Факторный анализ (метод главных компонент)
После подсчета сумм в нижней строке таблицы, находим линейный коэффициент корреляции:
r(x1 , x4) =
Аналогично рассчитаем коэффициенты парной корреляции между всеми остальными факторами и запишем их значения в виде матрицы:
Таблица 11.3
Матрица коэффициентов парной корреляции
|
x1 |
x2 |
x3 |
x4 |
x5 |
y |
x1 |
1 |
0,5662 |
0,8356 |
-0,4303 |
0,9094 |
-0,2587 |
x2 |
0,5662 |
1 |
0,1355 |
0,4684 |
0,7996 |
0,5692 |
x3 |
0,8356 |
0,1355 |
1 |
-0,6870 |
0,5900 |
-0,5848 |
x4 |
-0,4303 |
0,4684 |
-0,6870 |
1 |
-0,1370 |
0,8955 |
x5 |
0,9094 |
0,7996 |
0,5900 |
-0,1370 |
1 |
0,1019 |
y |
-0,2587 |
0,5692 |
-0,5848 |
0,8955 |
0,1019 |
1 |
Легко убедиться, что определитель этой матрицы равен 0,00000332, то есть очень близок к нулю. Следовательно, мультиколлинеарность в данной системе факторов отсутствует. Проанализировав коэффициенты парной корреляции, можно увидеть, что наиболее тесная связь между фактором x4 и y. Следовательно, целесообразно построить уравнение парной линейной регрессии y = a0 + a1 x4.
Теперь рассмотрим, какие факторы можно включить в модель двухфакторной линейной множественной регрессии.
Коэффициенты парной корреляции между x1 и x5, а также между x1 и x3 превышают 0,8. Следовательно, эти факторы включать в модель не целесообразно. Также очень высок (близок к 0,8) коэффициент корреляции между факторами x2 и x5. К тому же коэффициент корреляции между фактором x5 и y очень мал.
В целом, анализ матрицы коэффициентов парной корреляции показывает, что наиболее целесообразно включать в модель следующие пары факторов: x2 и x3 , либо x2 и x4.
Принципиально можно было бы также включить в модель факторы x3 и x4. Коэффициент корреляции между ними менее 0,7, а коэффициент корреляции между x3 и y около –0,6, то есть почти такого же порядка.
Теоретически можно также построить модель трехфакторной линейной множественной регрессии, включив в модель три фактора: x2 , x3 и x4.
Итак, мы пришли к выводу, что целесообразно выполнить расчет параметров пяти различных уравнений регрессии:
1) y = a0 + a1 x4;
2) y = a0 + a1 x2+ a2 x3;
3) y = a0 + a1 x2+ a2 x4;
4) y = a0 + a1 x3+ a2 x4;
5) y = a0 + a1 x2 + a1 x3+ a2 x4;
Для дальнейшего анализа необходимо рассчитать, пользуясь методом наименьших квадратов параметры каждого из этих уравнений, а затем сравнить их между собой по значениям ошибки аппроксимации и индекса детерминации. Чем меньше ошибка аппроксимации и чем ближе значение индекса детерминации к 1, тем лучше соответствующее уравнение описывает существующую статистическую зависимость, Существуют и другие, более сложные методы анализа построенных уравнений регрессии, но они более подробно изучаются в дисциплине «Эконометрика».