- •Оглавление
- •Раздел 1.Общая теория статистики 3
- •Раздел 1.Общая теория статистики Лекция 1. Предмет, метод и история возникновения статистики
- •Лекция 2. Статистическое наблюдение
- •Лекция 3. Статистические показатели
- •Лекция 4. Сводка и группировка
- •Лекция 5. Абсолютные и относительные величины
- •Лекция 6. Средние величины
- •Лекция 7. Вариация
- •Лекция 8. Индексы
- •Лекция 9. Ряды динамики
- •Лекция 10. Корреляционно-регрессионный анализ
- •Лекция 11. Выборочное наблюдение
- •Список рекомендуемой литературы
Лекция 10. Корреляционно-регрессионный анализ
Зависимости бывают функциональными или корреляционными.
Переменные X и Y связаны корреляционной зависимостью, если каждому значению одной из них соответствует ряд распределения другой. При этом связь между факторными и результативными признаками проявляется через изменение средних величин.
Пример: Аналитическая группировка.
группы заводов по стоимости ОПФ |
количество заводов |
фонды (млн. руб.) |
Товарная продукция (млн. шт.) |
||
всего (∑) |
|
всего (∑) |
|
||
0,8-3,8 |
4 |
8,7 |
2,2 |
12,9 |
3,2 |
3,8-6,8 |
13 |
62,4 |
4,8 |
94 |
7,2 |
6,8-9,8 |
9 |
70,5 |
7,8 |
101,7 |
11,3 |
9,8-12,8 |
4 |
48,1 |
12 |
76,4 |
19,1 |
итого: |
30 |
189,7 |
- |
285 |
- |
Важной особенностью корреляционных связей является то, что они обнаруживаются не в единичных случаях, а в массе, что требует для исследования наличия значительного количества данных (не менее 15-20).
Задачи корреляционного анализа
1. Определение формы связи между факторными и результативными признаками (выбор математического уравнения, например, y = a+bx);
2. Определение параметров математического уравнения (a, b, c,…- коэффициенты регрессии).
3. Оценка тесноты связи между факторными и результативными признаками;
4. Оценка качества полученного уравнения (модели).
Способы выбора формы связи между факторными и результативными признаками
1. Путём теоретического анализа взаимосвязи между изучаемыми признаками.
2. При помощи аналитической группировки.
3. Графическое изображение показателей (графический анализ).
4. Графическое изображение корреляционной таблицы.
Схема №7: “Классификация корреляционной зависимости”
↓ |
↓ |
парная - корреляционная зависимость между двумя признаками: 1. прямолинейная (линейная) отображается уравнением: y = a+bx 2. криволинейная: 2.1. параболическая: y = a+bx+cx2 2.2. гиперболическая: y = a+b ∙ 1/x 2.3. степенная: y = axb |
многофакторная – корреляционная зависимость между несколькими признаками, отображается следующими уравнениями: y = a+bx1+cx2+dx3 y = ax1b ∙ x2c ∙ x3d… |
Для составления парной корреляционно-регрессионной модели ( = a+bx) нам необходимо определить коэффициенты регрессии (a, b, c,…). Для этого составим систему уравнений, выразив один коэффициент через другой, и решим её.
Правило составления алгоритма системы уравнений
1. Составим квадратичную матрицу из коэффициентов регрессии.
2. Слева, отступив на столбец и строку, сверху – на строку и столбец, запишем наши неизвестные.
3. Перемножим неизвестные слева и сверху на коэффициенты регрессии. Первый элемент первой строки умножим на n – количество наблюдений.
|
|
x |
y |
x |
a a |
b b |
|
a = …
b = …
Показатели корреляции
Для того, чтобы убедиться в статистической значимости уравнения регрессии, необходимо оценить тесноту связи, т.е. разброс фактических данных в поле корреляции или отклонение фактических данных от теоретической линии регрессии.
1. При прямолинейной парной зависимости теснота связи оценивается по парному коэффициенту корреляции: или .
Коэффициент корреляции имеет пределы: .
Если , то существует Если r=0, то связь отсутствует.
функциональная зависимость.
r=1 r=-1 r=0
Если r > 0, то связь прямая; если r < 0, то связь обратная.
Коэффициент корреляции характеризует корреляционную зависимость.
Оценка тесноты связи
Если: r < 0,1 – связь отсутствует;
0,1 ≤ r ≤ 0,3 – связь слабая;
0,3 ≤ r ≤ 0,5 – связь заметная;
0,5 ≤ r ≤ 0,7 – связь умеренная;
0,7 ≤ r ≤ 0,9 – связь высокая;
0,9 ≤ r ≤ 0,99 – связь весьма высокая.
2. При криволинейной зависимости теснота связи оценивается индексом корреляции:
.
3. Чтобы учесть колеблемость отдельных факторов и привести их в единую систему измерения (освободиться от различной размерности), рассчитываются β коэффициенты: .
Они показывают, на сколько сигм (средних квадратических отклонений) изменится результатирующий показатель при изменении x на 1 сигму (СКО).
4. Коэффициент эластичности показывает, на сколько процентов изменится результатирующий показатель, при изменении x на 1%: .
5. Коэффициент детерминации: ,
6. - эмпирическое корреляционное отношение.