Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по статистике.docx
Скачиваний:
80
Добавлен:
13.03.2016
Размер:
824.25 Кб
Скачать

9.3 Корреляционно-регрессионный анализ

Данный метод является самым распространенным методом изучения взаимосвязей между изучаемыми признаками. Его преимущество состоит в том, что он дает количественную оценку взаимосвязи, устанавливает ее тесноту и может быть использован при прогнозировании.

Корреляционно-регрессионный анализ начинается с графического метода. С помощью графика-поля корреляции выявляется факт наличия связи, направление связи и форма связи.

Прямолинейная зависимость.

Если с помощью графического метода установлено, что точки колеблются вокруг прямой линии, то уравнение однофакторной линейной зависимости имеет вид:

, (9.4)

где - теоретические значения результатов признака, полученные по

уравнению регрессии,

- коэффициенты (параметры) уравнения регрессии.

Параметр показывает насколько в среднем изменяется результативный признак, если факторный признак изменится на одну единицу.

Параметр показывает, чему был равен результативный признак, если факторный признак принять за ноль.

Параметры находятсяметодом наименьших квадратов:

Для нахождения решается система двух линейных уравнений:

(9.5)

Определив значение ии подставив их в уравнение (9.5) находятся значения зависимости только от заданного значенияx.

Для оценки тесноты взаимосвязи между факторным и результативными признаками рассчитывается коэффициент корреляции, который определяется по формуле:

Коэффициент корреляции находится в пределах от -1 до 1. При , связь отсутствует. Еслипринимает значения 0-0,3 связь считается слабой, 0,31-0,5, связь умеренная, 0,51-0,7 связь заметная, а еслиxy оказывается >0,7 связь сильная. При обратной связи коэффициент имеет знак «минус».

Квадрат коэффициента корреляции представляет собой коэффициент детерминации более предпочтительнее для измерения связи, так как он может быть использован для измерения не только линейных, но и нелинейных связей. Он может быть выражен в процентах и принимает значение в интервале от 0 до 1. Чем ближе к единице, тем теснее связь и наоборот.

Рассмотрим применение корреляционно-регрессионного анализа на примере изучения влияния стажа работы на производительность труда работников (исходные данные взяты из таблицы 9.1).

Вначале с целью определения формы связи строится поле корреляции (рис. 9.2).

Производительность труда

Стаж работы

y

x

Рис. 9.2 Взаимосвязь между длительностью стажа и производительностью

труда работников

Из рисунка видно, что точки расположились кучно от левой части к его правой верхней части, это говорит о том, что связь между изучаемыми признаками существует, а по формуле она линейная. Аналитическую зависимость между рассматриваемыми признаками можно выразить уравнением прямой линии:

Найти параметр можно определить из системы уравнений (9.4). А для решения данной системы применяется способ определителей, позволяющий сводить к минимуму неточности определений в расчетах параметров уравнений регрессии.

Для определения исоставляется расчетная таблица 9.4.

Таблица 9.4 Расчетная таблица

Стаж работы, x

Производительность труда, y

xy

1

4

5

7

10

11

12

15

17

19

20

22

140

152

145

148

160

172

165

175

180

176

185

190

1

16

25

49

100

121

144

225

289

361

400

484

140

608

725

1036

1600

1892

1980

2625

3060

3344

3700

4180

19600

23104

21025

21904

25600

29584

27225

30625

32400

30976

34225

36100

140

146,9

149,2

153,8

160,7

163

165,3

172,2

176,8

181,4

183,7

188,3

Итого:

1143

1988

2215

24890

332368

1988

По итоговым данным таблицы определяются параметры уравнения регрессии:

Таким образом, уравнение регрессии принимает вид:

Параметры показывают: 2, говорит, что при увеличении стажа работников на 1 год, производительность труда в среднем увеличивается на 2 детали в смену. Если принять стаж работы за ноль, а учитывать влияние других факторов производительность труда в смену составит 138 деталей.

Коэффициент корреляции, определяемый по формуле (9.5), составит:

Коэффициент корреляции показывает, что взаимосвязь между признаками сильная.

Для нахождения теоретических значений результативного признака в полученное уравнение регрессии вместо x подставляется значение факторного признака (стаж работы).

Полученные значения записываются в таблице 9.4, а на рис.9.3 изображены фактическая и теоретическая линии.

y

x

Фактическая линия

Теоретическая линия

Рис. 9.3 Фактическая и теоретическая линия