Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

СтатистикаЛевина 2012

.pdf
Скачиваний:
147
Добавлен:
10.05.2015
Размер:
4.83 Mб
Скачать

Значимость коэффициентов линейного уравнения регрессии a и b оценивается по t-критерию Cтьюдента (n < 30):

(7.20)

(7.21)

где

(7.22)

Эмпирическое значение t-критерия сравнивается с табличным значением t-распределения Cтьюдента с уровнем значимости 0,01 или 0,05 и числом степеней свободы ( n - 2 ). Параметр признается значимым, если эмпирическое значение tэ больше табличного tт .

Аналогично проводится оценка коэффициента корреляции с помощью t-критерия, который определяется по формуле:

(7.23)

Если эмпирическое значение tr оказывается больше табличного, то линейный коэффициент корреляции признается значимым.

Пример: Имеются следующие данные по десяти предприятиям:

№ предприятия

1

2

3

4

5

6

7

8

9

10

 

 

 

 

 

 

 

 

 

 

 

Объем электропотребления,

3,7

1

2,0

2,1

1,6

2

2,3

1,5

2,8

4,2

кВТч.

 

 

 

 

 

 

 

 

 

 

Продукция, тыс.шт.

51

55

67

68

71

86

97

99

112

123

 

 

 

 

 

 

 

 

 

 

 

По исходным данным :

1)постройте однофакторную регрессионную модель зависимости между объемом потребления электроэнергии и количеством продукции ;

2)вычислите коэффициенты эластичности, показатели тесноты корреляционной связи;

170

3)проверьте найденную модель на адекватность;

4)сделайте выводы, постройте графики.

Предположим, что между объемом выпуска продукции и объемом электропотребления существует линейная корреляционная связь, которая выражается уравнением прямой:

Пусть

x (факторный признак) – объем выпуска продукции,

y (результативный признак) – объем электропотребления.

Для определения формы корреляционной связи необходимо вычислить параметры уравнения прямой. Для этого построим следующую таблицу:

 

Исходные данные

 

 

 

 

Расчетные значения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Объем

Объем

 

 

 

 

 

 

 

 

 

у ух 2

 

продук-

электро-

xy

 

 

х2

 

у2

 

ух

пред-я

 

ции

потреб-

 

 

 

 

 

 

 

 

 

 

 

 

тыс.шт.,

ления,

 

 

 

 

 

 

 

 

 

 

 

 

х

кВТч., y

 

 

 

 

 

 

 

 

 

 

1

 

51

3,7

188,7

 

2.601

 

13,69

 

1,81

3,5721

2

 

55

1

55

 

3.025

 

1

 

1,88

0,7744

3

 

67

2

134

 

4.489

 

4

 

2,07

0,0049

4

 

68

2,1

142,8

 

4.624

 

4,41

 

2,08

0,0004

5

 

71

1,6

113,6

 

5.041

 

2,56

 

2,13

0,2809

6

 

86

2

172

 

7.396

 

4

 

2,37

0,1369

7

 

97

2,3

223,1

 

9.409

 

5,29

 

2,54

0,0576

8

 

99

1,5

148,5

 

9.801

 

2,25

 

2,58

1,1664

9

 

112

2,8

313,6

 

12.544

 

7,84

 

2,78

0,0004

10

 

123

4,2

516,6

 

15.129

 

17,64

 

2,96

1,5376

Итого:

 

829

23,2

2.007,9

 

74.059

 

62,68

 

23,2

7,5316

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В сред-

 

 

 

 

 

 

 

 

 

 

 

 

 

нем

 

82,9

2,32

200,79

 

7405,9

 

6,268

 

2,32

0,75316

 

 

 

 

 

 

 

 

 

Воспользуемся для расчета параметров a и b формулами

(5.3) , (5.5) и (5.4) соответственно:

 

 

 

 

 

 

 

a

23,2 74.059 2.007,9 829

 

 

53.619,7

1,005

 

 

 

10 74059 829 829

 

 

 

 

 

53..349

 

 

 

 

 

 

 

 

171

 

 

 

 

 

 

 

b

10 2.007,9 23,2 829

 

846,2

0,016

 

 

 

53.349

 

 

53.349

 

a

2,32 0,016 82,9

1,005

 

 

1) Следовательно, уравнение регрессии имеет вид: yx 1,005 0,016x

Теоретическое значение объема электропотребления (ух) составит:

-для первого предприятия: yx 1,005 0,016 51 1,81

-для второго предприятия:

yx 1,005 0,016 55 1,88

-……………………. и т.д.

-для десятого предприятия:

yx 1,005 0,016 123 2,96

При правильном расчете параметров регрессионного уравнения должно соблюдаться равенство фактического и теоретического значений объема потребления, т.е.

у ух

В нашем случае y 23,2 , a y x 23,2 , следовател ьно y yx.

В нашем уравнении регрессии параметр b = 0,016 показывает, что с увеличением выпуска продукции на 1тыс. шт., объем потребления электроэнергии увеличивается на 0,016 кВТч.

2)По формуле (5.7) найдем средний коэффициент эластичности:

Э0,016 82,9 0,57

2,32

172

Коэффициент эластичности, равный 0,57 , показывает, что с увеличением объема выпуска продукции на 1% объем электропотребления возрастает на 0,57%.

Измерим тесноту корреляционной связи между выпуском продукции и объемом электропотребления.

Линейный коэффициент корреляции определяем по форму-

ле (5.11) :

 

 

 

2007,9

829 23,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

 

10

 

 

 

 

 

 

0,389

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

829

2

 

 

 

 

23,2

2

 

 

 

 

74059

 

 

 

62,68

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

Для расчета теоретического корреляционного отношения необходимо предварительно вычислить дисперсии по формулам:

 

2

, y y

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

y

x

,

y

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

y y

x

2

 

 

 

 

y y

x

 

 

 

 

 

 

 

 

 

 

 

 

 

0,75316

;

 

 

 

 

 

 

 

 

n

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y 2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

y

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6,268 2,32

 

6,268 5,3124

0,8856 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

n2

 

 

 

 

 

2n

 

 

 

0,8856 0,75316 0,13244

 

y

x

y

 

 

y y

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теоретическое

 

корреляционное

отношение по

формуле

(5.14) будет равняться:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,13244

 

 

 

0,387

 

 

 

 

 

 

 

 

 

0,8856

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент детерминации равен:

 

 

 

2

0,1495

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

173

Коэффициент детерминации 0,1495 означает, что вариация объема выпуска продукции примерно на 15% объясняется вариацией объема электропотребления и примерно на 85% – прочими факторами.

Индекс корреляции найдем по формуле (5.17) :

R 1 0,75316 0,387 0,8856

Таким образом, показатели тесноты корреляционной связи показывают умеренную связь между выпуском продукции и объемом электропотребленияr R . Так как, то можно сделать заключение, что гипотеза о линейной форме связи подтверждена.

Проведем оценку адекватности регрессионной модели yх = 1,005 + 0,016х с помощью F – критерия Фишера (5.19):

F

0,13244

 

10 2

1,407

 

 

 

 

э

0,75316

 

2 1

 

 

 

 

 

 

Табличное значение Fт с уровнем значимости

и чис-

лом степеней свободы (2 - 1), (10 - 2) = 5,32. Таким образом, Fэ < Fт , следовательно уравнение регрессии нельзя признать адекватным.

Оценим значимость параметров уравнения регрессии с помощью t-критерия Стьюдента по формулам (5.20) и (5.21):

 

0,05

 

 

 

 

 

 

 

ta

1,005

 

10 2

3,275

0,86785

 

 

 

 

 

 

 

 

 

 

 

 

 

tb

0,016

 

 

 

10 2

23,09740245 1,204

0,86785

 

 

 

Значение x вычисляется по формуле (5.22):

 

 

74.059

 

829

2

 

 

 

 

 

 

 

 

x

 

 

 

 

 

533,49 23,097

 

 

 

 

10

10

 

 

 

 

174

Табличное значение t-критерия с уровнем значимости 0,05 и числом степеней свободы (n - 2) = 2,306.

Таким образом, tэ параметра b < tт , следовательно, параметры уравнения регрессии нельзя признать значимыми.

Значимость коэффициента корреляции оценим с помощью t- критерия по формуле (5.23):

tr 0,389

10 2

1,194

 

1 0,3892

 

 

Эмпирическое значение tr < tт , следовательно, коэффициент корреляции нельзя признать значимым.

3) Вычислим ошибку аппроксимации по формуле:

 

 

 

 

 

1

 

 

 

 

у ух

 

 

100%

 

 

 

 

 

 

 

n

1

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3,15533 31,55%

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, параметры уравнения и показатели тесноты, и уравнение регрессии признаются незначимыми, ошибка аппроксимации 31,55%, коэффициент детерминации примерно равен 15%, поэтому построенная регрессионная модель зависимости электропотребления от объема выпуска продукции ух = 1,005 + 0,016х непригодна для анализа и прогноза.

5

 

 

 

 

4

 

 

 

yx=1,005+0,016x

3

 

 

 

 

у

 

 

 

 

2

 

 

 

 

1

 

 

 

 

0

 

х

 

 

0

50

100

150

 

Зависимость объема потребления электроэнергии (у) от

 

объема выпуска продукции (х)

 

175

_______ – теоретическая линия

– фактическая линия

5.7. Простейшие методы установления тесноты связи

1.Коэффициент корреляции знака (коэффициент Фехнера),

2.Коэффициент корреляции рангов (Спирмэна),

3.Коэффициент ассоциации и коэффициент контингенции.

1) Коэффициент Фехнера основан на оценке степени согласованности знаков отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных пар признаков:

Кф u v , где u v

u– число совпадений знаков отклонений индивидуальных значений от средней;

v – число несовпадений знаков отклонений индивидуальных значений от средней.

Коэффициент Фехнера может изменяться от –1 до +1 :

Если u > v Кф > 0, следовательно, это свидетельствует о возможном наличии прямой связи;

Если u < v Кф < 0, следовательно, это дает основание предположить наличие обратной связи ;

Если u = v Kф = 0, следовательно связи нет. Рассмотрим расчет коэффициента Фехнера на следующем

примере.

Пример: Имеются следующие данные о размере заработной платы (результативный признак) и проценте выполнения нормы выработки.

176

 

 

 

 

 

 

 

 

 

 

 

 

Знаки отклонений индивидуаль-

 

 

 

 

 

 

 

 

 

 

 

 

% выполнения

З/п за месяц,

ных значений признака от сред-

Совпадение (U)

 

 

 

 

 

 

Порядковый

нормы выработ-

 

 

 

 

 

 

руб.,

 

 

 

 

ней

или несовпаде-

Nx

Ny

d = Nx - Ny

d

2

 

№ рабочего

 

ки,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

 

 

 

 

 

 

 

 

ние (V) знаков

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

xi x

 

yi y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

3

4

 

 

 

5

 

 

6

7

8

9

10

 

 

 

 

1

 

186

 

 

1,734

+

 

 

 

+

 

 

U

18

19

-1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

180

 

 

1,69

+

 

 

 

-

 

 

V

15

9,5

5,5

30,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

190

 

 

1,72

+

 

 

 

+

 

 

U

19

17

2

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

184

 

 

1,725

+

 

 

 

+

 

 

U

17

18

-1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

181

 

 

1,714

+

 

 

 

+

 

 

U

16

16

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

200

 

 

1,738

+

 

 

 

+

 

 

U

20

20

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

 

176

 

 

1,702

+

 

 

 

+

 

 

U

14

14,5

-0,5

0,25

 

 

 

 

8

 

140

 

 

1,674

-

 

 

 

-

 

 

U

5

6

-1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

144

 

 

1,677

-

 

 

 

-

 

 

U

6

7

-1

1

 

 

 

 

10

 

136

 

 

1,67

-

 

 

 

-

 

 

U

4

4,5

-0,5

0,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

 

164

 

 

1,7

+

 

 

 

+

 

 

U

10

12,5

-2,5

6,25

 

 

 

 

12

 

170

 

 

1,69

+

 

 

 

-

 

 

V

13

9,5

3,5

12,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

 

169

 

 

1,702

+

 

 

 

+

 

 

U

12

14,5

-2,5

6,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14

 

155

 

 

1,7

-

 

 

 

+

 

 

V

7

12,5

-5,5

30,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

 

158

 

 

1,685

-

 

 

 

-

 

 

U

9

8

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

 

156

 

 

1,67

-

 

 

 

-

 

 

U

8

4,5

3,5

12,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

 

168

 

 

1,695

+

 

 

 

+

 

 

U

11

11

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

 

115

 

 

1,654

-

 

 

 

-

 

 

U

1

1

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

 

116

 

 

1,66

-

 

 

 

-

 

 

U

2

2

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

119

 

 

1,662

-

 

 

 

-

 

 

U

3

3

0

0

 

 

 

Итого:

 

3207

 

 

33,862

 

 

 

 

 

 

 

 

 

 

 

 

107

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3.207

160%

 

y

33.862

1.693 руб.

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

177

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6 d 2 n n 2 1
17 3

Таким образом, полученная величина коэффициента Фехнера свидетельствует о возможности наличии прямой связи.

Коэффициент Фехнера практически решает ту же задачу, которая ставится при построении группировочных и корреляционных таблиц, т.е. отвечает на вопрос о наличии и направлении коореляционной связи между признаками. Если же построена корреляционная или группировочная таблицы, то дополнительный расчет коэффициента Фехнера не имеет практи-

ческой значимости.

Кф 17 3 0,7

2) Коэффициент корреляции ранга рассчитывается не по фактическим значениям показателей, а

по рангам, которые присваиваются этим фактическим значениям в порядке возрастания или убывания. Если имеется несколько одинаковых фактических значений, то им присваивается одинаковый ранг, рассчитанный как средняя арифметическая суммы рангов, деленная на число показателей, у которых совпадают значения.

1 , где

d = Nx - Ny – разность рангов каждой пары значений х и у; n – число наблюдений.

 

6 107

 

642

 

1

20 202 1 1

 

 

0,92

7.980

Коэффициент Спирмэна изменяется от -1 до +1 3) Коэффициент ассоциации и контингенции.

При исследовании тесноты связи между 2-мя качественными альтернативными признаками. Для их вычисления строится четырех клеточная таблица, называемая также таблица ― Четырех полей‖.

Коэффициент ассоциации:

К ас

 

ad bc

, где

 

 

 

ad bc

a

 

b

 

 

 

a , b , c , d – значения частот в 4 – х клеточной таблице:

 

 

 

 

 

c

 

d

 

 

 

178

 

 

 

Коэффициент контингенции:

Кконт

 

ad bc

 

a b c d a c b d

 

 

Коэффициент контингенции изменяется от –1 до +1, но всегда < коэффициента ассоциации.

Пример: На основе опроса 540 чел., работающих в частной сфере деятельности и 540 чел., работающих в бюджетных организациях. Получены следующие ответы на вопрос, довольны ли они своей заработной платой:

 

 

 

 

 

Довольные

 

 

Недоволь-

 

 

Работающие

 

 

заработной

 

 

ные

ИТОГО

 

 

 

 

 

платой

 

 

 

заработной

 

 

 

 

 

 

 

 

 

 

платой

 

В частной сфере деятельности

 

 

а

 

 

 

b

а+b

 

 

 

 

 

486

 

 

 

54

540

В бюджетной сфере деятельности

c

 

 

 

d

c+d

 

 

 

 

 

189

 

 

 

351

540

 

 

 

 

 

a+c

 

 

 

b+d

 

ИТОГО :

 

 

675

 

 

 

405

1.080

ас

486 351 54 189

 

 

170.586 10.206

 

160.380

0,887

 

 

 

 

486 351 54 189

170.586 10.206

 

180.792

 

 

Таким образом, по результатам опроса можно сделать убедительный вывод об увеличении числа довольных среди работающих в частной сфере деятельности, так как степень тесноты связи достаточно велика.

Однако, в тех случаях, когда хотя бы один из четырех показателей в таблице «Четырех полей» отсутствует, величина коэффициента ассоциации будет равна 1, что дает преувеличенную оценку степени тесноты связи между признаками. Поэтому, предпочтение отдается коэффициенту контингенции.

конт

 

486

351 54 189

 

 

160.380

0,568

 

 

 

 

 

540

405 675 540

 

 

282.340

 

179