Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
тема 2 пример.doc
Скачиваний:
14
Добавлен:
14.05.2015
Размер:
225.79 Кб
Скачать

Расчет коэффициента корреляции между внешнеторговым оборотом и валовым региональным продуктом Белгородской области за 2003-2012 гг.

Годы

Внешнеторговый оборот, млрд. долл. США

(х)

Валовой региональный продукт, млрд. руб. (y)

xy

x2

y2

1

2

3

4

5

6

2003

1,62

76,05

122,85

2,61

5784,29

2004

2,29

114,41

262,03

5,25

13089,49

2005

3,40

144,99

492,23

11,53

21021,46

2006

4,31

178,85

770,36

18,55

31985,93

2007

6,38

237,01

1511,86

40,69

56175,30

2008

8,82

317,66

2801,00

77,75

100905,52

2009

3,90

304,35

1186,64

15,20

92626,06

2010

6,91

398,36

2750,77

47,68

158691,81

2011

10,50

511,66

5370,11

110,15

261799,03

2012

8,87

565,38

5017,24

78,75

319654,54

Всего:

56,98

2848,72

20285,09

408,16

1061733,43

Среднее значение:

5,70

284,87

2028,51

40,82

106173,34

Параметр уравнения а1 определим по формуле:

Коэффициент ковариации – определяет количественно тесноту линейной зависимости:

Тогда

Параметр уравнения регрессии а0 можно найти по формуле:

или (если не известен параметр А1)

Следовательно, Уравнение регрессии (ух = а0 + а1х) примет вид

ух = 7,909532+ 48,58956 х

При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого параметра регрессии. При этом выясняется, насколько вычисленные параметры характерны для отображения комплекса условий, то есть, не являются ли их значения действием лишь случайных факторов.

Значимость параметров в простой линейной регрессии осуществляют с помощью t - критерия Стьюдента. Вычисляют расчетные значения t - критерия для параметра а0 по формуле:

для параметра а1

,

где: n – объем выборки

- среднее квадратическое отклонение результативного признака «у» от его теоретического значения.

- среднее квадратическое отклонение факторного признака «х» от общей средней.

Годы

ВТО, млрд. долл. США

(х)

ВРП, млрд. руб. (y)

Выровненные значения

1

2

3

7

8

9

10

11

12

2003

1,62

76,05

7,909532+ 48,58956*1,62=

86,62

-10,57

111,82

-4,08

16,65

39301,2

0,139

2004

2,29

114,41

119,18

-4,77

22,75

-3,41

11,63

27453,3

0,042

2005

3,40

144,99

173,11

-28,12

790,96

-2,30

5,29

12489,4

0,194

2006

4,31

178,85

217,33

-38,48

1480,75

-1,39

1,93

4561,6

0,215

2007

6,38

237,01

317,91

-80,90

6544,96

0,68

0,46

1091,7

0,341

2008

8,82

317,66

436,47

-118,81

14115,69

3,12

9,73

22982,4

0,374

2009

3,90

304,35

197,41

106,94

11436,42

-1,80

3,24

7649,5

0,351

2010

6,91

398,36

343,66

54,70

2991,72

1,21

1,46

3456,7

0,137

2011

10,50

511,66

518,10

-6,44

41,47

4,80

23,04

54396,2

0,013

2012

8,87

565,38

7,909532+ 48,58956*8,87=

438,90

126,48

15997,46

3,17

10,05

23724,9

0,224

Всего:

56,98

2848,72

2848,70

 

53534,00

 

83,49

197106,8

2,030

Среднее значение:

5,70

284,87

5353,40

8,35

19710,7

Вычисленные значения сравнивают с критическими (tтабл), которые определяются по таблице Стьюдента с учетом принятого уровня значимости (α) и числом степеней свободы вариации (ν).

Уровень значимости - это вероятность, с которой может быть опровергнута гипотеза о том или ином законе распределения (например 2-м доверительным вероятностям 0,95 и 0,99 соответственно соответствует 5% и 1% уровень значимости, т.е. 1 = 0,05, 2 = 0,01).

Число степеней свободы  - представляет собой число свободно варьирующих элементов совокупности:

1 = 1,

2 = n – 2,

где n – объем выборки;

В социально-экономических исследованиях уровень значимости  обычно применяют равным 0,05.

Параметр будет значимым, если tрасч tтабл ( в этом случае будет невероятно, что найденное значение параметров обусловлено влиянием только случайных факторов).

Или в случае, если известен коэффициент корреляции :

.

Для =0,05 и числу степеней свободы, равное 10, =2,2281

Поскольку >, то линейный коэффициент корреляции является значимым.

Проверка адекватности модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту связей между «х» и «у».

При линейной регрессии таким показателем будет коэффициент корреляции, который равен:

Для практических вычислений при малом числе наблюдений n ≤ (20/30) линейный коэффициент корреляции удобней вычислить по следующей формуле:

Линейный коэффициент корреляции принимает значение в пределах –1 ≤ r ≤ +1, при положительном значении – связь прямая, при отрицательном – связь обратная.

Чем ближе r к единице, тем связь теснее, при r = 1 связь функциональная, при r = 0 связи нет (но это при линейной модели, при иной спецификации модели связь может оказаться достаточно тесной).

Определим коэффициент корреляции :

Таким образом, коэффициент регрессии показывает, что связь высокая.

Квадрат линейного коэффициента корреляции называют линейным коэффициентом детерминации, характеризующим долю результативного признака «у» объясняемую регрессией, следовательно 1 – r2 доля дисперсии объясняемая другими случайными факторами.

коэффициент детерминации

При нелинейной регрессии рассчитывают теоретическое корреляционное отношение (индекс корреляции), получающееся в результате сравнения среднего квадрата отклонений выровненных значений результативного признака, (рассчитанного по уравнению регрессии) со средним квадратом отклонений фактических значений результативного признака.

,

т.к. в основе расчета корреляционного отношения лежит правило сложения дисперсий:

Подкоренное выражение корреляционного отношения представляет собой коэффициент детерминации.

.

Оценка значимости уравнения в целом осуществляется с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза (Н0), при которой коэффициент регрессии а1 = 0 и следовательно факторный признак «х» не оказывает влияния на результативный признак «у».

Если нулевая гипотеза справедлива, тогда объясненная и остаточная дисперсия не отличаются друг от друга. Для нулевой гипотезы необходимо опровержение, чтобы объясненная дисперсия превышала остаточную в несколько раз. Для этого выполняется сравнение фактических (F фактич) и критических (F таблич) значений F-критерия Фишера.

F фактическая рассчитывается из соотношения факторной и остаточной дисперсии рассчитанных на одну степень свободы

,

где: n – число единиц совокупности

m – число параметров в уравнении регрессии (при переменных «х»).

Полученное значение F- критерия сравнивают с табличным для принятого уровня значимости 0,05 или 0,01 и числом степеней свободы 1 = m-1 и 2 = n-m.

Если Fфакт  Fтабл, то данное уравнение статистически значимо, т.е. доля вариаций обусловленная регрессией намного превышает случайную ошибку.

Принято считать, что уравнение регрессии пригодно для практического использования в том случае, если Fфакт  Fтабл не менее, чем в четыре раза.

Фактические значения результативного признака отличаются от теоретических. Чем меньше это отличие, тем ближе эмпирические значения к теоретическим, и тем лучше качество модели. В некоторых случаях для оценки адекватности уравнения регрессии помимо сравнения величин остаточных дисперсий рекомендуется вычислять среднюю ошибку апроксимации. Величина отклонений фактических и теоретических значений результативного признака выраженные в процентах к фактическим значениям называется относительной ошибкой аппроксимации.

Поскольку у-ух может быть как отрицательным так и положительным, то относительные ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю:

– относительная ошибка аппроксимации.

Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению определяют среднюю ошибку аппроксимации, рассчитываемую по формуле средней арифметической простой.

Возможна и иная форма расчета:

Если средняя ошибка апроксимации находится в пределах не более 8-10%, то это свидетельствует о хорошем подборе модели к исходным данным.

средняя ошибка аппроксимации;

применение критерия минимальности остаточной дисперсии и показателя средней ошибки аппроксимации является достаточно надёжным способом отбора адекватных математических моделей.

Для удобства интерпретации коэффициента регрессии (параметра а1) используют коэффициент эластичности. Он показывает среднее процентное изменение результативного признака при изменении факторного признака на один процент. В парной линейной регрессии средний коэффициент эластичности вычисляется по формуле: