Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
теория статистики.doc
Скачиваний:
165
Добавлен:
23.03.2015
Размер:
2.64 Mб
Скачать

13.3. Измерение степени тесноты корреляционной связи между двумя признаками

Понятно, что одни факторы влияют сильнее, другие слабее на результативный признак.

Характеристика силы воздействия одних факторов на другие даётся при помощи показателей степени тесноты корреляционной связи между двумя признаками, к ним относятся:

1. Коэффициент корреляции знаков.

2. Линейный коэффициент корреляции.

3. Коэффициент корреляции рангов

1. Коэффициент корреляции знаков

,

где - число совпадений знаков отклонения индивидуальных величин от средней факторного и результативного признаков;- число несовпадений знаков отклонений.

2. Линейный коэффициент корреляции является более совершенным показателем степени тесноты связи. При расчёте этого показателя учитываются не только знаки отклонений, но и сами величины таких отклонений.

Есть много вариантов этой формулы.

Много учёных занималось вопросами корреляции и в целом стохастических зависимостей (проявляется в массе случаев).

Множественная корреляция.

Коэффициент множественной корреляции: ,

где - общая дисперсия фактических данных результативного признака, т.е. дисперсияy.

- остаточная дисперсия, характеризующая вариацию y за счёт факторов не включённых в уравнение регрессии.

- отражает тесноту связи между вариацией зависимой переменной и вариациями всех включённых в анализ независимых переменных

0<<1 чем ближе к 1, тем более сильная связь, к 0 - не все факторы учтены, не подходящая форма уравнения.

3. Коэффициент корреляции рангов (коэффициент связи качественных признаков)

Позволяет измерить тесноту связи между качественными признаками, которые не поддаются выражению числом. Каждой единице совокупности присваивается порядковый номер в ряду, который будет упорядочен по уровню признака. Таким образом, ряд значений ранжируется, а номер каждой отдельной единицы будет её рангом.

Можно получить представление, о корреляционной связи сопоставляя ранги факторного и результативного признаков. Метод Спирмена и метод Кенделла.

13.4. Уравнения регрессии, их виды

Изучение корреляционных зависимостей основывается на исследовании таких связей между переменными, при которых значение одной переменной, которую можно применять за зависимую переменную «в среднем» изменяется в зависимости от того, какие значения принимает другая переменная, рассматриваемая, как причина по отношению к зависимой переменной.

Изучение зависимостей ведёт к поиску аналитических связей в виде формул (т.е. функций, который записываются составлением уравнений регрессии).

А на графическом поле строится теоретическая линия регрессииэто та линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление, основную тенденцию связи.

Наиболее часто для характеристики связей экономических явлений используются такие типы функций:

1. Линейную: .

2. Гиперболическую: .

3. Показательную: .

4. Степенную: .

13.5. Корреляционно-регрессивные модели (крм),

их применение в анализе и прогнозе

На практике чаще всего изменение изучаемого признака зависит от действия нескольких причин. В таких случаях изменение корреляционной связи не может ограничиться парными зависимостями, и в анализ необходимо включить другие признаки-факторы существенно влияющие на изучаемую переменную.

Отбор факторов для построения многофакторных моделей производится на основе качественного и количественного анализа социально-экономических явлений с использованием статистических критериев.

Корреляционно-регрессивной моделью системы взаимосвязанных признаков является такое уравнение регрессии, которое включает основные факторы.

Построение многофакторных регрессионных моделей позволяет дать количественное описание основных закономерностей изучаемых явлений, выделить существенные факторы, обуславливающие изменение экономических показателей, и оценить их влияние.

Полученные модели в основном используются в двух направлениях:

1. Для сравнительного анализа

2. В прогнозировании

Возможность применения методов корреляционно-регрессивного анализа ещё в недалёком прошлом сдерживалась высокой трудоёмкостью необходимых расчётов. Сегодня широкое распространение получили пакеты прикладных программ по статистике, ликвидировав эти ограничения.

С целью расширения возможностей экономического анализа используют коэффициент эластичности:

, где

- среднее значение факторного признака

- среднее значение результативного признака

- коэффициент регрессии при соответствующем факторном признаке.

Показывает на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака.

- устанавливают как справочную величину.

Следует различать функциональные и корреляционные связи. В отличие от функциональной зависимости, при которой каждому значению одной переменной строго соответствует одно определённое значение другой переменной, зависимость, при которой одному значению переменной (х) может соответствовать (в силу наслоения действия других причин) множество значений другой переменной (y), называют корреляционной. Корреляционная зависимость проявляется лишь на основе массового наблюдения.

Примером корреляционной зависимости может служить зависимость производительности труда от стажа работы рабочих, зависимость урожайности от срока сева, зависимость годового удоя коров от количества отёлов и т.п.

Наиболее простым случаем корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативными и одним из факторных).

Основными задачами при изучении корреляционных зависимостей являются:

1. Отыскание математической формулы, которая бы выражала эту зависимость y от x.

2. Измерение тесноты такой зависимости.

Решение первой задачи, т.е. определение формы связи с последующим отысканием параметров уравнения, называется нахождением уравнения связи (уравнения регрессии). Показатели, рассматриваемые как функция х, обозначают (читается: «игрек, выровненный по икс»).

Возможны различные формы связи:

1. Прямолинейная:

2. Криволинейная в виде: а) параболы второго порядка (или высших порядков) б) гиперболыв) показательной функциии т.д.

Параметры для всех уравнений связи чаще всего определяют из так называемой системы нормальных уравнений, отвечающих требованию «метода наименьших квадратов» (МНК). Это требование можно записать как или, при линейной зависимости,т.е. требуется определить, при каких значениях параметровисумма квадратов отклоненийy от будет минимальной. Найдя частные производные указанной суммы поии приравняв их к нулю, легко записать систему уравнений, решение которой и дают параметры искомой функции, т.е. уравнения регрессии.

Так, система нормальных уравнений при линейной зависимости имеет вид:

Если связь выражена параболой второго порядка

,

то система нормальных уравнений для отыскания параметров ,,выглядит следующим образом:

Вторая задача – измерение тесноты зависимости – для всех форм связи может быть решена с помощью исчисления теоретического корреляционного отношения :

где - дисперсия в ряду выровненных значений результативного показателя;

- дисперсия в ряду фактических значений y.

Так как дисперсия отражает вариацию в рядутолько за счёт вариации фактораx, а дисперсия отражает вариациюy за счёт всех факторов, то их отношение, именуемое теоретическим коэффициентом детерминации, показывает, какой удельный вес в общей дисперсии ряда y занимает дисперсия, вызываемая вариацией фактора х. квадратный корень из отношения этих дисперсий даёт нам теоретическое корреляционное отношение. Если =, то это означает, что роль других факторов в вариацииy сведена на нет, и отношение:

означает полную зависимость вариации y от х.

Если =0, то это означает, что вариациях никак не влияет на вариацию y, и в этом случае .

Следовательно, максимальное значение, которое может принимать корреляционное отношение, равно 1, минимальное значение – 0.

Математически легко доказывается, что в случае линейной зависимости корреляционное отношение может быть заменено выражениемкоторое называют линейным коэффициентом корреляции и обозначают r, т.е. где- коэффициент регрессии в уравнении связи,и- соответственно среднее квадратическое отклонение в рядуx и в ряду y.

Линейный коэффициент корреляции можно выразить и другими формулами, тождественными первой, в частности:

или а также

Линейный коэффициент корреляции может принимать по модулю значения от 0 до 1 (знак «+» при прямой зависимости и знак «–» при обратной зависимости).

Рассмотрим решение задачи по этой теме.

Задача 1

Пусть по 10 однотипным предприятиям имеются следующие данные о выпуске продукции (х) в тыс. ед. и о расходе условного топлива (y) в тоннах (графы 1 и 2 таблицы).

Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии y по x) и измерить тесноту зависимости между ними.

Решение.

а) рассматривая уравнение регрессии в форме линейной функции вида , параметры данного уравнения (и) найдём из системы нормальных уравнений

X

y

x2

xy

=1,16+0,547x

y2

5

6

8

8

10

10

14

20

20

24

4

4

6

5

7

8

8

10

12

16

25

36

64

64

100

100

196

400

400

576

20

24

48

40

70

80

112

200

240

384

3,9

4,4

5,5

5,5

6,6

6,6

8,8

12,1

12,1

14,3

16

16

36

25

49

64

64

100

144

156

125

80

1961

1218

80

770

Необходимые для решения суммы ,,рассчитаны выше в таблице. Подставляем их в уравнения и решаем систему:

Отсюда

Подставляя в это уравнение последовательно значения х=5,6,8,10 и т.д., получаем выравненные (теоретические) значения результативного показателя (графа 5 таблицы).

Поскольку параметры уравнения регрессии являются оценочными, то для каждого из них рассчитывается средняя ошибка, т.е. .

Конкретный расчёт ошибок для ипо данным нашего примера приведён далее.

б) Для измерения тесноты зависимости между y и x воспользуемся прежде всего линейным коэффициентом корреляции (поскольку зависимость рассматривалась линейно):

1) применяем формулу .

Находим

Определяем , предварительно найдяи

Отсюда

Значение линейного коэффициента корреляции (т.е. близкое к единице) характеризует не только меру тесноты зависимости вариацииy от вариации x, но и степень близости этой зависимости к линейной;

2) воспользуемся ещё одной формулой линейного коэффициента корреляции:

т.е. результат тот же.

При расчёте коэффициента корреляции очень важно оценить его значимость. Оценка значимости (существенности) линейного коэффициента корреляции основана на сопоставлении значения r с его средней квадратической ошибкой ().

Средняя ошибка коэффициента корреляции при n>50 рассчитывается приближённо по формуле

Если при этом коэффициент корреляции r превышает свою среднюю ошибку больше чем в 3 раза, т.е. еслито он считается значимым, а связь - реальной.

При n<30 значимость коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого рассчитывается фактическое (расчётное) значение критерия:

Которое сопоставляется с определяемым по Приложению 9, для числа степеней свободыи заданного уровня значимости (обычно).

Если > r считается значимым, а связь – реальной. Если

< то считается, что связь междуx и y отсутствует и значение r, отличное от нуля, получено случайно.

В рассматриваемом примере средняя ошибка коэффициента корреляции

а

По таблице приложений [1] находим, что при числе степеней свободы и уровнетабличное (критическое, пороговое)t равно 2,306, т.е. =2,306.

Поскольку фактическое (расчётное) t больше табличного, т.е. >то линейный коэффициент корреляцииr=0,96 считается значимым, а связь между x и yреальной.

Контрольные вопросы к теме:

1.Какие признаки являются результативными, факторными.

2. Какие два основных вида связей между явлениями различают. Объясните их суть.

3. Расскажите классификацию взаимосвязей.

4.  В чем заключаются задачи статистики при изучении связей между явлениями.

5. Расскажите, какие вы знаете методы выявления наличия корреляционной связи между двумя признаками.

6. При помощи, каких показателей дается характеристика силы воздействия одних факторов на другие.

7. Расскажите о коэффициенте множественной корреляции.

8. Что такое «корреляционно-регрессивные модели» и каково их применение в анализе и прогнозе.

9. Расскажите о линейном коэффициенте корреляции.

10. В чем суть метода наименьших квадратов.

Библиографический список

1. Ефимова, М Р. Общая теория статистики : учебник / М. Р. Ефимова, Е. В. Петрова, В. Н. Румянцев, 2-е изд., испр. и доп. М.: ИНФРА-М, 2004. 414 с.

2. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: учебник / О. Э. Башина, А. А. Спирина, М.: Финансы и статистика, 2006. 506 с.

3. Бабурин, В. Т. Общая теория статистики : учебник / В.Т. Бабурин, под ред. А. А. Спирина, О. Э. Башиной, 5-е изд., перераб. и доп. М.: Финансы и статистика, 2007. 440 с.

4. Кремер, Н. Ш. Теория вероятностей и математическая статистика : учебник для вузов по экономическим специальностям / Н. Ш. Кремер. 3-е изд., перераб. и доп. М.: ЮНИТИ-ДАНА, 2007. 551 с.

5. Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике : учебное пособие / В. Е. Гмурман, 11-е изд., перераб. и доп. М.: Высшее образование, 2006. 404 с.

6. Гмурман, В. Е. Теория вероятностей и математическая статистика : учебное пособие для вузов / В. Е. Гмурман, 9-е изд., стер. М.: Высш. шк., 2003. 479 с.

7. Общая теория статистики : учебное пособие для вузов / М. Р. Ефимова, Е. В. Петрова, В. Н. Румянцев ; общ. ред. М. Р. Ефимовой, М. : ИНФРА-М, 2008. 412 с.

8. Статистика : учебное пособие для вузов по специальности "Финансы и кредит" / И. И. Елисеева и др.; под ред. И. И. Елисеевой ; Санкт-Петербург. гос. ун-т экономики и финансов; М. : Высшее образование, 2008. 565 с.

9. Артамонов, В. Н. Общая теория статистики : учебное пособие. Челябинск: «Зауралье», 2006. 181 с.

10. Артамонов, В.Н. Рабочая тетрадь по теории статистики. Челябинск: изд-во Челяб. гос. ун-та, 2005. 32 с.

Учебное издание