16. Множественная корреляция.Расчет совокупного коэффициента и частных коэффициентов корреляции.
Под множественной корреляцией понимается: исследование статистической зависимости результативного признака от нескольких факторных признаков. Основная задача МК сводится к вычислению значения переменной y, соответствующего определенным значениям двух или большего числа факторов.
Одним из важнейших требований является отбор наиболее существенных факторов, влияющих на результативный признак. При этом в уравнение нельзя вводить факторы, которые находятся между собой в функциональной или близкой к ней зависимости.
Выбор той или иной формы связи при многофакторной корреляции диктуется рядом соображений:
-выбранная функция должна отражать существующую закономерность явлений
-выбранная функция должна иметь наиболее простой вид
-число рассматриваемых факторов должно быть ограничено
-выделенные для исследования факторы не могут находиться между собой в функциональной или близкой к ней связи.
Уравнение линейной регрессии при множ-й корреляции имеет вид:
_
yx = ao + a1x1 + a2x2+ ...+anxn
Рассмотрим частные случаи регрессии:
а)двухфакторный комплекс
_
yxz= ao + a1 x+ a2z
Система имеет вид:
nao+ a1åx + a2åz=åy
aoåx + a1åx2 + a2åxz=åyx
aoåz + a1åxz +a2åz2 =åyz
б)трехфакторный комплекс
_
yxzv=ao+ a1x+ a2z +a3v
Cистема:
nao+ a1åx+a2åz +a3åv=åy
aoåx+ a1åx2 + a2åxz+a3åxv=åyx
aoåz + a1åxz +a2å z2+a3åzv=åyz
aoåv+a1åxv+a2åzv+a3åv2=åyv
В статистике возникает необходимость измерить тесноту связи в многофакторном комплексе. Для этого пользуются совокупным коэффициентом множественной корреляции.
_ _
R1,2,3=Ö1- s2(1,2,3) ,где s2(1,2,3) -остаточная дисперсия за
s2 счет неучтенных факторов.
s2 -общая дисперсия
½R½£1
по величине совокупного коэффициента множ-й корреляции можно судить не только о тесноте связи между признаками и о правильности выбора формы связи, но и о правильности учтенных при анализе факторов.
Для двухфакторного комплекса совок-й коэфф-т корреляции имеет вид
_________________
Ry(xz)=Ö r2xy + r2yz - 2rxyryzrxz
1-r2xz
Cовокупный коэфф-т множ-й корреляции измеряет одновременное влияние факторных признаков на результативный. Его значения находятся в пределах от 0 до 1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а следовательно, величина R ближе к единице.
В многофакторном комплексе факторные признаки действуют не изолированно, а во взаимодействии. Возникает необходимость измерения тесноты связи между результативным признаком и одним из факторных при постоянном значении прочих факторов.
Эта задача решается с помощью вычисл. частных коэффициентов корреляции.
При лин. связи между x,y и z частный коэфф-т корр-ции между х и у при исключении влияния z будет иметь вид
rxy(z)= rxy - rxzryz_____
Ö(1-r2xz)(1-r2yz)
При искл. влияния х: ryz(x) = ryz - rxzryx______
Ö(1-r2yx)(1-r2xz)
Величина R всегда больше любого из частных коэфф-в корреляции в данном комплексе.
16-20Ó
17.Показатели тесноты связи непараметрических признаков.
При исследовании социальных явлений и процессов большое значение имеет изучение качественных показателей и признаков, не имеющих количественной оценки.
Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэфф-ты ассоциации и контингенции. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т.е. состоящим из двух качественно отличных друг от друга значений признака(например, хороший,плохой)
пример: площадь земли, га
удобрено хорошо удобрено плохо итого
урожайность a b a+b
высокая
урож-ть c d c+d
низкая
итого a+c b+d
Коэфф-ты рассчится по формулам:
A= ad-bc - ассоциации
ad+bc
K= ad-bc ______
Ö(a+b)(b+d)(a+c)(c+d) - контингенции
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если А³0.5 или К³0.3
Если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэфф-та Пирсона.Этот коэфф-т рассчит-ся по формуле
_________
С= Ö j2 где j2 - показатель взаимной
1+ j2 сопряженности
Расчет коэфф-та взаимной сопряженности пр-ся по след. схеме
Группы Группы признака В итого
признака А В1 В2 В3
А1 f1 f2 f3 n1
А2 f4 f5 f6 n2
А3 f7 f8 f9 n3
итого m1 m2 m3
Расчет j2 производится так:
по первой строке
( f21 + f22 + f23 ): n1=L1
m1 m2 m3
по второй строке
( f24 + f25 + f26 ): n2=L2
m1 m2 m3
по третьей строке
( f27 + f28 + f29 ): n3 = L3
m1 m2 m3
Cледовательно j2 = L1+ L2 + L3 - 1 = 3Li - 1
Интерпретация непараметрических коэфф-в связи в некоторых случаях, особенно когда они имеют отрицательное значение , затруднительна. Их абсолютные значения могут изменяться в пределах от 0 до 1. Чем ближе абсолютные значения к единице, тем теснее связь между исследуемыми признаками.
18.Расчет коэффициентов знаков( Фехнера), корреляции рангов (Спирмена), коэффициента конкордации.
Коэффициент знаков (коэфф-т Фехнера) вычисляется на основании определения знаков отклонений вариантов двух взаимосвязанных признаков от их средних величин.
Если число совпадений знаков обозначить через а , а число несовпадений через в, а сам коэфф-т- через I, то можно написать ф-лу этого коэфф-та так
i = åa-åв
åа+åв
Коэфф-т корреляции рангов(Спирмена) рассчитывается не по значениям двух взаимосвяз-х признаков, а по их рангам след. образом: (рангом называется порядковый номер эл-та в ранжированном ряду признаков)
rx\y = 1- 6ådi2__
n(n2-1) ,где di2-квадраты разности рангов
n- число наблюдений(число пар рангов)
Для определения тесноты связи между тремя и более признаками применяется ранговый коэфф-т согласия - коэфф-т конкордации, который вычисляется по ф-ле
W= 12S___
m2(n3-n) ,где m- кол-во факторов, n- число наблюдений
S- сумма квадратов отклонений рангов
Если при определении тесноты связи с помощью приведенных ранговых коэфф-в имеются связные ранги, т.е. если двум или более показателям присвоен тот же ранг, то расчеты произв-ся по ф-ле
W= 12S____________ , где Т=(t3- t) , а t-количество
m2 ( n3 - n) - måT 12 связных рангов по
отдельным показат-м
примечания списывающему: все эти коэфф-ты толкуются одинаково ,чем ближе к 1 тем связь сильнее и т.д.