|
R |
|
|
|
|
на- |
S эмп ходиться в зоне значимости, следовательно, с заданным уровнем значимости |
0,05 гипотеза о нормальности распределения принимается.
Вкачестве показателя точности модели используем среднюю абсолютную ошибку:
|
|
1 |
n |
|
|
|
4 |
|
|
|
|
|
абс |
|
|
|
i |
|
|
|
0,4 |
. На 0,4 в среднем отклоняются фактические значения от модели. |
|
|
|
|
|
ni 1 |
|
|
|
10 |
|
|
|
|
|
|
|
|
5.3. НЕЛИНЕЙНЫЕ МОДЕЛИ РЕГРЕССИИ
В психолого-педагогических исследованиях соотношения между изучаемыми признаками, как правило, выражаются нелинейными функциями.
Классы нелинейных регрессий
регрессии, нелинейные по переменным, включенным в анализ, но линейные по оцениваемым параметрам
Полиномы разных степеней
у а bx cx2
у а bx cx2 dx3
Равносторонняя гипербола
у а b
х
Введением новых переменных данную модель сводят к линейной модели, для оценки параметров которой можно использовать метод наименьших квадратов.
регрессии, нелинейные по оцениваемым
параметрам
Степенная функция
у а xb
Показательная функция
у а bx
Экспоненциальная функция
у еа bx
Линеаризация модели с помощью логарифмирования обеих частей уравнения.
Пример. Была обследована выборка из 10 респондентов по степени владения двумя коммуникативными навыками: активное слушание и снижение эмоционального напряжения. Измерения проводились по 10-балльной шкале и представлены в таблице:
№ респондента |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Активное слушание |
6 |
3 |
4 |
4 |
6 |
4 |
3 |
6 |
6 |
5 |
Снижение эмоционального напряжения |
5 |
1 |
4 |
4 |
4 |
5 |
5 |
5 |
5 |
6 |
|
|
|
|
|
|
|
|
|
|
|
Построение парной линейной регрессии, оценивание ее параметров и их значимости можно выполнить с помощью программы «Анализ данных в EXCEL», инструмента «Регрессия». С этой целью построим вспомогательную таблицу:
130
|
у |
|
х |
lg(y) |
lg(x) |
|
z |
|
|
z |
1 |
|
|
|
x |
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
5 |
0,778151 |
0,69897 |
|
2,236068 |
0,2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
1 |
0,477121 |
0 |
|
1 |
|
|
1 |
|
|
|
|
4 |
|
4 |
0,60206 |
0,60206 |
|
2 |
|
|
0,5 |
|
|
|
4 |
|
4 |
0,60206 |
0,60206 |
|
2 |
|
|
0,5 |
|
|
|
6 |
|
4 |
0,778151 |
0,60206 |
|
2 |
|
|
0,5 |
|
|
|
6 |
|
5 |
0,778151 |
0,69897 |
|
2,236068 |
0,2 |
|
|
|
3 |
|
5 |
0,477121 |
0,69897 |
|
2,236068 |
0,2 |
|
|
|
6 |
|
5 |
0,778151 |
0,69897 |
|
2,236068 |
0,2 |
|
|
|
6 |
|
5 |
0,778151 |
0,69897 |
|
2,236068 |
0,2 |
|
|
|
5 |
|
6 |
0,69897 |
0,778151 |
|
2,44949 |
0,166 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рассмотрим различные варианты уравнения регрессии: |
|
|
|
|
|
|
|
|
а) Линейное уравнение регрессии. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
Множественный R |
|
|
0,537359 |
|
|
|
|
|
|
|
|
|
R-квадрат |
|
|
0,288754 |
|
|
|
|
|
|
|
|
|
Нормированный R-квадрат |
|
0,199849 |
|
|
|
|
|
|
|
|
|
Стандартная ошибка |
|
|
1,150954 |
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
|
Стандартная ошибка |
|
|
Y-пересечение |
|
|
2,646341 |
|
|
|
|
1,302404 |
|
|
Переменная X 1 |
|
|
0,512195 |
|
|
|
|
0,284208 |
|
|
|
|
|
|
|
|
|
Линейное уравнение регрессии имеет вид: ˆу( х ) 2,65 |
0,51х. |
|
|
|
|
б) Степенное уравнение регрессии.
Построению степенной модели ˆу а хbпредшествует процедура линеаризации переменных, которая производится путем логарифмирования обеих частей уравнения:
lg y lg a b lg x. После введения обозначений: У lg y, |
Х lg x и А lg a уравне- |
ние примет линейный вид: У А b X . |
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
Множественный R |
|
0,57526 |
|
|
|
|
R-квадрат |
|
0,330924 |
|
|
|
|
Нормированный R-квадрат |
|
0,24729 |
|
|
|
|
Стандартная ошибка |
|
0,109256 |
|
|
|
|
|
|
Коэффициенты |
|
Стандартная ошибка |
|
|
Y-пересечение |
|
0,475655 |
|
0,105913 |
|
|
Переменная X 1 |
|
0,327599 |
|
0,164692 |
|
|
|
|
|
|
|
|
|
В результате получили |
уравнение У 0,48 0,32Х . Степенное уравнение регрес- |
сии имеет вид: ˆу 3,02 х0,32.
в) Показательное уравнение регрессии.
Построению показательной модели ˆу а bхпредшествует процедура линеаризации
переменных, которая |
производится путем логарифмирования обеих |
частей уравнения: |
lg y lg a x lg b. |
После введения обозначений: У lg y, В lg b |
и А lg a уравне- |
ние примет линейный вид: У А B x.
|
Регрессионная статистика |
|
Множественный R |
0,560195 |
|
R-квадрат |
0,313818 |
|
Нормированный R-квадрат |
0,228045 |
|
Стандартная ошибка |
0,110644 |
|
|
Коэффициенты |
Стандартная ошибка |
Y-пересечение |
0,444864 |
0,125203 |
Переменная X 1 |
0,05226 |
0,027322 |
|
|
|
В результате получили |
уравнение У 0,44 0,05х. Показательное уравнение рег- |
рессии имеет вид: ˆу 100,44 |
100,05х 2,75 1,12 х . |
г) Уравнение регрессии в виде полинома степени |
1 |
. |
|
|
|
|
|
2 |
|
|
|
Нахождению уравнения полинома степени 1 |
ˆу а b |
х |
предшествует процеду- |
|
|
2 |
|
|
|
|
|
ра линеаризации переменных, которая производится путем замены переменной z х :
ˆу а b z.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
Множественный R |
|
|
|
0,547106 |
|
|
|
|
|
|
|
|
R-квадрат |
|
|
|
|
|
|
|
|
|
0,299325 |
|
|
|
|
|
|
|
|
Нормированный R-квадрат |
|
|
|
0,21174 |
|
|
|
|
|
|
|
|
Стандартная ошибка |
|
|
|
1,142369 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
|
|
Стандартная ошибка |
|
|
Y-пересечение |
|
|
|
|
|
|
|
1,270673 |
|
|
1,996177 |
|
|
Переменная X 1 |
|
|
|
|
|
|
1,759262 |
|
|
0,95164 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В результате получили |
|
|
уравнение ˆу 1,27 1,76 z. |
Уравнение регрессии в виде |
|
|
1 |
|
|
|
ˆу 1,27 1,76 |
|
|
|
. |
|
|
|
|
|
|
|
полинома степени |
имеет вид |
|
|
х |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
д) Уравнение регрессии в виде равносторонней гиперболы. |
|
|
|
|
Нахождению уравнения равносторонней гиперболы |
ˆу а b |
1 |
предшествует про- |
|
|
|
|
|
цедура |
|
линеаризации переменных, которая производится |
|
х |
|
путем замены переменной |
|
1 |
|
ˆ |
|
а |
|
b |
|
z. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z |
: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
у |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
|
Множественный R |
|
|
|
0,564154 |
|
|
|
|
|
|
|
|
|
R-квадрат |
|
|
|
|
|
|
|
|
0,31827 |
|
|
|
|
|
|
|
|
|
Нормированный R-квадрат |
|
|
|
0,233054 |
|
|
|
|
|
|
|
|
|
Стандартная ошибка |
|
|
|
1,126819 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
|
|
|
|
|
|
Стандартная ошибка |
|
|
|
|
Y-пересечение |
|
|
|
5,902942 |
|
|
0,629522 |
|
|
|
|
Переменная X 1 |
|
|
|
-2,73579 |
|
|
1,41562 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В результате получили |
уравнение ˆу 5,9 2,7 z. Уравнение регрессии в виде рав- |
носторонней гиперболы имеет вид ˆу 5,9 2,7 |
|
1 |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
х |
|
|
|
|
|
|
|
Степенному уравнению регрессии соответствует максимальное из имеющихся значений, значение скорректированного коэффициента детерминации (0,24729), следовательно, данная модель наиболее точно отражает взаимосвязь между двумя коммуникативными навыками: активное слушание и снижение эмоционального напряжения.
5.4МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ
Уравнение множественной линейной регрессии
среднее значение изменения результативного признака y при изменении факторных признаковxi , i = 1;n на одну единицу их измерения
|
|
|
|
|
где |
|
ˆyx a0 a1xi1 a2xi2 ... ak xik i, i 1;n |
ŷ теоретическое значение результативного признака, полу-
ченное по уравнению регрессии
|
|
|
|
Коэффициент (параметр) уравнения регрессии. Коэффици- |
ai, i = |
|
|
|
ент регрессии аi показывает, на какую величину в среднем из- |
0;k |
|
|
|
|
|
менится значение результативного признака y при изменении |
|
|
|
|
факторного признака xi на одну единицу его измерения при |
|
|
|
|
фиксированном значении других факторов, входящих в уравне- |
|
|
|
|
ние регрессии. |
независимая, нормально распределенная случайная вели- εi чина (остаток i yi ˆyi с нулевым математическим ожиданием и постоянной дисперсией), отражает тот факт, что изменение у будет неточно описываться изменением х, изза присутствия других факторов, не учтенных в данной мо-
дели.
Формулы для определения значения параметров ai, i = 0;k
1 способ
1 Записать уравнение линейной множественной регрессии в матричной форме
|
y1 |
|
|
a0 |
|
|
1 |
x11 |
... |
x1k |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y = AX + еили |
y 2 |
|
|
a1 |
|
|
1 |
x21 |
... |
x2k |
|
|
2 |
|
|
... |
|
|
|
|
|
|
|
... |
... |
... |
|
|
|
|
|
|
|
|
... |
|
|
... |
|
|
... |
|
|
|
|
|
|
|
|
|
1 |
xn1 |
... |
xnk |
|
|
|
n |
|
|
yn |
|
ak |
|
|
|
|
|
|
|
где Y – вектор значений зависимой переменной.
X – матрица значений независимых переменных A– вектор неизвестных параметров
– вектор случайных отклонений
2 Вычислить параметры регрессионного уравнения по формуле:
А Х / Х -1 Х /Y .
2 способ
Параметры уравнения регрессии можно определить с помощью программы
«Анализ данных в EXCEL», инструмента «Регрессия».
|
ОЦЕНКА ЗНАЧИМОСТИ КАЖДОГО КОЭФФИЦИЕНТА УРАВНЕНИЯ РЕГРЕССИИ |
|
|
|
|
t-критерия Стьюдента |
|
|
|
|
|
|
|
|
гипотезы |
|
|
|
|
|
Ho: ai, i = 0;k – незначимый коэффициент регрессии |
|
|
H1:ai, i = 0;k – значимый коэффициент регрессии |
|
|
|
|
|
t-статистика |
|
|
|
|
|
для любого из коэффициентов регрессии ai, i = 0;k |
|
Определить bii |
- диагональные элементы матрицы X / |
1 |
|
Х . |
|
Вычислить S - стандартное (среднеквадратическое) отклонение |
|
уравнения |
регрессии, |
определяемое |
по |
|
формуле: |
|
|
у ˆу 2 |
|
|
|
|
|
n k 1 |
. |
|
|
|
|
|
|
|
|
|
|
|
|
Вычислить значение t-критерия по формуле: tpac S |
ai |
b |
|
|
|
|
|
|
|
|
|
ii |
оценка значимости
Определить критические значения t1кр и t2кр, которые отвечают уровням значимости в 5% и 1% с числом степеней свободы df = n-k-1 по таблице № 22 приложения.
Расположить эмпирическое значение критерия tэмп и критические значения t1кр и t2кр на оси значимости.
Если tэмп находится в зоне незначимости, то принимается гипотеза Н0 о незначимости коэффициента регрессии. Если
tэмп находится в зоне значимости, то гипотеза Н0 отклоняется и принимается гипотеза Н1 о значимости коэффициента
регрессии. Если tэмп находится в зоне неопределенности, то существует вероятность принятия ложного решения.
134
Пример. Даны следующие условные данные о:
У – количестве решенных задач на контрольной работе; Х1 (ч) – количестве времени, затраченном на подготовку обучающегося к контрольной
работе;
Х2 (%) – степени использования информационных технологий в процессе подготовки к контрольной работе. Предполагая, что между У, Х1 и Х2 существует линейная корреляционная зависимость, найдите ее аналитическое выражение, используя данные, приведенные в таблице:
№ |
|
1 |
|
2 |
|
|
3 |
|
|
4 |
|
|
|
5 |
|
|
|
|
6 |
|
7 |
|
|
|
8 |
9 |
10 |
|
xi1 |
|
8 |
|
11 |
|
|
12 |
|
|
9 |
|
|
|
8 |
|
|
|
|
8 |
|
9 |
|
|
|
9 |
8 |
12 |
|
xi2 |
|
5 |
|
8 |
|
|
8 |
|
|
5 |
|
|
|
7 |
|
|
|
|
8 |
|
6 |
|
|
|
4 |
5 |
7 |
|
yi |
|
5 |
|
10 |
|
|
10 |
|
|
7 |
|
|
|
5 |
|
|
|
|
6 |
|
6 |
|
|
|
5 |
6 |
8 |
|
|
Для |
нахождения |
параметров |
регрессионного |
уравнения воспользуемся |
формулой |
А Х / Х -1 Х /Y . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
1 |
... |
1 |
1 |
8 |
5 |
|
|
10 |
94 |
63 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
11 |
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Учитывая, что X / X |
|
8 |
11 |
... |
12 |
|
|
|
|
94 |
908 |
606 |
|
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
8 |
... |
7 |
... ... |
|
|
63 |
603 |
417 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
12 |
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
1 |
15027 |
1209 |
522 |
|
|
|
68 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X / |
X |
|
|
1209 |
201 |
108 |
и |
Х / |
У 664 |
|
получим |
|
3738 |
|
|
|
|
|
|
522 |
108 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
244 |
|
|
|
445 |
|
|
|
1 |
|
13230 |
3,54 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А |
|
|
|
3192 |
|
|
0,85 |
. |
|
|
|
|
|
|
|
|
3738 |
|
|
|
|
|
|
|
|
|
|
1372 |
|
|
0,37 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Уравнение регрессии примет вид ˆyx 3,54 0,85x1 0,37x2.
Данное уравнение показывает, что при увеличении только количества времени Х1, затраченного на подготовку обучающегося к контрольной работе (при неизменном Х2) на 1 ч, количество решенных задач на одного обучающегося увеличится в среднем на 0,85; а при увеличении только уровня использования информационных технологий в процессе подготовки к контрольной работе Х2 (при неизменном Х1) - в среднем на 0,37.
Для определения значимости каждого из коэффициентов уравнения регрессии составим вспомогательную таблицу.
№ |
|
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
6 |
|
7 |
8 |
|
9 |
|
|
10 |
∑ |
|
xi1 |
|
8 |
|
11 |
|
12 |
|
9 |
|
8 |
|
8 |
|
9 |
9 |
|
8 |
|
|
12 |
– |
|
xi2 |
|
5 |
|
8 |
|
8 |
|
5 |
|
7 |
|
8 |
|
6 |
4 |
|
5 |
|
|
7 |
– |
|
yi |
|
5 |
|
10 |
|
10 |
|
7 |
|
5 |
|
6 |
|
6 |
5 |
|
6 |
|
|
8 |
– |
|
ˆy |
|
5,13 |
|
8,79 |
|
9,64 |
|
5,98 |
|
5,86 |
|
6,23 |
6,35 |
5,61 |
5,13 |
|
9,28 |
– |
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i2 |
|
0,016 |
1,464 |
|
1,127 |
1,038 |
0,741 |
0,052 |
0,121 |
0,377 |
0,762 |
|
1,631 |
7,329 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
tpac |
|
|
|
3,54 |
0,004; |
tpac |
|
|
0,85 |
|
0,008; tpac |
|
|
0,37 |
0,003. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
7,329 15027 |
|
|
|
1 |
7,329 201 |
|
2 |
7,329 244 |
|
|
|
|
Расчетные значения t-критерия сравним с табличным значением t , |
2,365 при усло- |
вии, что df 10 2 1 7 |
и уровень значимости 0,05. Расчетные значение t-критерия |
меньше, чем его табличное значение t , , поэтому параметры признаются незначимыми, то
есть найденные значения параметров обусловлены случайными совпадениями. Сделанные выводы о взаимосвязи факторных переменных и результативного признака несостоятельны.
Из-за различия единиц измерения исследуемых показателей и разной степени колеблемости нельзя сопоставить факторные признаки по степени их влияния на зависимую переменную. Для это используют коэффициент эластичности или β-коэффициент.
Коэффициент эластичности
показывает
на сколько процентов изменяется результативный признак у при изменении факторного признака хi на один процент
вычисляется по формуле
Эi ai xi y
показывает
на какую часть своего среднеквадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака хi на величину своего среднеквадратичного отклонения при фиксированном значении остальных независимых переменных
вычисляется по формуле
i аi xi
y
Указанные коэффициенты позволяют проранжировать факторы по степени влияния факторов на зависимую переменную.
Дельта-коэффициент
|
показывает |
|
|
вычисляется по формуле |
|
|
|
|
|
|
|
|
|
|
|
долю влияния фактора в суммар- |
|
|
i |
|
|
|
|
ном влиянии всех факторов |
r |
|
, где r |
yi |
– коэффициент |
|
yхi R2 |
|
|
|
|
i |
|
|
парной корреляции между фактором хi
и зависимой переменной, R2 – коэффициент множественный детерминации
Коэффициент множественный детерминации используют для оценки качества множественных регрессионных моделей.
Коэффициент множественный детерминации
|
|
|
показывает |
|
|
|
вычисляется по формуле |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
долю |
вариации результативного |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n 2 |
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
признака, находящегося под воз- |
|
|
|
|
|
|
ˆ |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
действием факторных признаков, |
|
|
R2 1 |
|
|
i |
|
|
yi |
- y |
|
|
|
то есть определяет, какая доля ва- |
|
|
|
|
i 1 |
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
риации признака у учтена в модели |
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
и обусловлена влиянием на него |
|
|
|
yi - |
|
2 |
|
yi - |
|
|
|
|
|
|
|
y |
y |
|
|
|
факторов, включенных в модель |
|
|
|
|
i 1 |
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
Чем ближе R2 к 1, тем выше качество модели. |
R2 увеличивается, |
|
|
|
При добавлении независимых переменных |
значение |
|
поэтому коэффициент R2 должен быть скорректирован с учетом числа незави- |
|
симых переменных по формуле: Rкор2 |
1 1 R2 |
|
п 1 |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
п k 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Определение значимости уравнения регрессии в целом |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F-критерий Фишера |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
Сформулировать гипотезы: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
H0 |
Уравнение регрессии в целом незначимо. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
H1 |
Уравнение регрессии в целом значимо. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 В случае множественной линейной регрессии значимость модели определя-
ется по формуле: Fрасч |
R2 |
|
|
n k 1 |
|
|
|
. |
1 R |
2 |
|
|
|
k |
3Определить критические значения F1кр и F2кр, которые отвечают уровням значимости в 5% и 1% по таблице № 23 приложения при df1 k и df2 n k 1.
4Расположить значения критерия Fрасч, критические значения F1кр и F2кр на оси значимости.
5Если Fрасч находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии значимости уравнения регрессии. Если Fрасч находится в зоне значимости, то гипотеза об отсутствии значимости уравнения регресии Н0 отклоняется и принимается гипотеза Н1 о наличии значимости уравнения регрессии. Если Fрасч находится в зоне неопределенности, то существует вероятность принятия ложного решения.
Мультиколлинеарность это
тесная зависимость между факторными признаками, включенными в модель
Изменения, возникающие под воздействием мультиколлинеарности
способствует завышению значений параметров модели
приводит к искажению смысла психолого-педагогической интерпретации коэффициентов регрессии
осложняет процесс определения наиболее существенных факторных признаков
вызывает слабую обусловленность системы нормальных уравнений
ПРИЧИНЫ ВОЗНИКНОВЕНИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ ПРИЗНАКАМИ
изучаемые факторные признаки характеризуют одну и ту же сторону явления или процесса
использование в качестве факторных признаков, суммарное значение которых представляет собой постоянную величину
факторные признаки являются элементами друг друга
СПОСОБЫ ОПРЕДЕЛЕНИЯ НАЛИЧИЯ ИЛИ ОТСУТСТВИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ
|
|
|
|
|
исследование матрицы (X / X) |
|
анализ матрицы коэффициентов |
|
|
|
парной корреляции |
|
|
|
|
|
если определитель матрицы (X / X) |
|
|
|
|
|
|
|
факторы |
xi и xj могут быть |
|
близок к нулю, то это свидетельст- |
|
признаны мультиколлинеарными, |
вует о мультиколлинеарности |
|
если rxi xj |
0,8 |
|
|
|
138
Метод уменьшения (устранения) мультиколлинеарности
Построить множественную линейную регрессию, включая все факторы, с помощью программы «Анализ данных в EXCEL», инструмента «Регрессия».
Построить множественную линейную регрессию, используя оставшиеся факторы, с помощью программы «Анализ данных в EXCEL», инструмент «Регрессия».
Проверить значимость коэффициентов уравнения регрессии при помощи t-критерия Стьюдента
существует незначимый коэффициент уравнения регрессии
из модели исключить фактор, коэффициент при котором незначим и имеет наименьшее значение t-критерия.
все коэффициенты уравнения регрессии значимы
модель признается близкой к оптимальной
Пример. Была обследована выборка из 10 респондентов по степени владения тремя важнейшими коммуникативными навыками. Измерения проводились по 10-балльной шкале и представлены в таблице:
|
№ |
Активное слушание |
Снижение эмоционального |
Аргументация |
|
напряжения |
|
|
|
|
|
1 |
6 |
5 |
5 |
|
|
|
|
|
|
2 |
3 |
1 |
2 |
|
|
|
|
|
|
3 |
4 |
4 |
5 |
|
4 |
4 |
4 |
5 |
|
|
|
|
|
|
5 |
5 |
4 |
4 |
|
|
|
|
|
|
6 |
6 |
4 |
3 |
|
7 |
4 |
3 |
2 |
|
|
|
|
|
|
8 |
6 |
5 |
4 |
|
|
|
|
|
|
9 |
5 |
3 |
4 |
|
|
|
|
|
|
10 |
5 |
5 |
3 |
Построение множественной линейной регрессии, оценивание ее параметров и их значимости выполним с помощью программы «Анализ данных в EXCEL», инструмент «Регрессия» (при заполнении значений факторных переменных необходимо указать не один столбец, а все столбцы, содержащие значения данных переменных).
139