- •Размещено на http://www.Allbest.Ru/
- •1. Регрессионный анализ
- •2. Пакет Анализ данных Microsoft Excel
- •3. Пример регрессионного анализа данных
- •1) Построим уравнения линейной регрессии. Последовательно увеличивая число факторных переменных от одной до пяти.
- •2) Определим качество уравнений регрессии
- •3) Проверим существенность связи (значимость r-квадрат)
- •4) Проверим значимость каждого коэффициента в уравнении регрессии
- •5) Построим графики остатков для полученных регрессий
- •Корреляционный статистический регрессионный анализ
- •Размещено на Allbest.Ru
5) Построим графики остатков для полученных регрессий
Исследование графиков остатков определяет границы применения метода наименьших квадратов. Который используется для вычисления коэффициентов уравнения регрессии по наблюдаемым данным.
а) от одной факторной переменной Х1
ВЫВОД ОСТАТКА |
|
||
|
|
|
|
Наблюдение |
Предсказанное Y |
Остатки |
|
1 |
10,60743682 |
0,29256318 |
|
2 |
10,10759337 |
-0,507593369 |
|
3 |
10,9833191 |
-0,783319096 |
|
4 |
11,82305609 |
-0,723056094 |
|
5 |
10,83536543 |
-0,035365434 |
|
6 |
10,83536543 |
-1,035365434 |
|
7 |
10,24355079 |
3,456449212 |
|
8 |
10,11159212 |
-1,311592117 |
|
9 |
10,17957083 |
-2,079570826 |
|
10 |
11,33920763 |
3,360792367 |
|
11 |
10,68341302 |
0,216586975 |
|
12 |
10,93133538 |
0,968664623 |
|
13 |
13,71446371 |
-0,414463714 |
|
14 |
10,65942054 |
0,240579461 |
|
15 |
10,20756206 |
-2,007562059 |
|
16 |
10,08360088 |
-1,683600883 |
|
17 |
10,62743056 |
-1,227430558 |
|
18 |
10,00762468 |
-0,407624679 |
|
19 |
10,00362593 |
4,296374069 |
|
20 |
10,51546563 |
-0,615465625 |
б) от двух факторных переменных Х1 и Х2
ВЫВОД ОСТАТКА |
|
||
|
|
|
|
Наблюдение |
Предсказанное Y |
Остатки |
|
1 |
10,58280026 |
0,317199744 |
|
2 |
10,12784212 |
-0,527842123 |
|
3 |
10,9928433 |
-0,792843297 |
|
4 |
11,88623562 |
-0,786235619 |
|
5 |
10,79978424 |
0,000215765 |
|
6 |
10,84155209 |
-1,041552085 |
|
7 |
10,26771313 |
3,432286875 |
|
8 |
10,11076493 |
-1,310764934 |
|
9 |
10,15459553 |
-2,054595529 |
|
10 |
11,33164284 |
3,368357157 |
|
11 |
10,6968961 |
0,2031039 |
|
12 |
10,95379769 |
0,946202314 |
|
13 |
13,68682197 |
-0,386821969 |
|
14 |
10,65317176 |
0,246828244 |
|
15 |
10,2334525 |
-2,033452497 |
|
16 |
10,08411778 |
-1,684117779 |
|
17 |
10,63315983 |
-1,233159826 |
|
18 |
9,970021936 |
-0,370021936 |
|
19 |
9,997541087 |
4,302458913 |
|
20 |
10,49524532 |
-0,595245318 |
в) от трех факторных переменных Х1, Х2 и Х3
ВЫВОД ОСТАТКА |
|
|
|
|
|
Наблюдение |
Предсказанное Y |
Остатки |
1 |
10,40360492 |
0,496395084 |
2 |
10,12884812 |
-0,528848123 |
3 |
11,23251567 |
-1,032515667 |
4 |
11,80436564 |
-0,704365637 |
5 |
10,80937576 |
-0,009375765 |
6 |
10,80432166 |
-1,004321655 |
7 |
10,34211134 |
3,357888663 |
8 |
10,05312112 |
-1,253121125 |
9 |
10,06101304 |
-1,96101304 |
10 |
11,71749934 |
2,982500662 |
11 |
10,31438311 |
0,585616893 |
12 |
10,85833384 |
1,041666164 |
13 |
13,58052167 |
-0,280521669 |
14 |
10,52427305 |
0,375726945 |
15 |
10,32114832 |
-2,121148322 |
16 |
10,04404566 |
-1,644045664 |
17 |
10,82468895 |
-1,424688946 |
18 |
9,792648978 |
-0,192648978 |
19 |
9,94078555 |
4,35921445 |
20 |
10,94239427 |
-1,042394269 |
г) от четырех факторных переменных Х1, Х2, Х3 и Х4
ВЫВОД ОСТАТКА |
|
|
|
|
|
Наблюдение |
Предсказанное Y |
Остатки |
1 |
10,12182572 |
0,778174281 |
2 |
10,79059376 |
-1,190593761 |
3 |
10,15563604 |
0,044363964 |
4 |
12,06452054 |
-0,96452054 |
5 |
10,28545389 |
0,51454611 |
6 |
10,37887096 |
-0,578870958 |
7 |
10,24191756 |
3,458082438 |
8 |
9,340605344 |
-0,540605344 |
9 |
9,230972071 |
-1,130972071 |
10 |
14,03171067 |
0,668289333 |
11 |
12,15226573 |
-1,252265733 |
12 |
10,38634624 |
1,513653763 |
13 |
12,91297093 |
0,387029073 |
14 |
12,04157325 |
-1,141573247 |
15 |
9,164856926 |
-0,964856926 |
16 |
8,875139472 |
-0,475139472 |
17 |
9,518689903 |
-0,118689903 |
18 |
9,914934148 |
-0,314934148 |
19 |
11,08328469 |
3,216715313 |
20 |
11,80783217 |
-1,907832175 |
д) от пяти факторных переменных Х1, Х2, Х3, Х4 и Х5
ВЫВОД ОСТАТКА |
|
|
|
|
|
Наблюдение |
Предсказанное Y |
Остатки |
1 |
9,992492103 |
0,907507897 |
2 |
9,819494137 |
-0,219494137 |
3 |
10,22089248 |
-0,020892476 |
4 |
11,8048304 |
-0,704830401 |
5 |
10,25565663 |
0,544343368 |
6 |
10,59305614 |
-0,793056138 |
7 |
10,502809 |
3,197190998 |
8 |
9,504705467 |
-0,704705467 |
9 |
9,155761357 |
-1,055761357 |
10 |
13,83312083 |
0,866879168 |
11 |
12,48491132 |
-1,58491132 |
12 |
10,74422757 |
1,155772426 |
13 |
12,76986667 |
0,530133329 |
14 |
12,47493541 |
-1,574935405 |
15 |
8,839545704 |
-0,639545704 |
16 |
8,749721891 |
-0,349721891 |
17 |
10,03042224 |
-0,630422238 |
18 |
9,476443695 |
0,123556305 |
19 |
11,28295326 |
3,017046744 |
20 |
11,9641537 |
-2,064153701 |
6) из пяти моделей отберем наилучшую
Для этого используется скорректированный индекс детерминации (исправленный R-квадрат). При введении дополнительной переменной значение R-квадрат автоматически растет, даже если качество уравнения регрессии уменьшается, поэтому отбор наилучшей модели из набора моделей полученных путем введения дополнительной переменной осуществляется по скорректированному R-квадрат.
Из пункта 2 видно, что наибольшее значение скорректированного R-квадрат имеет уравнение регрессии с четырьмя факторными переменными. Следовательно это уравнение и будет наилучшей моделью.
7) рассчитаем нормированные коэффициенты j для наилучшего уравнения регрессии
ty = 0 + 1tX1 + 2tX2 + 3tX3 + 4tX4 – нормализованная форма уравнения регрессии.
β-коэффициенты позволяют оценить степень влияния фактической переменной на результат в порядковой шкале.
Для расчета β-коэффициентов необходимо рассчитать стандартное квадратичное отклонение для всех переменных.
|
y |
X1 |
X2 |
X3 |
X4 |
X5 |
СКО |
1,925584 |
2,071858 |
0,044598 |
2,639411 |
0,313552 |
0,189565 |
Формула для расчета β-коэффициентов:
Y-пересечение |
8,260524 |
Переменная X 1 |
-0,00545 |
Переменная X 2 |
4,2968 |
Переменная X 3 |
0,067619 |
Переменная X 4 |
-0,28869 |
ty = 8,260524 – 0,00545tX1 + 4,2968tX2 + 0.067619tX3 – 0,28869tX4 – нормализованная форма уравнения регрессии.
Заключение