- •13.03.02 Электроэнергетика и электротехника
- •Практическое задание 1 Линейный регрессионный анализ при обработке результатов пассивных экспериментов
- •Практическое задание 2 Нелинейный регрессионный анализ при обработке результатов пассивных экспериментов
- •Практическое задание 3 Дисперсионный анализ при обработке результатов пассивных экспериментов
- •Практическое задание 4 Регрессионный анализ при многофакторном
М ИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
федеральное государственное бюджетное образовательное учреждение
высшего образования
«Тольяттинский государственный университет»
(наименование института полностью)
Кафедра /департамент /центр1 институт химии и энергетики
(наименование кафедры/департамента/центра полностью)
13.03.02 Электроэнергетика и электротехника
(код и наименование направления подготовки, специальности)
(направленность (профиль) / специализация)
Практическое задание №__1_
по учебному курсу «Инженерный эксперимент в электроэнергетике и электрохозяйстве»
(наименование учебного курса)
Вариант __10__ (при наличии)
Студент |
Яшин И.А. (И.О. Фамилия) |
|
Группа |
ЭЭТбп-1801а (И.О. Фамилия) |
|
Преподаватель |
Федяй Олег Валерьевич (И.О. Фамилия) |
|
Тольятти 2022
Практическое задание 1 Линейный регрессионный анализ при обработке результатов пассивных экспериментов
Задание: Провести линейный регрессионный анализ.
Имеются экспериментальные характеристики привода турбонагнетателя.
Скольжение, о.е. |
Активная мощность каскада, Мвт |
0,025 |
4,32 |
0,050 |
3,39 |
0,075 |
3,38 |
0,100 |
3,24 |
0,125 |
3,03 |
0,150 |
2,63 |
0,175 |
2,49 |
0,200 |
2,28 |
0,225 |
2,02 |
0,250 |
1,87 |
0,275 |
1,61 |
0,300 |
1,50 |
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x |
y |
x2 |
y2 |
x*y |
0.025 |
4.32 |
0.000625 |
18.6624 |
0.108 |
0.05 |
3.39 |
0.0025 |
11.4921 |
0.1695 |
0.075 |
3.38 |
0.00563 |
11.4244 |
0.2535 |
0.1 |
3.24 |
0.01 |
10.4976 |
0.324 |
0.125 |
3.03 |
0.01563 |
9.1809 |
0.3788 |
0.15 |
2.63 |
0.0225 |
6.9169 |
0.3945 |
0.175 |
2.49 |
0.03063 |
6.2001 |
0.4358 |
0.2 |
2.28 |
0.04 |
5.1984 |
0.456 |
0.225 |
2.02 |
0.05063 |
4.0804 |
0.4545 |
0.25 |
1.87 |
0.0625 |
3.4969 |
0.4675 |
0.275 |
1.61 |
0.07563 |
2.5921 |
0.4428 |
0.3 |
1.5 |
0.09 |
2.25 |
0.45 |
1.95 |
31.76 |
0.4063 |
91.9922 |
4.3348 |
Для наших данных система уравнений имеет вид
12a + 1.95·b = 31.76
1.95·a + 0.406·b = 4.335
Домножим уравнение системы на (-0.163), получим систему, которую решим методом алгебраического сложения.
-1.95a -0.318 b = -5.177
1.95*a + 0.406*b = 4.335
Получаем:
0.088*b = -0.842
Откуда b = -9.2448
Теперь найдем коэффициент «a» из уравнения:
12a + 1.95*b = 31.76
12a + 1.95*(-9.2448) = 31.76
12a = 49.787
a = 4.1489
Получаем эмпирические коэффициенты регрессии: b = -9.2448, a = 4.1489
Уравнение регрессии (эмпирическое уравнение регрессии):
y = -9.2448 x + 4.1489
Параметры уравнения регрессии. Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
a = \\x\\to(y) - b·\\x\\to(x) = 2.647 - (-9.2448)·0.163 = 4.1489
Коэффициент корреляции. Ковариация.
cov(x,y) = \\x\\to(x·y) - \\x\\to(x)·\\x\\to(y) = 0.361 - 0.163·2.647 = -0.0689 Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
В нашем примере связь между признаком Y и фактором X весьма высокая и обратная.
Коэффициент детерминации. Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака. Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах. R2= -0.9812 = 0.9627 т.е. в 96.27% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 3.73% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации). Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
|y - yx|:y |
0.025 |
4.32 |
3.918 |
2.8 |
0.162 |
0.0931 |
0.05 |
3.39 |
3.687 |
0.553 |
0.088 |
0.0875 |
0.075 |
3.38 |
3.456 |
0.538 |
0.00571 |
0.0224 |
0.1 |
3.24 |
3.224 |
0.352 |
0.000241 |
0.0048 |
0.125 |
3.03 |
2.993 |
0.147 |
0.00134 |
0.0121 |
0.15 |
2.63 |
2.762 |
0.000278 |
0.0175 |
0.0503 |
0.175 |
2.49 |
2.531 |
0.0245 |
0.00169 |
0.0165 |
0.2 |
2.28 |
2.3 |
0.134 |
0.0004 |
0.00877 |
0.225 |
2.02 |
2.069 |
0.393 |
0.00239 |
0.0242 |
0.25 |
1.87 |
1.838 |
0.603 |
0.00104 |
0.0172 |
0.275 |
1.61 |
1.607 |
1.075 |
1.1E-5 |
0.00209 |
0.3 |
1.5 |
1.376 |
1.315 |
0.0155 |
0.083 |
1.95 |
31.76 |
31.76 |
7.934 |
0.296 |
0.422 |
Ошибка аппроксимации. Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным. В среднем, расчетные значения отклоняются от фактических на 3.52%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
F-статистика. Критерий Фишера.
Фактическое значение F-критерия:
Табличное значение критерия со степенями свободы k1=1 и k2=10, Fтабл = 4.96 Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
t-статистика.
tкрит(n-m-1;α/2) = tкрит(10;0.025) = 2.634
Поскольку 16.08 > 2.634, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Поскольку 39.21 > 2.634, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Доверительный интервал для коэффициентов уравнения регрессии.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими: (b - tкрит Sb; b + tкрит Sb) (-9.24 - 2.634*0.575; -9.24 + 2.634*0.575) (-10.76;-7.73) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале. (a - tкрит Sa; a + tкрит Sa) (4.149 - 2.634*0.106; 4.149 + 2.634*0.106) (3.87;4.428) С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
Выводы. Изучена зависимость Y от X. На этапе спецификации была выбрана парная линейная регрессия. Оценены её параметры методом наименьших квадратов. Статистическая значимость уравнения проверена с помощью коэффициента детерминации и критерия Фишера. Установлено, что в исследуемой ситуации 96.27% общей вариабельности Y объясняется изменением X. Установлено также, что параметры модели статистически значимы. Возможна экономическая интерпретация параметров модели - увеличение X на 1 ед.изм. приводит к уменьшению Y в среднем на 9.245 ед.изм.