Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
total2.doc
Скачиваний:
371
Добавлен:
17.04.2013
Размер:
5.04 Mб
Скачать

6.2. Примеры решение переопределенной слау методом наименьших квадратов Пусть

(6.21)

система, содержащая m линейных алгебраических уравнений и n неизвестных, при этом m>n, то есть число уравнений превышает число неизвестных. Тогда – матрица системы размераmn, а xn-мерный вектор неизвестных, b – n-мерный вектор свободных членов. Предположим, что система (6.21) несовместна. Это означает, что не существует вектора x, размерности (n1), для которого , иначе 0. Задача состоит, в том, чтобы минимизировать норму невязки

. (6.22)

Эта величина есть расстояние от точки размерностиm1 до точки, лежащих в пространстве столбцов матрицы=, здесь– вектор размерностиm1. Тогда , или

.

Правая часть выражения (6.21) является линейной комбинацией столбцов матрицы с коэффициентами. Таким образом, задача минимизации невязки равносильна отысканию точки , ближайшей к точкепо сравнению с остальными точками пространства столбцов матрицы. Из этого следует, что вектор невязкидолжен быть ортогонален этому пространству. Любой вектор в пространстве столбцов матрицы– это вектор

=.

Ортогональность векторов иозначает равенство нулю их скалярного произведения. Поэтому=0, то есть=0. Учитывая свойство транспонированных матриц, получаем

=.

Поэтому =0 и, поскольку вектор– произвольный, то=0. Раскрывая скобки, получаем=0, откуда следует равенство:

. (6.23)

Решая это уравнение, получаем решение поставленной задачи.

Если столбцы матрицы – линейно независимы (ранг матрицы равенn), то матрица обратима и искомое решение выражается формулой:

. (6.24)

Рассмотрим примеры.

Пример 1. Дана система уравнений:

x+2y=4

x+3y=5

x+5y=3.

Имеем , . Тогда , и система (6.23) в нашем примере выглядит следующим образом .

Пример 2. Дана система уравнений:

x=1

x=3

x=5.

Имеем ,,, тогда система (6.23) превращается в уравнение 3x=9 и x=3. Заметим, что такой же результат получится, если найти среднее арифметическое заданных величин x.

6.3. Метод наименьших квадратов для регрессионного анализа

Для начала рассмотрим линейную регрессию от одной переменной. Пусть имеются результаты измерений двух величин и, предполагается, что они связаны линейной зависимостью

. (6.25)

При этом ошибка измерения является некоторой случайной величиной, а ее среднее значение равно нулю. Так как результаты не ложатся на прямую, то необходимо построить наилучшую прямую проходящую наиболее близко к каждой из этих точек. Это типичная задача обработки измерений.

Для нахождения неизвестных коэффициентов используют метод наименьших квадратов, а именно минимизируют функционал вида

. (6.26)

Необходимым условием минимума будет выполнение условий

. (6.27)

В результате получим

, (6.28)

где средние значения иопределяются по формулам

. (6.29)

Формулы (6.28) позволяют построить график прямой, называемой регрессией на, которая дает представление о зависимости. В дополнение к ней обычно строят и регрессиюна, модель которой аналогична (6.25), только в качестве независимой переменной используют. Таким образом, получают две пересекающиеся в точкепрямые, при этом большинство результатов измерений лежит именно между ними. Более того, во многих случаях удается линеаризовать исходную зависимость и рассматривать ее относительно некоторых новых переменных, которые образуют линейную связь. Например, для функцииберут новые переменныеи получают зависимость вида.

В общем случае, если регрессия наотличается от линейной, рассматривают линейную по параметрам регрессионную модель вида

, (6.30)

где – известные функции, анеизвестные параметры. Пусть имеетсянаблюдений, которые являются результатом реализации случайной величины

, (6.31)

здесь – случайные независимые друг относительно друга и распределенные по нормальному закону ошибки наблюдений. Необходимо отметить, что система уравнений относительно неизвестныхявляется типичной пере- или недоопределенной задачей и должна решаться методом наименьших квадратов.

По методу наименьших квадратов в качестве оценок принимают значения, дающие минимум функции

. (6.32)

Из необходимых условий минимума следует, что оценки являются решениями алгебраической системыуравнений

(6.33)

Данную систему уравнений часто называется нормальной системой. В матричных обозначениях она имеет вид

, (6.34)

где -вектор наблюдений,-вектор оценок параметров,

–регрессионная -матрица.

При условии, что матрица – невырожденная, решение (6.33) можно записать в виде

. (6.35)

Часто в качестве функций принимают степенные функции, т.е.. В этом случае регрессионная матрица имеет вид

. (6.36)

Уравнение для нахождения неизвестного вектора параметров будет иметь вид

. (6.37)

Эту систему уравнений можно решить либо методом Гаусса, если она не слишком большой размерности, либо итерационными методами.

Проведем обработку экспериментальных данных (26 измерений) представленных на рисунке 6.1 «звездочками». Из рисунка видно, что зависимость переменных друг от друга является нелинейной. Очевидно, что интерполяционную кривую строить не имеет смысла. Аппроксимируем наши данные полиномом третьей степени, т.е. представим нашу кривую в виде

.

Основная задача определить коэффициенты . Для расчетов необходимо задать массивы данныхи, построим программу, используя соотношение (6.37). Экспериментальные точки и регрессионная кривая представлены на рисунке 6.1.

Рисунок 6.1. Экспериментальные данные и регрессионная кривая

Программа 6.1

for i=1:4,

for j=1:4,

a(i,j)=sum(x.^(i+j-2));

end;

c(i)=sum(y.*x.^(i-1));

end;

b=inv(a)*c’;

ye=b(1)+b(2)*x+b(3)*x.^2+ b(4)*x.^3;

plot(x,y,’*’,x,ye)

Соседние файлы в предмете Численные методы