Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КЛ по ВТиП-часть2.pdf
Скачиваний:
193
Добавлен:
21.02.2016
Размер:
3.35 Mб
Скачать

Лекция 8. Метод наименьших квадратов

Постановка задачи

Определение вида функциональных зависимостей, получаемых в физическом эксперименте, имеет очень важное значение. Так, в результате эксперимен-

тов часто получают совокупность точек (x1 , y1 )...(xN , yN ), абсциссы которых {xk } различны. Одно из назначений численных методов – определение формулы вида y = f (x), которая связывает эти переменные, точнее – выбор класса допустимых формул, коэффициенты в которых должны быть определены.

Если все численные значения {xk }, {yk } известны с несколькими знаками

точности, то интерполяционный полином может быть с успехом использован, иначе это невозможно. В некоторых экспериментах применяется специализированное оборудование, позволяющее получить измеряемые точки, по крайней мере, с пятью знаками точности. Однако большинство экспериментов проводится на оборудовании, которое надежно дает только три или меньше знаков точности. Часто в измерении присутствует экспериментальная ошибка. И хотя

записываются три цифры для значений {xk }, {yk }. Подразумевается, что ис-

тинное значение f (xk ) удовлетворяет равенству:

 

f (xk )= yk + εk

(8.1)

где εk – ошибка измерения.

Для определения лучшего приближения функции к полученным точкам, проведем исследование ошибок (также называемых отклонениями или ос-

татками):

 

εk = f (xk )yk , для 1 k N .

(8.2)

Существует несколько норм, которые можно использовать с остатками в (8.2), чтобы измерить, насколько далеко от данных лежит кривая y = f (x).

Максимальная ошибка:

E( f )= max{

 

 

 

f (xk )yk

 

}

 

 

 

(8.3)

 

 

 

 

 

 

 

 

1kN

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

N

 

 

 

 

Средняя ошибка:

E1

( f )=

 

f (xk )yk

 

 

 

 

 

(8.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

N

k=1

 

 

 

 

 

 

 

 

1

 

 

 

( f )=

1

N

 

2

2

Среднеквадратическая ошибка:

E2

 

f (xk )yk

 

 

(8.5)

 

 

 

 

 

 

 

 

N

k=1

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим это на примере.

Пример 1. Сравнить максимальную, среднюю и среднеквадратичную ошибки для линейного приближения функции y = f (x)= 8,6 1,6 x по за-

данным точкам (1;10), (0;9), (1;7 ), (2;5), (3;4), (4;3), (5;0) и (6;1).

51

 

 

12

 

 

 

 

 

yk

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

f(xk)

 

 

8

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

-1

0

1

2

3

4

5

6

 

 

-2

 

 

 

 

 

 

Рис. 8.1

График функции y = f (x)= 8,6 1,6 x с нанесенными точками

Найдем ошибки, используя значения функции f (xk ) и εk , полученные в таблице 8.1.

 

Вычисления для нахождения E1 ( f )

и E2 ( f )

Таблица 8.1

 

 

xk

yk

f (xk )= 8,6 1,6 xk

 

 

εk

 

 

εk2

 

 

 

 

 

 

0,2

 

-1

10

10,2

 

0,04

0

9

8,6

 

0,4

0,16

1

7

7,0

 

0,0

0,00

2

5

5,4

 

0,4

0,16

3

4

3,8

 

0,2

0,04

4

3

2,2

 

0,8

0,64

5

0

0,6

 

0,6

0,36

6

-1

-1,0

 

0,0

0,00

 

 

 

2,6

1,40

E( f )= max{0,2;0,4;0,0;0,4;0,2;0,8;0,6;0,0}= 0,8

E1 ( f )= 81 (2,6 )= 0,325

E2

 

1,4

1 2

0 ,41833

( f )=

8

 

 

 

 

 

 

 

Ясно, что максимальная ошибка наибольшая и если одна точка плохая, то ее значение определяет E( f ). Средняя ошибка E1 ( f ) – просто среднее абсолютных величин ошибок разных различных точек. Она часто используется

52

благодаря простоте вычисления. Ошибку E2 ( f ) часто используют при изуче-

нии ошибок статистической природы.

Наилучшая построенная линия определяется путем минимизации одной из величин, заданных выражениями (8.3) – (8.5). Таким образом, можно найти три наилучшим образом построенные линии. Традиционно выбирается третья нор-

ма E2 ( f ) потому, что ее намного легче минимизировать.

Метод наименьших квадратов

Пусть зависимость между переменными x и y представлена таблицей данных, полученных в эксперименте:

X

x1

x2

xN

 

 

 

 

yN

Y

y1

y2

Требуется полученные данные описать некоторой функциональной зависимостью вида y = f (x). Такая зависимость должна отразить основную тенденцию изменения переменной y с изменением переменной x и сгладить слу-

чайные погрешности измерений, которые неизбежны в эксперименте.

Задача нахождения эмпирической формулы (формулы, служащей для аналитического представления опытных данных) состоит из двух основных этапов.

На первом этапе необходимо установить вид зависимости y = f (x), т.е.

решить

 

является

ли

она линейной

f (x)= a0 + a1 x ,

квадратичной

f (x)=a

0

+a

1

x+a

2

x2 ,

логарифмической

f (x)=a +a

1

ln(x)

или какой-либо

 

 

 

 

 

0

 

 

иной. Для этого экспериментальные точки наносятся на координатную плоскость и по их расположению выдвигают гипотезу о виде эмпирической зависимости.

На втором этапе, когда общий вид эмпирической функции выбран, необходимо определить числовые значения ее параметров a0 , a1 , a2 ,..., an . Критери-

ем выбора значений параметров является метод наименьших квадратов

(МНК).

В методе наименьших квадратов аппроксимирующая функция (полином) строится на основании того, что сумма квадратов невязок по всем точкам должна быть наименьшей. Т.е.:

N

 

N

 

 

 

 

 

 

F = δk

=( f (xk )yk )2 min ,

(8.6)

k=1

k=1

 

 

 

 

 

 

где δk – невязки.

 

 

 

 

 

 

 

 

 

Если взять полином в виде:

 

 

 

 

 

 

 

f (x)=a +a

1

x+a

2

x2 +...+a

m

xm

,

(8.7)

0

 

 

 

 

 

 

то F = F (a0 ,a1 ,...,am )

 

 

 

 

 

 

 

 

 

Заметим, что степень полинома m должна быть меньше числа точек N . (В случае m = N 1 получим полином Лагранжа).

53

f (x)=a0 +a1 x

Линейная аппроксимация (интерполяция)

В этом случае m = 1 , тогда аппроксимирующая функция будет иметь вид: (8.8)

Согласно МНК значения ее параметров подбираются таким образом, чтобы отклонение экспериментальных точек (xk ; yk ) от выбранной кривой было минимальным. Т.е. параметры a0 , a1 должны быть такими, чтобы сумма квадратов отклонений наблюдаемых значений yk от рассчитанных по функции

(8.8), была минимальной. Сумма квадратов отклонений от линейной функции (8.8) имеет вид:

 

N

 

 

F (a0 , a1 )= (a0 + a1 xk yk )2 min

(8.9)

Величина E2 ( f )

k=1

 

будет минимальной тогда и только тогда, когда будет

минимальной величина (8.9).

Величина F (ao ,a1 ) есть функция двух переменных. Необходимым усло-

вием экстремума такой функции является равенство нулю всех ее частных производных:

 

 

F (ao

,a1 )

= 0

F (ao ,a1 )

= 0

(8.10)

Они имеют вид:

 

a0

a1

 

 

 

 

F (a0 , a1 )

 

 

 

 

 

 

 

N

 

 

 

 

= 2(a0 + a1 xk yk )= 0

 

 

a0

 

 

 

k=1

 

 

(8.11)

 

F (a0 , a1 )

N

 

 

 

 

 

 

= 2(a0 + a1 xk yk ) xk = 0

 

a1

 

 

k=1

 

 

 

Таким образом, после преобразования имеем нормальную систему двух линейных уравнений относительно неизвестных параметров регрессии a0 , a1 .

 

 

N

N

 

 

a0 N

+ a1 xk =

yk

 

 

 

k=1

k=

1

(8.12)

 

N

N

 

N

a0 xk + a1 xk2 = yk xk

 

 

k=1

k=1

 

k=1

 

Решение системы – значение параметров a0 , a1 можно найти методом обратной матрицы1. Представим систему (8.12) в матричной форме:

N

N xk

k=1

N

 

 

 

 

 

N

 

 

xk

a

 

 

yk

 

или

k=1

 

 

a

0

 

= k=1

 

N

 

 

1

N

 

 

xk2

 

 

yk

xk

 

k=1

 

 

 

 

 

k=1

 

 

A a0 = Ba1

1 Основы работы с матрицами в MS Excel представлены в приложении 1

54