Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Метод продолжения решения по параметру и наилучшая параметризация в прикладной математике и механике

..pdf
Скачиваний:
5
Добавлен:
12.11.2023
Размер:
8.08 Mб
Скачать

1.3. Наилучший параметр продолжения

21

алгебраических уравнений считается тем лучше обусловленной, чем меньшие изменения (погрешности) решения системы вызывают малые изменения (погрешности) элементов матрицы и правой части системы.

В качестве меры обусловленности |22| матрицы

" *1 '

 

А —[а,у] — <2

i,j = 1,п»

J n .

 

строками, которой являются векторы

i = 1,п, примем отношение

модуля ее определителя det(A) = Д, к произведению квадратичных норм ее строк

ДО = -5- ^ ---- •

(»-38)

т и и У 12

*=1

В [49] доказано, что большему значению |D| соответствует лучшая обусловленность матрицы системы линейных уравнений.

Перепишем систему (1.37) в развернутом виде

' « 1

« 2

• « n + l ‘

* l,p

■ r

F l, 1

^1,2

* W i

®2,p

0

 

 

 

 

 

(1.39)

- ^ , 1 F n ,2 •

F n ^ + 1 .

■Х П+ 1ф .

. 0 .

Здесь Fij = dFi/dxj, Xiilt = dxi/dp.

22 Глава 1. Нелинейные алгебраические или трансцендентные уравнения

Решение этой системы по правилу Крамера можно записать в виде

= (-1 )’+ ,^ > * = l . n + 1-

(1.40)

Здесь А,- — определитель, получающейся из расширенной матри­ цы Якоби J вычеркиванием г-го столбца. Он в тоже время является, с точностью до знака, алгебраическим дополнением элемента од в ма­

трице системы (1.39). Если раскрыть определитель А

этой системы

по элементам его первой строки, то

 

А = (-1 )<+|одД,-, * = 1,п + 1.

(1.41)

Покажем, что справедливо следующее утверждение [68, 31, 32]:

Лемма 1. Мера обусловленности \Р\ матрицы системыуравнений (1.39) достигает наибольшего значения в том случае, когда вектор а касателен к кривой К множества решений системы уравнений (1.28) в рассматриваемой точке.

Доказательство. Исследуем на экстремум величину D как функцию от од, t = 1,п+1 (1.38), которая для матрицы системы (1.28) представляется в виде

2 ? ( a |,...,a n+i) =

Д

(1.42)

—,

где d = d\ d2 ... d„+i > 0;

 

 

d, = (одод)1/2 = 1, dp+i = (FPM l/2,

i = T ^ + l ,

/? = I7n.

Здесь нет суммирования по индексу /?.

Заметим, что так как а — единичный вектор, то d\ = 1 и величина d, таким образом, не зависит от од, i = 1, тг + 1.

Для нахождения экстремума функции D при условии аа = 1

составим функцию Лагранжа с учетом выражения (1.41) для А

 

L = (-1),+1о д ^

+7(1 “ a»a»)>

* = 1 ,» +

1,

(1.43)

где 7 — неопределенный множитель Лагранжа.

 

 

Экстремум этой функции достигается при

 

 

 

9L = ( - 1)fc+1Y

" 2^afc = 0-

к = l , n +

1,

 

дак

 

 

 

 

 

т.е. при од = (~Uk+l- 1) .

Подставив эти значения од в условие а а = 1,

27d

 

 

 

 

 

найдем множитель Лагранжа

 

 

 

 

 

7

(Д ,А ) 1/2

 

 

(1.44)

 

2d

 

 

 

 

 

 

 

1.3. Наилучший параметр продолжения

23

Таким образом, экстремум функции Лагранжа достигается при

 

а* -± (_ 1 )‘+1( Д ^ 1 ’ * =1^ ТТ-

(М5)

Если эти выражения для а* подставить в равенство (1.41), то полу­ чаем, что определитель системы (1.39) должен удовлетворять равенству

Д = ±(Д,Д<) 1/21 ■i = M * + T ,

(1.46)

и экстремум функции

Лагранжа

достигается призначениях

а* =

(_l)fc+1_ i > в точности

совпадающих с выражениями для х ^

(1.40).

Таким образом, имеют место равенства

 

 

«* = (-1)*+1^ = * М -

(1-47)

При этом, согласно (1.44), (1.46), значение множителя Лагранжа

будет равным

Д

D

 

 

(1.48)

 

7 = 2d

Т

 

 

Анализ второго дифференциала функции Лагранжа как квадра­

тичной

формы

относительно дифференциалов da*

показывает, что

модуль функции

Д

наибольшее зна-

D — — принимает в этом случае

 

 

а

 

чение

\D\ = (А,А<) 1/2 . В самом деле, знак второго дифференциала

функции Лагранжа

d2L = -2 7 (da,da,-)

определяется множителем Лагранжа 7 , который согласно формуле (1.48) положителен, если D > 0 и, следовательно, функция D принимает наибольшее значение. Знак множителя 7 отрицателен, если D < 0 и, следовательно, функция D принимает наименьшее значение. Лемма доказана. ■

Таким образом, доказано, что вектор а, определяющий, соглас­ но выражению (1.36), параметр продолжения ц, доставляет наибольшее значение абсолютной величине функции D в том случае, когда он совпа­ дает с самим вектором решения (x\ilt, х ^ , ■.., хп+1ф)Т линеаризованной системы (1.37), т.е. когда вектор а направлен по касательной к кривой множества решений нелинейной системы уравнений (1.28).

Теперь рассмотрим влияние возмущений элементов матрицы систе­ мы (1.39) на ее обусловленность. Покажем, что имеет место утверждение

24 Глава 1. Нелинейные алгебраические или трансцендентные уравнения

Лемма 2. Квадратичная погрешность решения системы уравнений (1.39), возникающая при возмущении элементов матрицы системы, достигает наименьшего значения в том случае, когда вектор а нап­ равлен по касательной к кривой множества решений системы (1.28) в рассматриваемой точке.

Доказательство. Рассмотрим сначала случай, когда с погрешностью за­ дана первая строка матрицы системы (1.39). Пусть вектор а имеет

вид (<*1, <*2>• • • « j-i. «j + s, ctj+i,. . . , an+i)T- Определитель Дг такой системы будет выражаться через определитель А исходной системы по формуле

Д£ = А + Н У + 'е Д ; = Д ( l + ( - l) i+l^ ) •

Так как рассматриваются малые возмущения е, то компоненты возмущенного решения у<)/4 можно переписать в виде

к * =

= Н ) ' + |§ ( ' - Н > <+1^ ) •

Тогда компоненты £< вектора погрешности 6 = (£i,£2. • • • 1^>+l)T решения возмущенной системы будут вычисляться по формулам

4 =

 

<+j+i. АА?

 

* = 1, « + 1.

 

 

= ( - 1) ' е_д 2 ’

 

 

,,

 

 

 

 

 

с2

= е

2 А5А.А.

Исследуем на экстремум квадратичную погрешность о

в предположении, что имеет место условие аа = I, тогда функцию

Лагранжа можно взять в виде

 

 

 

 

 

 

 

ч Д?Д,-Д:

 

 

 

 

______

 

 

L = e2-J - ^ — +'y(aiai -\),

 

<= 1,п+1.

 

 

Минимум этой функции достигается при

 

 

 

 

g = e2A

^

(_4)(_ ,)t+ 1At + 2m = o

 

 

Отсюда получаем

 

 

 

 

 

 

 

 

.2/

,\Ы-1 AjAjAjAk

k= 1,п + 1.

 

(1.49)

о* = 2е ( - 1)

7Д5

 

 

 

 

 

 

 

 

 

 

Деля fc-oe уравнение этих соотношений на m -ое, получаем равенства

 

/ | \к-т

 

 

. ,

 

 

= ( - 1)

— ,

т - \ , п +

1,

 

 

Дш

1.3. Наилучший параметр продолжения

 

 

25

позволяющие выразить ат через ак

 

 

 

/

|

Ат

 

(1.50)

 

 

 

 

Тогда определитель (1-41) системы уравнений (1.39) можно предста­

вить как

 

 

 

 

А = ( - l ) m 'а т Ат = (-l)"* -1^

—^ - т ,

т - 1, п + 1.

(1.51)

 

 

Аь

 

 

В этом случае система уравнений (1.49) принимает вид

 

ак =

 

 

 

(1.52)

7a t(AmAm)4

 

 

 

 

и может быть легко разрешена относительно а*

 

а* = ( 2*2Aj \

(-1)‘+1Д*,

т = 1,»+ 1.

(1.53)

у т(А т Ат )4у

 

 

 

 

Заметим, что в выражениях (1.50)-(1.52) нет суммирования по ин­ дексу к.

Множитель Лагранжа 7 найдем, подставив (1.53) в условие аа — 1,

 

7

А?

 

 

 

 

тогда 7 = 2е ——jи выражение (1.53) примет вид

 

 

 

АщАт

 

 

 

 

 

 

ак = (“ Оfc+1

Ajt

1, П+ 1.

(1.54)

 

 

, ТП =

 

 

 

(AmAm)1/2

 

 

 

Если

теперь эти значения а* подставить

в

формулу

(1.41), то

получим,

что

Д = (Дт Д т)1/2 и равенства (1.54)

в точности совпадут

с равенствами (1.40) для хк

т. е. будут иметь место соотношения (1.47),

а это и требовалось доказать. ■

 

 

 

Теперь рассмотрим ситуацию, когда с погрешностью задана строка матрицы системы (1.39), отличная от первой. Доказательство проведем для случая п — 1, тогда исследуемая невозмущенная система будет иметь вид

Пусть с погрешностью задана вторая строка матрицы (P\tl F\2 + е), тогда определитель Дс возмущенной системы будет выражаться через определитель исходной системы (1.55) по формуле

Д£ —

26 Глава 1. Нелинейные алгебраические или трансцендентные уравнения

При этом возмущенная система будет иметь решение

Д |+ е

Дг

у1Ф- А'

. 3/2,/х —“ Дг >

где Д] = Д2 = Fi,i, и компоненты вектора погрешности 6, учитывая малость е, примут вид

Д|

а 2Д2

д [ ( ' • i X ' - ? ) - ]

Д2 ’

а|Дг

 

Д2 *

 

Для исследования на экстремум квадратичной погрешности 62 =

е2Д^

при условии а 2 = 1 составим функцию Лагранжа

L

+ 7(ajа,- - 1), * 1, 2.

Если при исследовании этой функции на экстремум применить ранее использованный алгоритм, то получим, что компоненты вектора должны удовлетворять равенствам (1.47), и лемма для n = 1 доказана.

Наконец, рассмотрим общий случай, когда с возмущением задан некоторый столбец матрицы системы (1.39).

Для этого возмутим элементы матрицы системы, прибавив к у-му столбцу вектор e(ctj, F{j,.. -,F„j)T, где е — некоторое малое число. Тогда легко видеть, что определители возмущенной (Ас, Д<£) и невозму­ щенной (Д, Д,) систем будут связаны соотношениями Д£ = Д(1 4- е),

Д<е = Д,(1 + е), i = l , n + 1, * Ф 3, Ajt = Aj.

Решение возмущенной системы примет вид

 

yi,n = (-1)<+1^ i f = 1,п + 1,

гфз,

 

 

Д(1 +е)

 

Компоненты вектора ошибки 6 = (61, 62,

., 6п+1)т, вычисляемые

по формулам 6i = yi# -

примут вид 6,

О, i = 1, п + 1, i Ф з,

6j = (-\Ye

Aj

 

 

 

 

 

Д(1 +е)

1.3. Наилучший параметр продолжения

 

27

Поэтому квадратичная погрешность 6г — ОД

*2 _

будет равна 6i

=

-s, и при исследовании ее на экстремум в предположении, (Д(1 + е ))2

что вектор а является единичным, функцию Лагранжа можно принять в виде

L = el

Д?

+ 7(а<а< -1), * = 1, n + 1.

 

(Д(1+е))'

Если теперь при исследовании функции Лагранжа на экстремум применить алгоритм, используемый выше, то получаем доказательство леммы 2.

Изучим влияние возмущений правых частей системы (1.39) на ее обусловленность.

Покажем справедливость утверждения

Лемма 3. Квадратичная погрешность решения системы уравнений (1.39), возникающая при возмущении правых частей системы, дости­ гает наименьшего значения в том случае, когда вектор а направлен по касательной к кривой множества решений системыуравнений (1.28) в рассматриваемой точке.

Доказательство. Рассмотрим вначале случай, когда вектор возмущенной правой части системы (1.39) имеет вид (1 + е, 0, . . . , 0) , тогда вектор

погрешности будет 6 = e(x\tll, х^ , . . . , ®п+1,/»)Т и квадратичная погреш­ ность имеет вид

2

2А»А»

.

т-----

6

■ дГ ’*

* =

1,» + 1.

Функцию Лагранжа можно взять в виде

£ = е2^ 1 + 7 (а<а<_ 1)| j = l > n + l

и исследовать ее на экстремум при помощи вышеописанного приема, тогда получим, что в точке экстремума компоненты вектора должны удовлетворять равенствам (1.47), и для этого случая лемма доказана.

Доказательство для другого случая проведем на примере системы уравнений (1.55). Пусть вектор возмущенной правой части этой системы имеет вид (1, е)Т, тогда решение возмущенного уравнения будет

(Д1 - е а 2)

* У**ш -

(Д2 -

e«i)

Д

Д

и вектор погрешности примет вид

28 Глава 1. Нелинейные алгебраические или трансцендентные уравнения

Учитывая, что квадратичная погрешность с учетом условия а2 = 1 может быть записана как S2 = е2/Д 2, берем функцию Лагранжа в виде

L = е2/Д 2 + T(«|Q!j - 1), г = 1,2. Исследуя эту функцию на экстре­ мум, получаем, что в точке минимума компоненты вектора а должны вычисляться по формулам (1.47).

Таким образом, лемма доказана для п = 1. Для доказательства общего случая возмутим столбец правой части системы (1.39), прибавив

к нему вектор с(1+ а ь * и , • • • .-F»,l)T-

Учитывая свойства определителей, легко показать, что в данном слу­ чае определители возмущенной и невозмущенной систем будут связаны соотношениями

Де = Д, Д и = Д 1+ с ( Д 1+Д),' Д* = Д,(1+£г), j = 2 , n + 1.

Решение возмущенной системы и компоненты вектора ошибки можно представить в виде

«1= 1^1 + ^ - ) , S/ =

j = 2, n + l .

Следовательно, квадратичная погрешность будет равна

*2=е2( 1+2Т +^ ) ’ •>=^г+т-

При исследовании ее на экстремум, учитывая единичность векто­ ра а, функцию Лагранжа возьмем в виде L = 624- - 1). Минимум этой функции достигается при

^ = —2е2( - 1)‘+1А*

+ 2Та* = 0,

j, к = 1^Г+Т.

Таким образом, в точке минимума имеют место равенства

 

 

2 /<Д,

,

A j A j \

 

<*к —( 1)

* (,А 2

'

А3

)

(1.56)

«Д*, ш =

7

 

 

 

 

 

 

 

Тогда из условия а 2 =

1 следует, что

 

 

 

 

а; = ±(Д*ДЬ)1/2, к = 1,» +

1.

 

(1.57)

1.3. Наилучший параметр продолжения

29

Если соотношения (1.56) подставить в выражение (1.41), то с учетом (1.57) получаем

Д= ±(Д*Д*)1/2,

азначит, верно равенство ш = 1/Д, и формулы (1.56) примут вид

«* = ( - 1)*+1^ , * = U + T .

Сравнивая эти соотношения для а* с выражениями (1.40), получаем равенства

<*к — хьф,

которые означают, что минимальную квадратичную погрешность обеспе­ чивает параметр продолжения, отсчитываемый вдоль касательной к кри­ вой множества решений системы (1.28). Это доказывает лемму 3 для об­ щего случая. ■

Отметим, что при обобщении лемм 2, 3 в каждом уравнении системы (1.39) можно было принять свое значение погрешности е = е*, i = 1, п + 1. Для того, чтобы прийти к рассматриваемому случаю, доста­ точно положить е = шах |е<|, причем некоторые £,• могли быть равными нулю.

Теперь, наконец, можно доказать основной результат данной главы.

Теорема 1. Для того, чтобы система линеаризованныхуравнений (1.39) была наилучшим образом обусловленной, необходимо и достаточно в ка­ честве параметра продолжения решения системы нелинейных урав­ нений (1.28) принять длину дуги кривой множества решений этой системы уравнений.

Доказательство.

Н еобходимость. Согласно смыслу, который мы вкладываем в поня­ тие обусловленности, доказанные леммы можно объединить следующей формулировкой.

Система линейных уравнений (1.39) будет наилучшим образом обу­ словленной в том случае, когда вектор а направлен по касательной к кривой множества решений нелинейной системы уравнений (1.28) в каждой ее точке, т.е. когда будут иметь место равенства (1.47). С уче­

том этого факта выражение or2 = 1 можно записать в виде

(dp)2 = dXidXi, i = 1, n + 1,

(1-58)

откуда следует, что dp = (dxidx{)l/2 является дифференциалом длинны дуги кривой множества решений системы (1.28). Если положить, что начальной точке этой кривой соответствует значение р = 0, то параметр

30 Глава 1. Нелинейные алгебраические или трансцендентные уравнения

продолжения ц будет равен ее длине, отсчитываемой от этой точки. Необходимость доказана.

Достаточность. Выберем в качестве параметра продолжения решения ц длину кривой множества решений системы (1.28). Вектор г , касатель­ ный к этой кривой, равен г = ........ хп+\ф)т. Как отмечалось ранее, смысл единичного вектора а заключается в том, что он опреде­ ляет направление продолжения решения задачи (1.28), поэтому, в силу выбранного параметра продолжения, он тоже должен быть направлен по касательной к кривой множества решений, т. е. векторы а и г долж­ ны быть коллинеарными. Но они не только коллинеарны, но и равны, так как вектор г также единичный. В самом деле, дифференциал вы­ бранного параметра продолжения как элемент длины кривой должен удовлетворять равенству (1.38). Если это равенство разделить на (dft)2, то получим

х ^ х ^ = т 2 = 1, i = l , n + 1.

Из равенства векторов следует равенство их компонент

 

ак =

* = 1 , п + 1 .

(1.59)

Компоненты же dxk/dn = хкф при любом параметре продолже­ ния ц должны удовлетворять системе линейных уравнений (1.39), т.е. определяться в соответствии с формулами (1.40). Из соотношений (1.59) и (1.40) вытекают равенства (1.47), левая часть которых доставляет со­ ответствующие экстремумы функциям, фигурирующим в доказанных леммах. Реализация же этих экстремумов обеспечивает наилучшую обу­ словленность системы (1.39). Теорема доказана. ■

1.4.Алгоритмы, использующие наилучший параметр продолжения, и примеры их применения

Итак, показано, что процессу продолжения решения системы нели­ нейных уравнений

.F(®) = 0, F : R n+l^ R n, х 6 Rn+1, F(*o) = 0

по наилучшему параметру Л соответствует решение задачи Коши для си­ стемы обыкновенных дифференциальных уравнений продолжения ви­ да (1.37), когда вектор а в каждой точке множества решений К направлен по касательной к этой кривой, т.е. совпадает с вектором г а = dx/dX. Эту задачу Коши удобно записать в виде

] *,А = [ 1 ] » ® (*о) = *0> * € R n+1.

(1.60)

Соседние файлы в папке книги