Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач

.pdf
Скачиваний:
15
Добавлен:
25.10.2023
Размер:
14.17 Mб
Скачать

100

М И Н И М И З А Ц И Я Ф У Н К Ц И Й М НОГИ Х ПЕРЕМЕННЫ Х

[ Г л . 2

где Г =

inf J (и), а В >■ 0 — некоторая константа, не зависящая от п.

 

иеи

 

Д о к а з а т е л ь с т в о . Сначала покажем, что при выполнении условий теоремы величину а п из (8) можно искать в виде [82, 155] an==YnPn, где

• - min ( l ; - L - - — ),

0 < e i < V „ < 2(1~

e)-

(« = 0 , 1 , . . . ) , (Ю)

l

I

- UnP J

 

 

 

 

L

 

 

 

a e, Sj — заданные параметры алгоритма,

0<^е1 <

2 ^ ~ е^г 0<<в<<1.

Возможно,

или

 

 

 

 

 

 

 

 

 

Р„ =

К

I J п(Цп) 1

> ИЛИ

1J п(цп) |

<Р„ =

[ ^п (Цп) |

J

_

 

D 2

 

 

 

 

 

IUn Un Р

 

 

 

 

 

\ и п и п

 

где D — диаметр множества U. В

обоих

случаях

имеем

 

0 < P n —

~ -

< 1 ;

min | l;

■' ^

--'j <

Р„ < 1 (л =

0 , 1 , . . . ) .

 

 

 

 

 

 

 

 

 

 

( И )

Заметим, что

если ип= ип или / п (« л )= 0,

то ип — стационарная

точка. В этом случае, как уже говорилось выше, итерации прекра­ щаются и при необходимости проводится дополнительное изуче­

ние поведения функции в_ окрестности

точки

В дальнейшем

будем предполагать, что ипф и п> J n(un) # 0 .

 

 

Из формулы (1.18) при v = и„, « =

«„4-1 имеем

 

J . K ) J

(“п+1) >

a n\JnЮ |-------I ипип |2 =

 

= « J

J а (“я) I

2

I Jn (Ия) | )

 

 

 

 

Отсюда с учетом (10— 11)

получим

 

 

 

J(u n) — J (Ия+ i) > о л |/л (йя)|^1 —

>

ССПЕ I J n (йп) I >

 

> e 1e m

i n | l ; ^ ^ i | | 4 ( « n)| (« =

0 , 1 , . . . ) .

(12)

Повторяя рассуждения, аналогичные проведенным в доказатель­ стве предыдущей теоремы,' из (12) имеем /п (йп)->-0 («->-оо), а также убеждаемся в том, что в случае выпуклости /(«) последо­ вательность {«л} будет минимизирующей.

§

7]

 

 

Метод

сопряженных градиентов

101

 

Так как

 

J n («„)-»• 0, то

 

 

 

 

 

 

 

 

 

т1П { 1; ~БГ I Jn (“»)l} =

 

i Jn[fan)\

 

при)£всех) п >

п0,

и неравенство

(12) перепишется в

виде

 

 

 

 

а п ап+х > -ЦЧ J n fan) |2, п >

п0.

 

Согласно оценке

(6) |/л (ы„) |>

а„,

поэтому

 

 

 

 

 

 

an — an+i > - ^ - a 2n ,

 

п > п 0.

 

С

помощью леммы 1.2

отсюда имеем

 

 

 

 

 

 

 

 

ап <

D2

»о Ч~ 1

« > л 0;

 

 

 

 

 

евх

 

п

 

 

 

 

 

 

 

 

 

 

 

 

в

оценке'(9)

остается

принять Д =

т а х / - ^ —;

<з01

(я0 + 1 ) . А

 

 

 

 

 

 

 

 

 

(

ева

/

 

 

Упражнение. Описать различные варианты метода условного

градиента

для

функций

J

(и)

упражнений

1.15— 16, когда

U = {и : |п— их| < ^ },

или

U = {и : а^ Щ г^ р ,-,

i = l , . . . , m},

щ ^ Е т, R, a*,

pi

заданы.

 

 

 

 

 

 

 

 

Написать оценки

(4),

(9)

с указанием явных выражений для

констант С,

В через данные рассматриваемой задачи.

§7. МЕТОД СОПРЯЖЕННЫХ ГРАДИЕНТОВ

1.Пусть функция J(u)<=Cl (Em). Для минимизации этой фу ции на всем пространстве Ет можно использовать метод сопря­ женных градиентов, суть которого заключается в построении сле­ дующего итерационного процесса. Пусть начальное приближение и0 известно. Далее строим последовательность {ип} по правилам

^л+1

CLnрп (П

0,

1, •••),

( 1)

Ро ^ fao) > Р п

J

fan)

РлРл—1

fa == 1, 2, •■•),

(2)

где величины ап, рл выбираются из условий

 

 

g n (ап) = min gn (a),

gn (а) =

J (ипарп)

(3)

а>0

 

 

 

 

 

 

и

 

 

 

 

 

 

 

(J'

п), J ' (M n -i)

J ' fan))

п £ 1 !,

 

Р„ =

 

1г (Ия- i ) Is

 

 

(4)

 

 

 

 

о, « 6 / 2,

102

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О Г И Х П ЕРЕМЕННЫ Х

а. 2

а множества индексов /2 таковы, что /iU^2 = {0, 1, 2, . . . } ,

0е / 2.

В зависимости от выбора множеств /i, /2 молено получить различ­ ные варианты метода сопряженных градиентов. В‘ частности, если

/ i — 0 ,

/2= {0, 1,

2, . . . },

то Рп= 0 при всех п, и метод превратится

в уже

известный

нам

метод скорейшего

спуска.

Если

/2 = {0},

/i = {l,

2, . . . }, то получим обычный, классический вариант метода

сопряженных градиентов. Если /2= { 0 , s,

2s, 3s, . . . },

то

придем к

так называемому s -шаговому методу скорейшего спуска

(на прак­

тике часто принимают s, равным размерности и). Те значения п,

для которых Р« = 0, называют моментами обновления метода.

Оче­

видно, что J (ий)

1)

(ип)^ -. ■.

 

Оказывается,

метод

сопрялсенных градиентов сходится,

вооб­

ще говоря, быстрее градиентного метода и в то лее время нена­ много сложнее метода скорейшего спуска. Более того, для задачи минимизации квадратичной функции метод сопряженных градиен­ тов в отличие от градиентных методов сходится за конечное число шагов (см. ниже теорему 1). Отсюда следует, что эффективность метода сопрялсенных градиентов возрастает на завершающем эта­ пе поиска минимума, когда последовательные приблшкення близки к точке минимума, ибо в окрестности минимума достаточно глад­ кая функция, вообще говоря, близка к квадратичной выпуклой функции. Это обстоятельство подтверждается таклсе и практиче­ ским опытом решения конкретных задач минимизации.

Принятая здесь схема (1) — (4) метода сопряженных градиен­

тов предложена и исследована в работе [190]1; обзор

других схем

и модификаций, обсуждение практического опыта

применения

этого метода см. в работах [27, 35, 84, 149, 166, 170, 190, 235, 266].

Перейдем к исследованию сходимости метода сопрялсенных

градиентов. (1) — (4). Для этого сначала докалсем

некоторые свой­

ства последовательностей,

получаемых

по формулам (1)-— (4).

 

Л е м м а

1. Пусть

J ( u ) ^ C l (E,„).

Тогда

при любом

выборе

множества индексов Д,

/2,

лишь бы /1U/2 =

{0,

1,

2, . . . }, Of=/2,

по­

следовательности {пп}, {Рп} удовлетворяют соотношениям

 

(J'(un+l) ,p n) = О,

(J'(u n) ,p n) = \J’ (un)\z

(п =

0, 1, . . . )

(5)

и

 

 

 

 

 

 

 

 

 

|р„Г =

1^(«„)|2 +

Рл|рп-.|2 > | Д (и л)|2 (Л =

1,2, . . . ) .

 

(6)

Д о к а з а т е л ь с т в о .

Соотношения

(6)

являются

простым

следствием равенств (2), (5), поэтому достаточно доказать (5). Воспользуемся методом полной математической индукции. Так

как /?о = Д («о), то второе из

равенств

(5)

при

п = 0

очевидно, а

1 Следует заметить, что в [190]

выражение для

|3П дано с точностью до зна­

ка. Это проще всего обнаружить проверкой условия

[Арп, Рп-0 = 0 , имеющего

место для квадратичных функций^

(см. ниже

лемму

2);

эта же

ошибка по­

вторена в работе [35].

 

 

 

 

 

 

S 7]

 

Метод сопряженных градиентов

 

103

равенство

 

 

J'(u 0) ) —0

следует

из того, что

g '(a 0) = 0 при ао> 0

и

g'Q(ct-0) > 0 при а0 = 0 и формулы

(1.4).

"Пусть равенства

(5)

имеют место при некотором п^О . Пока­

жем, что тогда

(5)

 

верно и для

п + 1.

В самом деле, если

а „ > 0 ,

то согласно (3)

 

 

 

 

 

 

 

 

 

ё'пК ) =

~

(J>(ип — апРп), Рп) =

(J' (Ы/Н-l). р„) = о.

 

Если же а„ = 0,

то ип+1 = и„ и

 

 

 

 

 

0 < g'n (0) =

( j’ («„), р„) =

— (/' (иа),

J' (ип) — P„pn_l) =

 

=

— |

(«„) I2 =

— |/' (un+i) |2 < О,

 

 

следовательно, /' («„+]) =

0 и ( J ' (ип+1), рп) = 0. Наконец,

 

(J ' (Un+l)i p n + l) — { J ' (Un+l), j ' (Цл+1)

Рл+lPn) = |J '

( Lin + 1)|2- A

2.Сначала остановимся на случае квадратичной функции

J(u) = ± ( A u ,u ) - { b ,u ) ,

(7)

где Л — известная симметричная положительно определенная матрица порядка m X m , Ь— заданный вектор. К задаче миними­ зации такой функции сводится решение системы линейных алге­ браических уравнений А и = Ь . В самом деле, здесь

J' (и) = Аи Ь.

(8)

Так как J (и) — выпуклая (и даже сильно выпуклая) функция, то согласно теореме 1.3 m in/(«) будет достигаться в точке и* тогда

Еm

и только тогда,

когда / '(«*) = А и * —Ь0.

 

Для минимизации функции (7) применим метод сопряженных

градиентов.

Так как

 

 

 

8п («) =

J

(«л — арл) =

-j-

а 2 (Лрп, Рп) — a (J' («„), р„) + J Ю ,

то min g n (а)

достигается

при .

 

а>0

 

 

 

 

 

 

а = а п

( J (Цд), Рп)

I г Ы I2 > 0 , п = 0, 1,

О)

 

 

 

( Арп ,Рп)

(Арп, Рп)

 

Преобразуем выражение для (Зп. Для этого прежде всего заметим, что

J' (un) — J' (Un+l) = а пАрп, П = 0, 1, . . .

(10)

Это равенство непосредственно следует из (1), (8). Пользуясь исходными формулами (1) — (4) и равенствами (5), (10), полу­ чаем

104 М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х [О . 2

 

(J'

(«„),. J' (u„_i) — J' {и,,)) =

а „ _ 1

(/' («„), Лр„_1) ,

IJ'

( « л - 1) I2 =

 

 

 

 

=

(J7 («л—0> Pn—l)

(Цп—l)

Д

{Цп)г Pn—l)

 

 

 

 

 

 

 

 

-

ал_1 (Лр„_ь р„_0

(/г =

1, 2, ...)•

 

 

 

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п) ,

Дрл-х)

п =

1,2,

 

 

 

 

( П )

 

 

 

 

 

 

№ л -1 , P n -l)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Как

видим,

для

функции

(7)

‘ метод

(1) — (4)

 

при /2 =

{0},

(/Г1= {1, 2, ...} совпадает

 

с

 

методом

сопряженных

градиентов,

описанным, например, в работе [9].

 

 

 

 

 

 

 

 

Л е м м а

2. Если /2 =

{0},

/i =

{l, 2,

...}, то

для

последова­

тельностей {tin}, {Рп}, получаемых по

формулам

(1),

(2),

(9),

(11),

справедливы соотношения

 

 

 

 

 

 

 

 

 

 

 

 

(J' («(). Pi) =

0

(I >

/),

(Д («О, Д («0) = 0

(t

 

/),

 

 

 

 

 

(Pi. APj) =

 

0

(iф j),

i, j =

0, 1, 2, . . .

 

 

 

 

(12)

 

Д о к а з а т е л ь с т в о

проведем по индукции. Имеем (Д(«х), р0) =

=

(Д(«х), Д (« о)) =

0

в силу

(5) ;

 

 

 

 

 

 

 

 

 

 

 

 

И Р х . Ро) =

(Pi. АРо) =

Ы — PiPo. АРо) =

 

0

 

 

в

силу

(11).

Предположим,

что

равенства

(12) доказаны

для ^всех

I,

/ < «

при некотором « >

1

и покажем, что (12) тогда

будут верны

при всех i, / < « - 1 - 1 .

Для

этого достаточно доказать,

что

 

 

(Ия+i), рг) = (Л («„+,), Д (up) = (р„+1, Лр,)]= 0, t = 0, 1, . . . , п.

Сначала убедимся в том,

что (Д («„+i), р;) = 0. При W — п

это сле­

дует из (5), а при

с учетом (10) и предположения

индукции

будем иметь

 

 

(7' (ы„+1), р;) = (Л («„) — а„Лр„, р;) = 0.fJ

Тогда

(Л («„+1), 7' («,)) = (Л («„-и), рг + PiPi-i) = 0!)’

при i = 1 ,■2, .. •, п и при i = 0

 

(J' («л+l),

Л («о)) = (Л (fi/l+l)i Ро) = 0.

Наконец,

с учетом (2), (10) и

предположения индукции при'всех i,

0 -< i < п

имеем

 

 

(Лр„+ь р£) = (р„+ь Лрг) = (Л («л+0 — pn+ip„, Лр(.) =

=

(Л («л+i), Лр,) =

(Л («„+]), Л («г) — Л («г+i)) = 0,

 

 

а,-

 

§

7]

 

Метод сопряженных градиентов

 

 

105

а

в случае i =

n

(рп+ь Арп) = (/' (ип+\) — pn+iPn> Ар„) = 0

в силу

формулы (И ). А

 

 

 

 

 

 

 

 

 

Т е о р е м а

1.

Если

/2 = {0}, / ]= {1 , 2, . . . },

то

метод

сопря­

женных градиентов для

квадратичной

функции

(7)

сходится к

точке минимума не более, чем за tn шагов

размерность и).

 

Д о к а з а т е л ь с т в о .

Как следует

из

леммы 2, последова­

тельность У '(ип)}, получаемая методом сопряженных градиентов,

ортогональна: (/'(ы,-), 1 '( щ ))= 0 ( i^ j, i, /=0, 1, 2, . . . ) . Однако в m-мерном пространстве не может быть более чем т ненулевых взаимно ортогональных векторов. Следовательно, найдется наи­ меньший номер п, 0-^.п^.т , такой, что J'(u n) = 0 . Так как /(и) — выпуклая функция, то ип— точка минимума функции (7) в Ет. А

3.

 

Рассмотрим метод сопряженных градиентов для сильно в

пуклых функций.

 

 

J (и) — сильно

 

 

 

 

 

 

Ет,

Т е о р е м а

2.

Пусть

 

выпукла

на

J (и) <=С1(Ет) , и

\J'{u)—J'(v) \ ^ Ь\иv\

при

всех

и, а е £ т ,

L = const. Тогда

при любом

выборе

множества

индексов

h ,

0е / 2

и любом начальном приближении и0 для

последовательности

{«„}

из (1 )— (4)

справедливы оценки

 

 

 

 

 

 

 

 

 

 

0 <

а п=

J («„) — J* < a0qn, \ип — и‘ |2 <

a0qn, п =

0,

1, . ••, (13)

 

 

 

 

 

 

 

 

 

 

И-

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J" —

 

inf

 

=

 

< 7 = 1 -

 

L2)

,

0 < ? < 1 ,

 

 

 

 

и € Е т

 

 

 

 

 

2L (р2 +

 

 

 

 

 

 

 

р — константа из

(1.12).

 

 

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Из

теоремы

1.7 следует,

что

нижняя

грань /(и)

 

на Е т конечна

и достигается в

единственной точке и*:

/ (и *)= / *.

 

Функция g n ( a )

= J (ип— арп)

при рпФ 0 также сильно

выпукла при а 13г0 ,

поэтому

an

из условия

(3)

определяется одно­

значно.

Можно

считать,

что

рп¥=0, а п> 0,

/'(.«„)

0

 

при

всех

п = 0, 1, ...

,

ибо в противном случае J'{iin) — 0,

и ип= и*

— точка

минимума.

 

В силу

выбора

a„: J(u n+i) ^

J (ип— арп) при всех

а ^ 0 . Поэтому с помощью формулы

(1.18)

при v =

un, и= ипа р п

будем иметь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J (Цп)

J ( u n + l)

^

j (Цп)

{Цп

 

ЫРп)

 

 

 

 

 

 

 

 

 

> a (J' (ип), рп) -----'EL. |

|3,

а > 0 .

 

 

 

 

 

Используя

второе равенство

(5),

отсюда получаем

 

 

 

 

 

J (и„) J

(ип+1) > а |J' (и„) |2 —

a2L

[р„|2,

a > 0 ,

л =

0,

1,

. . .

(14)

2

106

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х

ПЕРЕМЕННЫ Х

[Гл. 2

Далее докажем оценку

 

 

 

 

 

 

vL|p„|2<

|/'(«„) |2, у =

*

,

п = 0, 1, . . .

 

(15)

 

 

L (1 + L-p, 2)

 

 

 

По теореме 1.4

(/' (ип)

 

 

р |

 

|2, а

так как

ипип-\— an_i/?„_i, то с

учетом

соотношений

(5),

(6)

имеем

ра2_, |рп- 1 12

< а;г_ , (/' (и„_i),

p„_i)

=

a„_i |/' (u„_i)

|2,

или

pa„_i |p„_i |2 < |J' («„_i)|2. Тогда из (4)

to | I J' (un) I L I ип — un_i 1 ^ - 1

J' (un) I Lo.n-i I Pn-i I

_

L,

\J' (un) |

I Ря I

 

* т// \(Л

^

 

 

,

 

,9

'

|X

.

, 9

 

 

U

(“n-l)|S

 

 

 

p-a,,,! I

 

I2

I Pn-l I

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

| M lP n - l| < — \J'{Un)\.

 

 

 

 

 

 

 

 

 

 

 

V-

 

 

 

 

 

 

 

Подставим это неравенство в

(6)

и получим

 

 

 

 

I РпI2=

I J' (un) Is +

Рд I Рп-: I2<

(1 +

 

|J' («„) Г,

 

что равносильно

(15).

 

 

 

 

 

 

 

 

 

 

 

Теперь нетрудно доказать оценки (13).

С

учетом

неравенства

(15) и (14)

имеем апап+1 >

cz ^ 1

Ц'(«„)|2 при любых а > 0 .

Следовательно,

 

 

 

 

 

2v

J

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ап — ап+1 >

max а ( 1 —

 

|J' (ы„) |2 =

 

\J'.(u„)\2

(п — 0,

1, . . . ) .

Но |J' (un) I2 >

\хап (см. теорему

1.6),

 

поэтому

ап — an+i >

^ ~ -аП,

илиап+1 < ^ 1 -----y ^ ^ an = qa,„

(л = 0 , 1 , . . . ) . Отсюда

имеем а п <

(л =

0,

1, . ■•)• Вторая из оценок

 

(13)

немедленно следует из

первой оценки и

неравенства

(1.15) при u =

un.

Остается заметить,

что 0 < < 7 < 1 ,

ибо р < L (см. замечание к теореме 1.5). ^

 

4.

В

заключение

заметим,

что

для'

минимизации гладк

функции J (и)

на замкнутом

выпуклом

множестве

1]ф Е т можно

использовать метод проекции сопряженных градиентов по схеме:

ип+\ = Ри(ипa-nPn) (n = 0 ,

1; .. . ), где

рп определяется согласно

(2), (4), величина ап> 0

выбирается

из условия

монотонности

J(u n)^J(u-n+\)■ Этот метод позволяет

за конечное

число шагов

найти точку минимума квадратичной функции (7) на параллелепи­ педе [190]; в общем случае сходимость метода проекции сопряжен­ ных градиентов, по-видимому, не исследована.

S «]

 

 

 

 

 

 

Метод Ньютона

 

 

 

 

 

 

 

 

107

Упражнения. 1. Показать, что точка ип, полученная методом

сопряженных градиентов для функции

(7)

при / г = {0 },

есть точка

минимума J (и) на гиперплоскости, проходящей через

точку

и0 и

натянутой

на векторы {/'(«й)}

(&= 0,

1, . . . ,

п— 1).

 

Опираясь на

лемму

2, выяснить

геометрический

смысл

метода

сопряженных

градиентов [19].

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

 

 

Описать

метод

сопряженных

градиентов

для

функц

J(u ) =

 

\Au—b |2

из упражнения 1.16.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

§

8. МЕТОД НЬЮТОНА

 

 

 

 

 

 

 

1.

 

Пусть функция / (u )^ C 2(U) , где

U — заданное

множес

в Ет, в частности, может быть

U = E m. Для

решения

задачи

ми­

нимизации J (и) на

U можно использовать метод Ньютона, заклю­

чающийся

в

следующем

[155].

Пусть

взято

некоторое

начальное

приближение u0^.U. Если уже

известно

n-е

приближение ип-, то

приращение функции J ( u ) ^ C 2(U)

в точке ип можно

представить

в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J ( и )

J

 

 

= ( J ’ ( « „ ) , и — ип) +

Y

(J" ( и „ )

и„),

и ип) +

 

 

 

 

 

 

 

+ о(\и — ип\у.

 

 

 

 

 

 

 

 

 

Возьмем квадратичную часть этого приращения:

 

 

 

 

 

 

 

 

 

J n (u) =

(J'(u n), и — ип) + ~^(J"(un)(u — ип),

и — ип).

 

 

Следующее

приближение

 

1

определяем

из

условия

минимума

J n{u)

на JJ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J п (un+i) =

min J n (и).

 

 

 

 

 

 

 

(1)

 

 

 

 

 

 

 

 

 

u&U

 

 

 

 

 

 

 

 

 

 

В

случае,

когда

и =

Еф

в точке

минимума

J n (u)

на U

произ­

водная

j'n (и) = J' (ип) + J" (ип) (иtun)

обращается в

 

нуль,

т.

е.

f n (un+l) = J' (ип) + J" (ип) («п+1 ип) = 0.

Если

 

матрица

J" уип)

не­

вырождена,

 

то

отсюда

будем

иметь

ип+\ =

ип[J" (un)]~l J ' (ип),

п — 0,

 

1 , . . . .

Как

видим,

в

случае U = Em описанный

итера­

ционный. процесс превращается в хорошо известный метод Нью­ тона [19] для решения уравнения //(и )= 0 , определяющего стацио­ нарные точки функции /(ц). Отсюда происходит название метода и в общем случае.

Будем

предполагать,

что

имеется

некоторый эффективный

алгоритм

для решения

задачи (1)

при каждом п = 0, 1, 2,....

В случае

£ / = £ т таким

алгоритмом может служить метод сопря­

женных градиентов, описанный

в предыдущем параграфе, а- так:

108

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х

же различные другие методы (см., например, [19]) решения систем

линейных

алгебраических уравнений

J'{u n) + J" (u n) (un+i—un) = 0 .

В случае

U=^=Em при решении задачи

(1) можно воспользоваться

одним из методов, описанных в предыдущих параграфах.

Нужно заметить, что задача (1)

в общем случае может ока­

заться весьма трудоемкой. Но несмотря на это, применение метода Ньютона во многих случаях оправдано, ибо он сходится значи­ тельно быстрее, например, градиентных методов, если только на­ чальное приближение выбрано Достаточно близко к искомой точке минимума функции. Обычно метод Ньютона и его модификации применяют на завершающем этапе поиска минимума, когда с по­ мощью каких-либо более 'грубых, но менее трудоемких методов уже найдена некоторая точка, достаточно близкая к точке мини­ мума.

Т е о р е м а

1.

Пусть

J (u ) ^ C 2(U)

на

выпуклом замкнутом

множестве

U ^ E m,

пусть

р|£|2<

(/ "(« )ё,

£)

при всех

и

u^ U , и

\\J"(и )— /"(и) ||<^L|u— v\

при

всех

и,

v^ U ,

где р, L

некоторые положительные константы. Тогда

задача

 

(1)

разреши­

ма при всех п — 0,

1, ... Кроме того, если

начальное

приближение

Ыо выбрано так,

что q = —

[

— Ио|<1,

то имеет место следующая

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оценка скорости сходимости метода Ньютона:

 

 

 

 

 

 

 

 

 

оо

 

 

 

 

 

 

 

 

 

 

K - « * K - f - £ < 7 24

 

 

 

 

 

 

 

 

 

где и — точка минимума J

(и) на U.

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

По условию

(/"(«)£,

|)^ р | ё|2 при всех

u e t i и

 

 

p = co n st> 0 .

Отсюда и

из теоремы

1.5 вытекает,

что функция J (и) сильно выпукла на U, и, следовательно, соглас­

но теореме 1.7 ограничена снизу на U

и достигает своей нижней

грани

в

единственной

 

точке

u *^ U .

 

Далее,

поскольку

J п (и) =

J" (ип),

то

функция J n (u)

также сильно выпукла на U и

достигает своей

нижней

грани

в единственной

точке

un+i^ U .

Таким образом, задача (1) всегда имеет и

притом

единственное

решение. Применив теорему 1.3 к

функции J n (u),

получим

(J'n{un+X), и ип+1 ) > 0 ,

u £ U ,

 

п = 0,

1 , . . .

(3)

Так как

J n(u) =

J'(u n) + J''(u„)(u ип),

то (3)

перепишется в виде

(J' (ип) + J" (u n) (un+i — un),

и — ип+{) > 0,

 

u £ U ,

 

п =

0 , 1 , . . . .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4)

Может случиться, что ип+\= ип. Тогда и* = ип+х= ип. В самом, деле, в этом случае из (4) имеем (J'(un), и— « „ )^ 0 , ыеС/. Со­

§ 8]

Метод Ньютона

109

гласно теореме

1.3 это означает, что в точке и* =

ип функция J (и)

достигает своего минимума на 0, и, следовательно, задача решена.

Поэтому ниже всюду

будем

считать «п+1=#=н„(/г=0,

1, ... ).

 

'

В

(4)

положим

и— ип.

Получим

(/'(«„) + J" (u n) (un+I—,и„),

ип— «n-ьi) ^ 0 .

С

учетом

этого неравенства

и условия

теоремы

имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(А I ^п+1

Мп |2 ^

( J

(ип) (МпЦ-1

Г ^л) >

un+l

 

Мп)

(J

(ttn) ,

Un

Ип-\-\)>

 

 

 

 

 

 

 

п = 0,

1, . . .

 

 

 

 

 

 

 

(5)

Оценим ’(/ '(“«)>

1ип — Чп+\) сверху.

Для)

этого в

(3)

заменим

п на

t v

1.

Получим {J 'n- 1 (и„),

и — и „ )> 0,'

u e U ( n >

1). В частности,

при и = Ып+1 отсюда находим (/„-i (ип),

ипurt+i) <

0.

С

учетом

этого

неравенства,

формулы

(1.7) и условия Липшица для

J ” (и) бу­

дем

иметь)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(J' (Мп)> ип

W/1+l)

(«7 (^л)

*7л—1 (^л)> “ л

^n+l)

 

 

 

=

(«л)

(Л (wn—l)

*7 (Ыл—l) (ыл

 

—0 > ил ^rt+l)

 

 

 

=

([/ ' (£/._1 +

0 (и„ — U „_i)) — 7 " (Ид- l ) ]

(«„ —

Ип_1),Ип —

« л + 0 <

 

 

 

Lt |

йл—112 1^л

^л^-11*

 

^

2, .. .

 

 

 

Подставив

полученную)(оценку) в

(5), получим

 

 

 

 

 

 

 

 

|«п-ы — и „ |<

— U „ — «л- l l 2,

 

п =

1 , 2 , . . .

 

 

(6)

Так! [как^ по условию

q =

— \u^— uQ|< il ,

то'

из

(6)

гпри п = 1

?вы-

текает |и2— u j <

q2.

Сделаем индуктивное предположение:

 

 

 

 

 

 

L

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|ип — ип1 1<

i

<72"

1(п > 1).';

 

 

 

 

 

Тогда

из (6) имеем, что

 

 

 

 

 

 

 

 

 

 

 

 

|и*+1 — «*|

k = 0, 1, 2, .. ..

Соседние файлы в папке книги из ГПНТБ