книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdf100 |
М И Н И М И З А Ц И Я Ф У Н К Ц И Й М НОГИ Х ПЕРЕМЕННЫ Х |
[ Г л . 2 |
где Г = |
inf J (и), а В >■ 0 — некоторая константа, не зависящая от п. |
|
|
иеи |
|
Д о к а з а т е л ь с т в о . Сначала покажем, что при выполнении условий теоремы величину а п из (8) можно искать в виде [82, 155] an==YnPn, где
• - min ( l ; - L - - — ), |
0 < e i < V „ < 2(1~ |
e)- |
(« = 0 , 1 , . . . ) , (Ю) |
|||||||
l |
I |
- UnP J |
|
|
|
|
L |
|
|
|
a e, Sj — заданные параметры алгоритма, |
0<^е1 < |
2 ^ ~ е^г 0<<в<<1. |
||||||||
Возможно, |
или |
|
|
|
|
|
|
|
|
|
Р„ = |
К |
I J п(Цп) 1 |
> ИЛИ |
1J п(цп) | |
<Р„ = |
[ ^п (Цп) | |
J |
|||
_ |
|
D 2 |
|
|
|
|||||
|
|
IUn — Un Р |
|
|
|
|
|
\ и п — и п |а |
|
|
где D — диаметр множества U. В |
обоих |
случаях |
имеем |
|
||||||
0 < P n — |
~ - |
< 1 ; |
min | l; |
■' ^ |
--'j < |
Р„ < 1 (л = |
0 , 1 , . . . ) . |
|||
|
|
|
|
|
|
|
|
|
|
( И ) |
Заметим, что |
если ип= ип или / п (« л )= 0, |
то ип — стационарная |
точка. В этом случае, как уже говорилось выше, итерации прекра щаются и при необходимости проводится дополнительное изуче
ние поведения функции в_ окрестности |
точки |
В дальнейшем |
|||
будем предполагать, что ипф и п> J n(un) # 0 . |
|
|
|||
Из формулы (1.18) при v = и„, « = |
«„4-1 имеем |
|
|||
J . K ) — J |
(“п+1) > |
a n\JnЮ |-------I ип— ип |2 = |
|
||
= « J |
J а (“я) I |
2 |
I Jn (Ия) | ) |
|
|
|
|
|
|||
Отсюда с учетом (10— 11) |
получим |
|
|
|
|
J(u n) — J (Ия+ i) > о л |/л (йя)|^1 — |
> |
ССПЕ I J n (йп) I > |
|
||
> e 1e m |
i n | l ; ^ ^ i | | 4 ( « n)| (« = |
0 , 1 , . . . ) . |
(12) |
Повторяя рассуждения, аналогичные проведенным в доказатель стве предыдущей теоремы,' из (12) имеем /п (йп)->-0 («->-оо), а также убеждаемся в том, что в случае выпуклости /(«) последо вательность {«л} будет минимизирующей.
§ |
7] |
|
|
Метод |
сопряженных градиентов |
101 |
||||||
|
Так как |
|
J n («„)-»• 0, то |
|
|
|
|
|
|
|||
|
|
|
т1П { 1; ~БГ I Jn (“»)l} = |
|
i Jn[fan)\ |
|
||||||
при)£всех) п > |
п0, |
и неравенство |
(12) перепишется в |
виде |
||||||||
|
|
|
|
а п — ап+х > -ЦЧ J n fan) |2, п > |
п0. |
|
||||||
Согласно оценке |
(6) |/л (ы„) |> |
а„, |
поэтому |
|
|
|||||||
|
|
|
|
an — an+i > - ^ - a 2n , |
|
п > п 0. |
|
|||||
С |
помощью леммы 1.2 |
отсюда имеем |
|
|
|
|
||||||
|
|
|
|
ап < |
D2 |
»о Ч~ 1 |
« > л 0; |
|
||||
|
|
|
|
евх |
|
п |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||
в |
оценке'(9) |
остается |
принять Д = |
т а х / - ^ —; |
<з01 |
(я0 + 1 ) . А |
||||||
|
|
|
|
|
|
|
|
|
( |
ева |
/ |
|
|
Упражнение. Описать различные варианты метода условного |
|||||||||||
градиента |
для |
функций |
J |
(и) |
упражнений |
1.15— 16, когда |
||||||
U = {и : |п— их| < ^ }, |
или |
U = {и : а^ Щ г^ р ,-, |
i = l , . . . , m}, |
|||||||||
щ ^ Е т, R, a*, |
pi |
заданы. |
|
|
|
|
|
|
|
|||
|
Написать оценки |
(4), |
(9) |
с указанием явных выражений для |
||||||||
констант С, |
В через данные рассматриваемой задачи. |
§7. МЕТОД СОПРЯЖЕННЫХ ГРАДИЕНТОВ
1.Пусть функция J(u)<=Cl (Em). Для минимизации этой фу ции на всем пространстве Ет можно использовать метод сопря женных градиентов, суть которого заключается в построении сле дующего итерационного процесса. Пусть начальное приближение и0 известно. Далее строим последовательность {ип} по правилам
^л+1 |
^л |
CLnрп (П |
0, |
1, •••), |
( 1) |
||
Ро ^ fao) > Р п |
J |
fan) |
РлРл—1 |
fa == 1, 2, •■•), |
(2) |
||
где величины ап, рл выбираются из условий |
|
|
|||||
g n (ап) = min gn (a), |
gn (а) = |
J (ип— арп) |
(3) |
||||
а>0 |
|
|
|
|
|
|
|
и |
|
|
|
|
|
|
|
(J' |
(ип), J ' (M n -i) — |
J ' fan)) |
п £ 1 !, |
|
|||
Р„ = |
|
1г (Ия- i ) Is |
|
|
(4) |
||
|
|
|
|
о, « 6 / 2,
102 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О Г И Х П ЕРЕМЕННЫ Х |
[Г а. 2 |
а множества индексов 1ц /2 таковы, что /iU^2 = {0, 1, 2, . . . } , |
0е / 2. |
В зависимости от выбора множеств /i, /2 молено получить различ ные варианты метода сопряженных градиентов. В‘ частности, если
/ i — 0 , |
/2= {0, 1, |
2, . . . }, |
то Рп= 0 при всех п, и метод превратится |
|||
в уже |
известный |
нам |
метод скорейшего |
спуска. |
Если |
/2 = {0}, |
/i = {l, |
2, . . . }, то получим обычный, классический вариант метода |
|||||
сопряженных градиентов. Если /2= { 0 , s, |
2s, 3s, . . . }, |
то |
придем к |
|||
так называемому s -шаговому методу скорейшего спуска |
(на прак |
тике часто принимают s, равным размерности и). Те значения п,
для которых Р« = 0, называют моментами обновления метода. |
Оче |
||
видно, что J (ий) |
(« 1) |
(ип)^ -. ■. |
|
Оказывается, |
метод |
сопрялсенных градиентов сходится, |
вооб |
ще говоря, быстрее градиентного метода и в то лее время нена много сложнее метода скорейшего спуска. Более того, для задачи минимизации квадратичной функции метод сопряженных градиен тов в отличие от градиентных методов сходится за конечное число шагов (см. ниже теорему 1). Отсюда следует, что эффективность метода сопрялсенных градиентов возрастает на завершающем эта пе поиска минимума, когда последовательные приблшкення близки к точке минимума, ибо в окрестности минимума достаточно глад кая функция, вообще говоря, близка к квадратичной выпуклой функции. Это обстоятельство подтверждается таклсе и практиче ским опытом решения конкретных задач минимизации.
Принятая здесь схема (1) — (4) метода сопряженных градиен
тов предложена и исследована в работе [190]1; обзор |
других схем |
и модификаций, обсуждение практического опыта |
применения |
этого метода см. в работах [27, 35, 84, 149, 166, 170, 190, 235, 266].
Перейдем к исследованию сходимости метода сопрялсенных
градиентов. (1) — (4). Для этого сначала докалсем |
некоторые свой |
||||||||
ства последовательностей, |
получаемых |
по формулам (1)-— (4). |
|
||||||
Л е м м а |
1. Пусть |
J ( u ) ^ C l (E,„). |
Тогда |
при любом |
выборе |
||||
множества индексов Д, |
/2, |
лишь бы /1U/2 = |
{0, |
1, |
2, . . . }, Of=/2, |
по |
|||
следовательности {пп}, {Рп} удовлетворяют соотношениям |
|
||||||||
(J'(un+l) ,p n) = О, |
(J'(u n) ,p n) = \J’ (un)\z |
(п = |
0, 1, . . . ) |
(5) |
|||||
и |
|
|
|
|
|
|
|
|
|
|р„Г = |
1^(«„)|2 + |
Рл|рп-.|2 > | Д (и л)|2 (Л = |
1,2, . . . ) . |
|
(6) |
||||
Д о к а з а т е л ь с т в о . |
Соотношения |
(6) |
являются |
простым |
следствием равенств (2), (5), поэтому достаточно доказать (5). Воспользуемся методом полной математической индукции. Так
как /?о = Д («о), то второе из |
равенств |
(5) |
при |
п = 0 |
очевидно, а |
|
1 Следует заметить, что в [190] |
выражение для |
|3П дано с точностью до зна |
||||
ка. Это проще всего обнаружить проверкой условия |
[Арп, Рп-0 = 0 , имеющего |
|||||
место для квадратичных функций^ |
(см. ниже |
лемму |
2); |
эта же |
ошибка по |
|
вторена в работе [35]. |
|
|
|
|
|
|
S 7] |
|
Метод сопряженных градиентов |
|
103 |
|||||
равенство |
|
|
— |
J'(u 0) ) —0 |
следует |
из того, что |
|||
g '(a 0) = 0 при ао> 0 |
и |
g'Q(ct-0) > 0 при а0 = 0 и формулы |
(1.4). |
||||||
"Пусть равенства |
(5) |
имеют место при некотором п^О . Пока |
|||||||
жем, что тогда |
(5) |
|
верно и для |
п + 1. |
В самом деле, если |
а „ > 0 , |
|||
то согласно (3) |
|
|
|
|
|
|
|
|
|
ё'пК ) = |
~ |
(J>(ип — апРп), Рп) = |
— (J' (Ы/Н-l). р„) = о. |
|
|||||
Если же а„ = 0, |
то ип+1 = и„ и |
|
|
|
|
|
|||
0 < g'n (0) = |
— ( j’ («„), р„) = |
— (/' (иа), |
J' (ип) — P„pn_l) = |
||||||
|
= |
— | |
(«„) I2 = |
— |/' (un+i) |2 < О, |
|
|
|||
следовательно, /' («„+]) = |
0 и ( J ' (ип+1), рп) = 0. Наконец, |
|
|||||||
(J ' (Un+l)i p n + l) — { J ' (Un+l), j ' (Цл+1) |
Рл+lPn) = |J ' |
( Lin + 1)|2- A |
2.Сначала остановимся на случае квадратичной функции
J(u) = ± ( A u ,u ) - { b ,u ) , |
(7) |
где Л — известная симметричная положительно определенная матрица порядка m X m , Ь— заданный вектор. К задаче миними зации такой функции сводится решение системы линейных алге браических уравнений А и = Ь . В самом деле, здесь
J' (и) = Аи — Ь. |
(8) |
Так как J (и) — выпуклая (и даже сильно выпуклая) функция, то согласно теореме 1.3 m in/(«) будет достигаться в точке и* тогда
Еm
и только тогда, |
когда / '(«*) = А и * —Ь — 0. |
|
||||
Для минимизации функции (7) применим метод сопряженных |
||||||
градиентов. |
Так как |
|
|
|
||
8п («) = |
J |
(«л — арл) = |
-j- |
а 2 (Лрп, Рп) — a (J' («„), р„) + J Ю , |
■ |
|
то min g n (а) |
достигается |
при . |
|
|||
а>0 |
|
|
|
|
|
|
а = а п |
( J (Цд), Рп) |
I г Ы I2 > 0 , п = 0, 1, |
О) |
|||
|
|
|
( Арп ,Рп) |
■ (Арп, Рп) |
|
Преобразуем выражение для (Зп. Для этого прежде всего заметим, что
J' (un) — J' (Un+l) = а пАрп, П = 0, 1, . . . |
(10) |
Это равенство непосредственно следует из (1), (8). Пользуясь исходными формулами (1) — (4) и равенствами (5), (10), полу чаем
104 М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х [О . 2
|
(J' |
(«„),. J' (u„_i) — J' {и,,)) = |
а „ _ 1 |
(/' («„), Лр„_1) , |
IJ' |
( « л - 1) I2 = |
|
||||||||||||
|
|
|
= |
(J7 («л—0> Pn—l) |
— (Д (Цп—l) |
Д |
{Цп)г Pn—l) |
|
|
|
|
||||||||
|
|
|
|
- |
ал_1 (Лр„_ь р„_0 |
(/г = |
1, 2, ...)• |
|
|
|
|
|
|||||||
Следовательно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
(Л (ип) , |
Дрл-х) |
п = |
1,2, |
|
|
|
|
( П ) |
|||||
|
|
|
|
|
|
№ л -1 , P n -l) |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Как |
видим, |
для |
функции |
(7) |
‘ метод |
(1) — (4) |
|
при /2 = |
{0}, |
||||||||||
(/Г1= {1, 2, ...} совпадает |
|
с |
|
методом |
сопряженных |
градиентов, |
|||||||||||||
описанным, например, в работе [9]. |
|
|
|
|
|
|
|
||||||||||||
|
Л е м м а |
2. Если /2 = |
{0}, |
/i = |
{l, 2, |
...}, то |
для |
последова |
|||||||||||
тельностей {tin}, {Рп}, получаемых по |
формулам |
(1), |
(2), |
(9), |
|||||||||||||||
(11), |
справедливы соотношения |
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
(J' («(). Pi) = |
0 |
(I > |
/), |
(Д («О, Д («0) = 0 |
(t |
|
/), |
|
||||||||
|
|
|
|
(Pi. APj) = |
|
0 |
(iф j), |
i, j = |
0, 1, 2, . . . |
|
|
|
|
(12) |
|||||
|
Д о к а з а т е л ь с т в о |
проведем по индукции. Имеем (Д(«х), р0) = |
|||||||||||||||||
= |
(Д(«х), Д (« о)) = |
0 |
в силу |
(5) ; |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
И Р х . Ро) = |
(Pi. АРо) = |
(Д Ы — PiPo. АРо) = |
|
0 |
|
|
||||||||||
в |
силу |
(11). |
Предположим, |
что |
равенства |
(12) доказаны |
для ^всех |
||||||||||||
I, |
/ < « |
при некотором « > |
1 |
и покажем, что (12) тогда |
будут верны |
||||||||||||||
при всех i, / < « - 1 - 1 . |
Для |
этого достаточно доказать, |
что |
|
|
(Д (Ия+i), рг) = (Л («„+,), Д (up) = (р„+1, Лр,)]= 0, t = 0, 1, . . . , п.
Сначала убедимся в том, |
что (Д («„+i), р;) = 0. При W — п |
это сле |
дует из (5), а при |
с учетом (10) и предположения |
индукции |
будем иметь |
|
|
(7' (ы„+1), р;) = (Л («„) — а„Лр„, р;) = 0.fJ
Тогда
(Л («„+1), 7' («,)) = (Л («„-и), рг + PiPi-i) = 0!)’
при i = 1 ,■2, .. •, п и при i = 0
|
(J' («л+l), |
Л («о)) = (Л (fi/l+l)i Ро) = 0. |
|
Наконец, |
с учетом (2), (10) и |
предположения индукции при'всех i, |
|
0 -< i < п |
имеем |
|
|
(Лр„+ь р£) = (р„+ь Лрг) = (Л («л+0 — pn+ip„, Лр(.) = |
|||
= |
(Л («л+i), Лр,) = |
— |
(Л («„+]), Л («г) — Л («г+i)) = 0, |
|
|
а,- |
|
§ |
7] |
|
Метод сопряженных градиентов |
|
|
105 |
|||
а |
в случае i = |
n |
(рп+ь Арп) = (/' (ип+\) — pn+iPn> Ар„) = 0 |
в силу |
|||||
формулы (И ). А |
|
|
|
|
|
|
|
|
|
|
Т е о р е м а |
1. |
Если |
/2 = {0}, / ]= {1 , 2, . . . }, |
то |
метод |
сопря |
||
женных градиентов для |
квадратичной |
функции |
(7) |
сходится к |
|||||
точке минимума не более, чем за tn шагов |
(т — |
размерность и). |
|||||||
|
Д о к а з а т е л ь с т в о . |
Как следует |
из |
леммы 2, последова |
тельность У '(ип)}, получаемая методом сопряженных градиентов,
ортогональна: (/'(ы,-), 1 '( щ ))= 0 ( i^ j, i, /=0, 1, 2, . . . ) . Однако в m-мерном пространстве не может быть более чем т ненулевых взаимно ортогональных векторов. Следовательно, найдется наи меньший номер п, 0-^.п^.т , такой, что J'(u n) = 0 . Так как /(и) — выпуклая функция, то ип— точка минимума функции (7) в Ет. А
3. |
|
Рассмотрим метод сопряженных градиентов для сильно в |
||||||||||||||||
пуклых функций. |
|
|
J (и) — сильно |
|
|
|
|
|
|
Ет, |
||||||||
Т е о р е м а |
2. |
Пусть |
|
выпукла |
на |
|||||||||||||
J (и) <=С1(Ет) , и |
\J'{u)—J'(v) \ ^ Ь\и— v\ |
при |
всех |
и, а е £ т , |
||||||||||||||
L = const. Тогда |
при любом |
выборе |
множества |
индексов |
h , |
0е / 2 |
||||||||||||
и любом начальном приближении и0 для |
последовательности |
{«„} |
||||||||||||||||
из (1 )— (4) |
справедливы оценки |
|
|
|
|
|
|
|
|
|
|
|||||||
0 < |
а п= |
J («„) — J* < a0qn, \ип — и‘ |2 < |
— a0qn, п = |
0, |
1, . ••, (13) |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
И- |
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
J" — |
|
inf |
|
= |
|
< 7 = 1 - |
— |
|
L2) |
, |
0 < ? < 1 , |
|
|
||||
|
|
и € Е т |
|
|
|
|
|
2L (р2 + |
|
|
|
|
|
|
|
|||
р — константа из |
(1.12). |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Д о к а з а т е л ь с т в о . |
Из |
теоремы |
1.7 следует, |
что |
нижняя |
|||||||||||||
грань /(и) |
|
на Е т конечна |
и достигается в |
единственной точке и*: |
||||||||||||||
/ (и *)= / *. |
|
Функция g n ( a ) |
= J (ип— арп) |
при рпФ 0 также сильно |
||||||||||||||
выпукла при а 13г0 , |
поэтому |
an |
из условия |
(3) |
определяется одно |
|||||||||||||
значно. |
Можно |
считать, |
что |
рп¥=0, а п> 0, |
/'(.«„) |
0 |
|
при |
всех |
|||||||||
п = 0, 1, ... |
, |
ибо в противном случае J'{iin) — 0, |
и ип= и* |
— точка |
||||||||||||||
минимума. |
|
В силу |
выбора |
a„: J(u n+i) ^ |
J (ип— арп) при всех |
|||||||||||||
а ^ 0 . Поэтому с помощью формулы |
(1.18) |
при v = |
un, и= ип—а р п |
|||||||||||||||
будем иметь |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
J (Цп) |
J ( u n + l) |
^ |
j (Цп) |
{Цп |
|
ЫРп) |
|
|
|
|
|
||||
|
|
|
|
> a (J' (ип), рп) -----'EL. | |
|3, |
а > 0 . |
|
|
|
|
|
|||||||
Используя |
второе равенство |
(5), |
отсюда получаем |
|
|
|
|
|
||||||||||
J (и„) — J |
(ип+1) > а |J' (и„) |2 — |
a2L |
[р„|2, |
a > 0 , |
л = |
0, |
1, |
. . . |
(14) |
2
106 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х |
ПЕРЕМЕННЫ Х |
[Гл. 2 |
||||
Далее докажем оценку |
|
|
|
|
|
||
|
vL|p„|2< |
|/'(«„) |2, у = |
* |
, |
п = 0, 1, . . . |
|
(15) |
|
|
L (1 + L-p, 2) |
|
|
|
||
По теореме 1.4 |
(/' (ип) — |
|
|
р | |
|
|2, а |
|
так как |
ип— ип-\ — — an_i/?„_i, то с |
учетом |
соотношений |
(5), |
(6) |
||
имеем |
ра2_, |рп- 1 12 |
< а;г_ , (/' (и„_i), |
p„_i) |
= |
a„_i |/' (u„_i) |
|2, |
или |
pa„_i |p„_i |2 < |J' («„_i)|2. Тогда из (4)
to | I J' (un) I L I ип — un_i 1 ^ - 1 |
J' (un) I Lo.n-i I Pn-i I |
_ |
L, |
\J' (un) | |
||||||||||
I Ря I |
|
* т// \(Л |
^ |
|
|
, |
|
,9 |
' |
|X |
. |
, 9 |
||
|
|
U |
(“n-l)|S |
|
|
|
p-a,,,! I |
|
I2 |
I Pn-l I |
||||
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| M lP n - l| < — \J'{Un)\. |
|
|
|
|
|||||||
|
|
|
|
|
|
|
V- |
|
|
|
|
|
|
|
Подставим это неравенство в |
(6) |
и получим |
|
|
|
|
||||||||
I РпI2= |
I J' (un) Is + |
Рд I Рп-: I2< |
(1 + |
|
|J' («„) Г, |
|
||||||||
что равносильно |
(15). |
|
|
|
|
|
|
|
|
|
|
|
||
Теперь нетрудно доказать оценки (13). |
С |
учетом |
неравенства |
|||||||||||
(15) и (14) |
имеем ап— ап+1 > |
cz ^ 1 |
— |
Ц'(«„)|2 при любых а > 0 . |
||||||||||
Следовательно, |
|
|
|
|
|
2v |
J |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
ап — ап+1 > |
max а ( 1 — |
|
|J' (ы„) |2 = |
|
\J'.(u„)\2 |
(п — 0, |
1, . . . ) . |
|||||||
Но |J' (un) I2 > |
\хап (см. теорему |
1.6), |
|
поэтому |
ап — an+i > |
^ ~ -аП, |
||||||||
илиап+1 < ^ 1 -----y ^ ^ an = qa,„ |
(л = 0 , 1 , . . . ) . Отсюда |
имеем а п < |
||||||||||||
(л = |
0, |
1, . ■•)• Вторая из оценок |
|
(13) |
немедленно следует из |
|||||||||
первой оценки и |
неравенства |
(1.15) при u = |
un. |
Остается заметить, |
||||||||||
что 0 < < 7 < 1 , |
ибо р < L (см. замечание к теореме 1.5). ^ |
|
||||||||||||
4. |
В |
заключение |
заметим, |
что |
для' |
минимизации гладк |
||||||||
функции J (и) |
на замкнутом |
выпуклом |
множестве |
1]ф Е т можно |
использовать метод проекции сопряженных градиентов по схеме:
ип+\ = Ри(ип— a-nPn) (n = 0 , |
1; .. . ), где |
рп определяется согласно |
|
(2), (4), величина ап> 0 |
выбирается |
из условия |
монотонности |
J(u n)^J(u-n+\)■ Этот метод позволяет |
за конечное |
число шагов |
найти точку минимума квадратичной функции (7) на параллелепи педе [190]; в общем случае сходимость метода проекции сопряжен ных градиентов, по-видимому, не исследована.
S «] |
|
|
|
|
|
|
Метод Ньютона |
|
|
|
|
|
|
|
|
107 |
||||
Упражнения. 1. Показать, что точка ип, полученная методом |
||||||||||||||||||||
сопряженных градиентов для функции |
(7) |
при / г = {0 }, |
есть точка |
|||||||||||||||||
минимума J (и) на гиперплоскости, проходящей через |
точку |
и0 и |
||||||||||||||||||
натянутой |
на векторы {/'(«й)} |
(&= 0, |
1, . . . , |
п— 1). |
|
Опираясь на |
||||||||||||||
лемму |
2, выяснить |
геометрический |
смысл |
метода |
сопряженных |
|||||||||||||||
градиентов [19]. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
2. |
|
|
Описать |
метод |
сопряженных |
градиентов |
для |
функц |
||||||||||||
J(u ) = |
|
\Au—b |2 |
из упражнения 1.16. |
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
§ |
8. МЕТОД НЬЮТОНА |
|
|
|
|
|
|
|
||||||
1. |
|
Пусть функция / (u )^ C 2(U) , где |
U — заданное |
множес |
||||||||||||||||
в Ет, в частности, может быть |
U = E m. Для |
решения |
задачи |
ми |
||||||||||||||||
нимизации J (и) на |
U можно использовать метод Ньютона, заклю |
|||||||||||||||||||
чающийся |
в |
следующем |
[155]. |
Пусть |
взято |
некоторое |
начальное |
|||||||||||||
приближение u0^.U. Если уже |
известно |
n-е |
приближение ип-, то |
|||||||||||||||||
приращение функции J ( u ) ^ C 2(U) |
в точке ип можно |
представить |
||||||||||||||||||
в виде |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
J ( и ) |
— J |
|
|
= ( J ’ ( « „ ) , и — ип) + |
Y |
(J" ( и „ ) |
(и — и„), |
и — ип) + |
||||||||||||
|
|
|
|
|
|
|
+ о(\и — ип\у. |
|
|
|
|
|
|
|
|
|
||||
Возьмем квадратичную часть этого приращения: |
|
|
|
|
|
|
|
|||||||||||||
|
|
J n (u) = |
(J'(u n), и — ип) + ~^(J"(un)(u — ип), |
и — ип). |
|
|
||||||||||||||
Следующее |
приближение |
|
1 |
определяем |
из |
условия |
минимума |
|||||||||||||
J n{u) |
на JJ: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
J п (un+i) = |
min J n (и). |
|
|
|
|
|
|
|
(1) |
|||||
|
|
|
|
|
|
|
|
|
u&U |
|
|
|
|
|
|
|
|
|
|
|
В |
случае, |
когда |
и = |
Еф |
в точке |
минимума |
J n (u) |
на U |
произ |
|||||||||||
водная |
j'n (и) = J' (ип) + J" (ип) (и—tun) |
обращается в |
|
нуль, |
т. |
е. |
||||||||||||||
f n (un+l) = J' (ип) + J" (ип) («п+1 — ип) = 0. |
Если |
|
матрица |
J" уип) |
не |
|||||||||||||||
вырождена, |
|
то |
отсюда |
будем |
иметь |
ип+\ = |
ип— [J" (un)]~l J ' (ип), |
|||||||||||||
п — 0, |
|
1 , . . . . |
Как |
видим, |
в |
случае U = Em описанный |
итера |
ционный. процесс превращается в хорошо известный метод Нью тона [19] для решения уравнения //(и )= 0 , определяющего стацио нарные точки функции /(ц). Отсюда происходит название метода и в общем случае.
Будем |
предполагать, |
что |
имеется |
некоторый эффективный |
алгоритм |
для решения |
задачи (1) |
при каждом п = 0, 1, 2,.... |
|
В случае |
£ / = £ т таким |
алгоритмом может служить метод сопря |
||
женных градиентов, описанный |
в предыдущем параграфе, а- так: |
108 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х |
|
же различные другие методы (см., например, [19]) решения систем |
||
линейных |
алгебраических уравнений |
J'{u n) + J" (u n) (un+i—un) = 0 . |
В случае |
U=^=Em при решении задачи |
(1) можно воспользоваться |
одним из методов, описанных в предыдущих параграфах. |
||
Нужно заметить, что задача (1) |
в общем случае может ока |
заться весьма трудоемкой. Но несмотря на это, применение метода Ньютона во многих случаях оправдано, ибо он сходится значи тельно быстрее, например, градиентных методов, если только на чальное приближение выбрано Достаточно близко к искомой точке минимума функции. Обычно метод Ньютона и его модификации применяют на завершающем этапе поиска минимума, когда с по мощью каких-либо более 'грубых, но менее трудоемких методов уже найдена некоторая точка, достаточно близкая к точке мини мума.
Т е о р е м а |
1. |
Пусть |
J (u ) ^ C 2(U) |
на |
выпуклом замкнутом |
|||||||||
множестве |
U ^ E m, |
пусть |
р|£|2< |
(/ "(« )ё, |
£) |
при всех |
и |
|||||||
u^ U , и |
\\J"(и )— /"(и) ||<^L|u— v\ |
при |
всех |
и, |
v^ U , |
где р, L — |
||||||||
некоторые положительные константы. Тогда |
задача |
|
(1) |
разреши |
||||||||||
ма при всех п — 0, |
1, ... Кроме того, если |
начальное |
приближение |
|||||||||||
Ыо выбрано так, |
что q = — |
[ |
— Ио|<1, |
то имеет место следующая |
||||||||||
|
|
|
|
Iх |
|
|
|
|
|
|
|
|
|
|
оценка скорости сходимости метода Ньютона: |
|
|
|
|
|
|||||||||
|
|
|
|
оо |
|
|
|
|
|
|
|
|
|
|
K - « * K - f - £ < 7 24 |
|
|
|
|
|
|
|
|
|
|||||
где и — точка минимума J |
(и) на U. |
|
|
|
|
|
|
|
|
|||||
Д о к а з а т е л ь с т в о . |
По условию |
(/"(«)£, |
|)^ р | ё|2 при всех |
|||||||||||
u e t i и |
|
|
p = co n st> 0 . |
Отсюда и |
из теоремы |
1.5 вытекает, |
||||||||
что функция J (и) сильно выпукла на U, и, следовательно, соглас |
||||||||||||||
но теореме 1.7 ограничена снизу на U |
и достигает своей нижней |
|||||||||||||
грани |
в |
единственной |
|
точке |
u *^ U . |
|
Далее, |
поскольку |
||||||
J п (и) = |
J" (ип), |
то |
функция J n (u) |
также сильно выпукла на U и |
||||||||||
достигает своей |
нижней |
грани |
в единственной |
точке |
un+i^ U . |
|||||||||
Таким образом, задача (1) всегда имеет и |
притом |
единственное |
||||||||||||
решение. Применив теорему 1.3 к |
функции J n (u), |
получим |
||||||||||||
(J'n{un+X), и — ип+1 ) > 0 , |
u £ U , |
|
п = 0, |
1 , . . . |
(3) |
|||||||||
Так как |
J n(u) = |
J'(u n) + J''(u„)(u — ип), |
то (3) |
перепишется в виде |
||||||||||
(J' (ип) + J" (u n) (un+i — un), |
и — ип+{) > 0, |
|
u £ U , |
|
п = |
0 , 1 , . . . . |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(4) |
Может случиться, что ип+\= ип. Тогда и* = ип+х= ип. В самом, деле, в этом случае из (4) имеем (J'(un), и— « „ )^ 0 , ыеС/. Со
§ 8] |
Метод Ньютона |
109 |
гласно теореме |
1.3 это означает, что в точке и* = |
ип функция J (и) |
достигает своего минимума на 0, и, следовательно, задача решена.
Поэтому ниже всюду |
будем |
считать «п+1=#=н„(/г=0, |
1, ... ). |
|
||||||||||||||
' |
В |
(4) |
положим |
и— ип. |
Получим |
(/'(«„) + J" (u n) (un+I—,и„), |
||||||||||||
ип— «n-ьi) ^ 0 . |
С |
учетом |
этого неравенства |
и условия |
теоремы |
|||||||||||||
имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(А I ^п+1 |
Мп |2 ^ |
( J |
(ип) (МпЦ-1 |
Г ^л) > |
un+l |
|
Мп) |
(J |
(ttn) , |
Un |
Ип-\-\)> |
|||||||
|
|
|
|
|
|
|
п = 0, |
1, . . . |
|
|
|
|
|
|
|
(5) |
||
Оценим ’(/ '(“«)> |
1ип — Чп+\) сверху. |
Для) |
этого в |
(3) |
заменим |
п на |
||||||||||||
t v — |
1. |
Получим {J 'n- 1 (и„), |
и — и „ )> 0,' |
u e U ( n > |
1). В частности, |
|||||||||||||
при и = Ып+1 отсюда находим (/„-i (ип), |
ип— urt+i) < |
0. |
С |
учетом |
||||||||||||||
этого |
неравенства, |
формулы |
(1.7) и условия Липшица для |
J ” (и) бу |
||||||||||||||
дем |
иметь) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(J' (Мп)> ип |
W/1+l) |
(«7 (^л) |
*7л—1 (^л)> “ л |
^n+l) |
|
|
||||||||||
|
= |
(«л) |
(Л (wn—l) |
*7 (Ыл—l) (ыл |
|
—0 > ил ^rt+l) |
|
|
|
|||||||||
= |
([/ ' (£/._1 + |
0 (и„ — U „_i)) — 7 " (Ид- l ) ] |
(«„ — |
Ип_1),Ип — |
« л + 0 < |
• |
||||||||||||
|
|
|
Lt | |
йл—112 1^л |
^л^-11* |
|
^ |
1» |
2, .. . |
|
|
|
||||||
Подставив |
полученную)(оценку) в |
(5), получим |
|
|
|
|
|
|
||||||||||
|
|
|«п-ы — и „ |< |
— U „ — «л- l l 2, |
|
п = |
1 , 2 , . . . |
|
|
(6) |
|||||||||
Так! [как^ по условию |
q = |
— \u^— uQ|< il , |
то' |
из |
(6) |
гпри п = 1 |
?вы- |
|||||||||||
текает |и2— u j < |
— q2. |
Сделаем индуктивное предположение: |
|
|||||||||||||||
|
|
|
|
|
L |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|ип — ип—1 1< |
i |
<72" |
1(п > 1).'; |
|
|
|
|
|
|||||
Тогда |
из (6) имеем, что |
|
|
|
|
|
|
|
|
|
|
|
|
|и*+1 — «*| |
k = 0, 1, 2, .. .. |