книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdfп о М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫХ [Гм. 2
Отсюда находим
ТП— 1 |
|
т—1 |
|
|
„2* |
|
|
|
|
|
|
|
|
f c = f l |
|
k=n |
k=n |
1 — q*n |
||
|
|
|
||||
|
|
|
->-0 |
|
(7) |
|
при т > / г —»-оо. Таким образом, последовательность {«„} |
фундамен |
|||||
тальна и поэтому |
сходится |
к некоторой точке «*. В силу |
замкну |
|||
тости множества |
U точка |
« *e t/ . |
Переходя к пределу |
в |
(7) при |
|
т-*-оо, получим |
|
|
|
|
|
|
| и * -и я | < 4 |
S |
? к |
(Я = 0 , 1 , . . . ) . |
|
|
|
|
L |
л—j |
|
|
|
|
|
|
k — n |
|
|
|
|
Теперь остается убедиться в том, что «* — точка минимума /(«)
на U. Так как J{u )j= C 2(U), |
то /'(«„)-► /'(«*), J" (u n) - + J " (и*) при |
||||
п~+оо. Поэтому переходя к пределу в |
(4) при л—►-оо, |
будем |
иметь |
||
(/'(и *), и— «*)^ г 0 при |
всех |
u ^ U . В |
силу теоремы |
1.3 и |
выпук |
лости J (и) это означает, |
что и* есть точка минимума J (и) на U-Jl |
||||
Как видно из оценки и |
как подтверждает практика, |
метод |
Ньютона сходится очень быстро, если начальное приближение «0 выбрано достаточно близким к точке минимума и*. Однако если хорошего начального приближения ио нет, то метод Ньютона за частую расходится. В этом можно убедиться на простом примере.
Возьмем функцию |
|
|
|
|
|
|
|
|
при |
|и |< |
б, |
|
|
|
|
|
|
|
J (и) = — и2 + 2 1и I — — б |
|
|
|
||||
|
w |
2 |
|
1 ' |
4 |
|
|
|
при |и |> б, |
u(zE lt |
|
|
|
|
|
|
|
где б — произвольное малое |
положительное |
число, |
0 < 6 < 1 . Не |
|||||
трудно убедиться в том, что |
Z (« )e C 2(£ i) |
и |
J " ( u ) ^ 1, так что |
|||||
J (и) сильно выпуклая функция. |
Эта |
функция |
достигает своего |
|||||
минимума на Е i .b точке ы *= 0 . В |
качестве начального приближе |
|||||||
ния возьмем |
«о = б . Применяя |
метод |
Ньютона, |
получим последо |
||||
вательность |
|
|
|
|
|
|
|
|
|
Г K _ i) |
|
|
( л = |
1, 2 , . . . ) , |
|||
«„ = «„ _ ,------ = ( - 1 ) " 2 |
|
|
||||||
|
J |
(“n-l) |
|
|
|
|
|
|
которая расходится, хотя начальное приближение |
отличается от |
|||||||
«* = 0 на малое число б. |
|
|
|
|
|
|
§ 8} |
Метод Ньютона |
111 |
2. Возникает вопрос, нельзя ли изложенный выше мет Ньютона видоизменить так, чтобы модифицированный метод не был столь чувствителен к выбору начального приближения? Такие модификации метода Ньютона существуют, см., например, [81], [82].
Опишем одну из этих модификаций. Пусть U — выпуклое замкнутое множество, / (и )е С 2(£У). Пусть выбрано произвольное начальное приближение u0^ U . Если un^.U уже известно, то сле дующее приближение un+i^ U находим так. Возьмем главную квадратичную часть
J п f a ) — ( J ' fa n ) > ^ |
^ п ) '1 “ ( J fa n ) f a |
^н)> ^ |
|
^ п ) |
|
|
||||||
приращения J (и)— / (« „ )= / „ (« )+о(|ы — ип \2) |
и определим |
вспо |
||||||||||
могательное приближение йп из условия: |
|
|
|
|
|
|||||||
|
|
|
J n(un) = |
m in Jnfa). |
|
|
|
|
(8) |
|||
|
|
|
|
|
и |
|
|
|
|
|
|
|
Сразу заметим, что J п (ип) < |
J n (ы„) = |
0. |
Далее полагаем |
|
|
|
||||||
|
|
Ц-п-\-\— ип -f- а„ (ип |
tin), |
|
|
|
|
(9) |
||||
где а„ выбирается из условий |
|
|
|
|
|
|
|
|
||||
J fa n ) |
fa n “Т &п fa n |
^/1)) |
|
|J п fa n ) I» |
6 |
^ п |
^ » |
( 1^) |
||||
е — некоторое фиксированное число, 0 < е < 1 . Если |
ип не являет |
|||||||||||
ся точкой минимума / (и) |
на U, то при некоторых |
ограничениях |
||||||||||
на функцию J (и) |
можно |
доказать |
возможность выбора >йп, а„, |
|||||||||
ип+\ из условий (8— 10) |
(см. ниже теорему 2), |
причем для ускорег |
||||||||||
ния поиска минимума желательно выбирать а п как |
можно |
ближе |
||||||||||
к 1. Метод |
(8— 10) |
— |
естественное обобщение |
одного |
из вариан |
|||||||
тов метода |
условного |
градиента |
(см. |
(6.1-—2), (6.8)). |
В |
методе |
условного градиента учитывалась лишь линейная часть прираще ния J (и)—J(u n), а здесь учитывается квадратичная часть этого приращения. Выбор а п из (10) практически можно осуществлять так же, как и в методе условного 'градиента. Именно сначала бе
рем а „= 1 |
и |
проверяем |
условие (10). |
Если оно .выполнено, |
то |
||||
оставляем |
ап= 1 ; если |
же |
(10) |
при а „= 1 |
нарушается, |
то |
|||
производим |
дробление ап до |
тех |
пор |
пока неравенство |
(10) |
не |
|||
выполнится, |
стараясь остановиться |
на |
значении |
а„, как |
можно |
||||
близком к |
1. |
При некоторых ограничениях на функцию J (и) ука |
занный выбор ап может быть произведен за конечное число дроб лений. Замечательно также и то, что независимо от выбора на чального приближения описанный 1нетод будет сходиться, причем начиная с некоторой итерации, он превратится в метод Ньютона, обретая свойственную этому методу высокую скорость сходи мости.
112 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х |
[Гл. 2 |
Таким |
образом, метод (8— 10) ненамного сложнее |
метода |
Ньютона, по скорости сходимости не уступает ему и в то же вре мя не столь чувствителен к выбору начального приближения, как метод Ньютона. При.наличии эффективных методов минимизации
квадратичной функции /и(«) |
на U метод |
(8— 10) можно с успехом |
||||
применять для минимизации достаточно гладких функций. |
|
|||||
Т е о р е м а |
2. |
Пусть U — |
замкнутое выпуклое множество, |
|||
/ (ы )е С 2(П ), |
ц|||2< (/ "(и )| , .|)<М |||а |
при всех |
и всех |
|||
u<=U, и пусть |
||/"(«)—/"(o)J|^L|u— п| |
при всех u, vt=U, где ц, |
||||
М, L — положительные константы. Пусть ei — некоторое число, |
||||||
|
|
0 < е 1< — — (1 — б). |
|
|||
Тогда на отрезке |
e ^ a ^ l |
при |
каждом |
п существуют числа а„, |
||
удовлетворяющие условиям |
(10) |
и среди них найдется максималь |
||||
ное. Подставляя |
это максимальное а п в |
(9) для любого |
началь |
ного приближения Uo^U, получим последовательность {«п}, для
которой: |
1) |
{ J (ип)} |
монотонно |
убывает |
|
и |
стремится |
к |
||||
/* = inf/(u) (n-voo); 2) |
существует |
такой |
номер |
/г0=/г0(е), |
что |
|||||||
|
<7 = |
— |
1«п„+1 — ып„| < 1, |
и |
а п = |
I, |
un+i = un |
|
|
|||
при всех |
п ^ щ , |
т. е. метод (8— 10) |
с номера |
п — п0 превращается |
||||||||
в метод Ньютона, и, следовательно, |
будет |
верна оценка |
(2) |
при |
||||||||
всех п ^ п 0. |
|
|
|
|
|
|
|
|
|
|
|
|
Д о к а з а т е л ь с т в о . По условию (У"(ц)£, |
g)^|i|£|2 |
ПРИ всех |
||||||||||
и ^ e £ m, p ,= co n st> 0 . Следовательно, |
J (и) |
— |
сильно выпук |
|||||||||
лая функция |
и в силу |
теоремы |
1.7 ограничена |
снизу на |
U и до |
стигает своей нижней грани в единственной точке и *еН . Посколь
ку |
J n (и) = 7 " (ип), |
то функция J n(u) |
также |
сильно |
выпукла_на U |
|||||
и |
достигает своей |
нижней грани |
в |
единственной |
точке |
«пе У . |
||||
Может случиться, |
что ип= и п. Тогда |
|
и* = ип= ип. В самом деле, |
|||||||
применив теорему 1.3 к функции /«(и), |
имеем |
|
|
|
||||||
|
|
(/п(ип), |
и — ип) > 0 , |
|
|
|
|
|||
или |
|
|
|
|
|
|
|
|
|
|
|
(J ' (и-п) + J" («л) («„ — ип), |
и — ип) > |
О, |
и 6 и. |
|
|||||
Если ип= и п, то |
отсюда следует, |
что |
(J'(un), и— ип)^ 0,_ и < = и . |
|||||||
В силу теоремы 1.3 и выпуклости / (и) |
|
заключаем, |
что и*_==ип= ип, |
|||||||
и задача решена. |
Поэтому ниже будем считать, |
|
что ипФ и п, и, |
|||||||
следовательно, /п (м п )< ^ п (« п )= 0 |
при всех |
п = 0, |
|
1, 2, . . . |
. Пока |
|||||
жем, что на отрезке E i ^ a ^ l |
существуют |
числа |
ап, удовлетво |
|||||||
ряющие условиям |
(10). |
|
|
|
|
|
|
|
|
§ 8) |
|
|
Метод Ньютона |
|
|
113 |
||
Обозначим иа= и п+'а(ип— ип), |
0 < ;« ^ 1 . Из выпуклости функ |
|||||||
ции J n (и) |
следует, что |
|
|
|
|
|
|
|
|
J n («а) < a J n (ип) + (1 — а) J n (ип) = a J n (ип) < О, |
|
||||||
Тогда из формулы |
|
|
|
|
|
|
||
J (Иа) — J (и„) = |
J n («а) + |
((J" (иа + |
0а (ип — Un)) — |
|
||||
|
|
— Г ( и п))(ип — ип) , й п — ип), |
0 < а < 1 |
(11) |
||||
будем иметь |
|
|
|
|
|
|
|
|
j («„) — J Ы |
> — J n («а) — — (M — ll)\un — Un \2> 0.\Jn (un)\ — |
|||||||
|
|
- \ ^ М \ й п- и п\\ |
|
0 < а < 1 . |
|
(12) |
||
Так как /п {и) |
сильно выпуклая функция и достигает своего мини |
|||||||
мума на U в точке ип, то согласно теореме 1.6 |
|
|
||||||
\чп — «„12 < |
— Un(4n) — J n(u„)] = |
— |
|/„(“*) I» |
n = 0, 1 , . . . |
||||
|
|
!*■ |
|
|
|
|
|
(13) |
|
|
|
|
|
|
|
|
|
Подставим эту оценку в (12). Получим |
|
|
|
|
||||
J |
(un) — J (иа) > а ^ 1 ----- ~ |
а ) \J n(un)\> ае| J n (un)\ |
|
|||||
при всех |
а, |
а ■< — |
^ ** < 1 . |
Таким образом, |
|
|
||
|
|
|
2М |
|
|
|
|
|
множество тех а = а п, для которых выполнено условие (10), |
непу |
|||||||
сто. Из непрерывности J (и) следует, что множество таких а зам |
||||||||
кнуто и, следовательно, это множество |
содержит |
свою верхнюю |
||||||
грань a „ ^ l . В соответствии с (9) полагаем |
ип+\= |
ыа„. |
|
Покажем, что для получаемой таким образом последователь ности {ип} при любом выборе начального приближения u0^ U верны все утверждения теоремы.
Прежде всего с учетом an^ e i из (10) имеем
J |
{чп) |
J |
(Wn+l) ^ &<ХП|J n (ип) | 68]^ |J п (ип) | |
0, |
п = 0, |
1, . . . |
|
|
|
|
|
|
|
|
(14) |
Следовательно, { J (ип)} |
монотонно убывает и, |
кроме того, |
J (ип) > |
||||
> |
J* = |
inf J |
(ы) > — оо. |
Тогда существует l i mJ (« J |
и |Пш [/(un+I) — |
U |
П—>оо |
П-^оо |
114 |
|
|
М И Н И М И З А Ц И Я Ф У Н К Ц И И |
М Н О ГИ Х |
ПЕРЕМЕННЫ Х |
|
|
|
Гл. 2 |
|||||||||||||||
— У(ц„)] = |
0. |
|
Из |
(14) |
теперь |
|
имеем |
1 |
|
(«„) |— 0, |
а |
из |
(13)— |
|||||||||||
\и |
— ип|— О (п —> оо). |
Следовательно, |
существует |
такой |
|
номер |
||||||||||||||||||
п0 = |
п0(е), |
что |
-----\un-— ия | < 1 — е |
при |
всех |
п>/г0. |
Из |
(11) |
с |
|||||||||||||||
учетом |
|
|
|
н* |
|
|
для |
J" (и) и |
оценки |
(13) |
для |
всех |
а, |
|||||||||||
условия Липшица |
||||||||||||||||||||||||
|
< |
а < 1, |
тогда имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
j |
Ю |
— J («а) > |
|
|
— |
|
а3£ |
|
-т |
|
|
|
|
|
|
|
|
|||
|
|
|
|
а I J a (и„) I------— |
I ип— ипI3 > |
|
|
|
|
|
||||||||||||||
|
|
|
|
> |
IJ,, (М п) |
I |
1 — -^-'1 Й„ — йпI ^ |
> |
ае I J n (й„) | |
|
|
|
|
|||||||||||
при |
всех /г>/г0. Это означает, |
что (10) |
выполнено при |
всех |
а„, |
|||||||||||||||||||
Ч < % < 1 |
и, |
следовательно, |
максимальное |
среди |
таких |
ап |
есть |
|||||||||||||||||
an = |
1 |
при всех |
п > |
п0. |
А тогда |
согласно |
(9) |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
Un+i = |
un, |
J n (un+1) = |
J n (ип) = |
min>„ (и), |
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
u £ U |
■ |
|
|
|
|
|
|
|
|
т. |
e. |
начиная |
с |
номера п = |
п0, |
рассматриваемый метод |
превращается |
|||||||||||||||||
в |
метод |
Ньютона |
с |
начальным |
|
приближением |
и„0, |
таким, |
что |
|||||||||||||||
q = |
— |
|и„0+1— w„01< 1. |
Поэтому |
оценка |
(2) |
будет |
верна |
|
при всех |
|||||||||||||||
п > п0. А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Существуют и другие способы выбора |
|
а п в |
(9), |
например, в |
||||||||||||||||||
работах [81], [82] ап предлагается |
искать |
|
из |
условия |
минимума |
|||||||||||||||||||
функции J {ип+ а (и п— ы„)) |
переменной а при 0 - ^ а ^ 1 . |
О методе |
||||||||||||||||||||||
Ньютона см. также в работах [4, 19, 27, |
35, |
46, 75, |
81, 82, |
97, |
130, |
|||||||||||||||||||
152, |
155, 170, |
1.93, 235] и др. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. На каждом шаге метода Ньютона и его модификации пр ходится решать достаточно трудоемкую задачу минимизации квад ратичной части J n(u) приращения I{и ) —/(«„) на множестве U. В частности, метод Ньютона для минимизации сильно выпуклой функции J (и) на всем пространстве приводит к итерационному процессу
Un+1 = Un — (J" (мл))-> J' (и„), |
п = 0, 1, . . . , |
|
на каждом шаге которого требуется |
обращать |
матрицу J"(u n). |
Возникает вопрос, нельзя ли построить методы |
минимизации, |
|
обладающие высокой скоростью сходимости, как |
метод Ньютона, |
и в то же время требующие меньшего объема вычислений на каж дой итерации?
В настоящее время такие методы известны. Они приспособле
§ 8] Метод Ньютона 115
ны для поиска минимума функции на всем пространстве и в общих чертах сводятся к итерационному процессу:
|
un+i = ип— а пДГ1J' (и„), |
п = |
0, |
, |
(15) |
||
где а пфО |
скалярный |
|
множитель, |
Ап — |
квадратная |
матрица |
|
m-ного порядка, такая, что \\Ап— J"(u n) ||-й) (п-+ оо). |
|
|
|||||
Следуя (86], опишем один из способов выбора матрицы Ап и |
|||||||
величины |
а п в процессе |
(15). Зафиксируем какую-либо |
последо |
||||
вательность векторов |
Го, |
гь ..., гп, ... ,' обладающую |
свойствами: |
||||
1) |г'тг| — |
при п-*-оо; |
2) |
существует |
число у > 0 , такое, |
что опре |
делители Ап матриц, столбцами которых являются нормирован ные векторы
|
|
|
|
|
rn |
|
гп—1 |
|
|
rn—m+1 |
|
|
|
|
|
|||
удовлетворяют |
неравенству |
Ап^ у |
при |
|
всех |
п = т — 1, |
т ,... |
|||||||||||
В остальном |
последовательность {r„} |
произвольна. |
|
Например, |
||||||||||||||
можно взять |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
r0 = |
^o®i> |
■••, гт—1 = |
A.m_i ет, |
гт— Хте1л . . . , г2т—i = |
|
||||||||||||
|
|
: |
^ 2 т—1 £т , |
Г2 т = |
^2те1> ■■■ I |
rn = |
|
e i+l> |
••• , |
|
|
|
||||||
где 6 j= |
(0, |
. . . , |
0, 1, |
0, . . . , |
0 ) — единичный |
вектор |
по |
|
оси |
Ои}, |
||||||||
i —‘ остаток |
от |
деления |
целого |
числа |
п |
на |
целое |
число |
||||||||||
т, О ^ г^ / п — 1, |
последовательность Хп->0 |
|
при п-*-оо, |
Хп> 0 при |
||||||||||||||
всех п— 0, |
1, .. . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Пусть последовательность {г„} с указанными свойствами уже |
|||||||||||||||||
выбрана. Тогда матрица Ап в соотношении |
(15) при каждом фик |
|||||||||||||||||
сированном п ^ т — 1 |
определяется из системы линейных алгебраи |
|||||||||||||||||
ческих уравнений |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
; |
- J' (Un—i ~Ь Гп—/) |
|
J' (Un—j), |
/ = |
0, 1, . . . |
, |
т — |
1. |
|||||||||
|
|
|
|
|
|
|
|
|
матрица Ап невырождена, |
|
( 16) |
|||||||
|
Если полученная |
при этом |
то нахо |
|||||||||||||||
дят ДГ1 и при выполнении условия |
(ДГ‘ J' (ип), J' |
(«п) ) > 0 |
присту |
|||||||||||||||
п аю т^ |
выбору |
величины |
ап в |
(15). |
Для |
этого |
вначале полагают |
|||||||||||
ап = |
“ я. где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
аП= min |
|
|
( У ( и п ) , Un |
U g ) “| ^ |
• и„ — и„ |
|
An |
|
J' (Цп)> |
||||||||
|
|
|
\ип—Й„|3 J |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
= |
const > 0 , |
и проверяют справедливость |
неравенства |
|
|
|
|
|||||||||||
|
J(u n+1) — J(Un)<C еа„ (Д (ы„), |
ип — ип), |
0 < е < - ^ - |
(17) |
116 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И М НОГИ Х ПЕРЕМЕННЫ Х |
[Гл. 2 |
|||||
(постоянные R, е являются параметрами алгоритма). Если нера |
|||||||
венство |
(17) |
выполняется, |
то останавливаются |
на |
выборе |
а п= а п, |
|
находят |
un+1 |
по формуле |
(15) |
и переходят к |
следующей |
итера |
|
ции. Если же |
неравенство |
(17) |
не выполняется |
пр_и а„ = а„, то |
производят дробление ап (например, последовательным делением пополам) до тех пор, пока (17) не окажется справедливым, и полученную в результате дробления величину принимают в каче стве ап в (15).
Если при каком-либо |
п ^ т — 1 |
матрица Л„, определенная из |
||||||||||||
системы |
(16), |
окажется |
вырожденной |
или |
же |
(ДГ1 |
J' |
(ип), |
||||||
/ ' ( и , ) ) а |
то |
либо |
изменяют вектор |
гп |
и |
-заново |
строят |
|||||||
матрицу Ап, либо полагают Ап= Е |
(Е — единичная матрица) и |
|||||||||||||
ап в (15) |
выбирают, пользуясь каким-либо |
вариантом |
'градиент |
|||||||||||
ного мет.ода; п-й шаг метода |
при |
всех п ^ т — 1 |
|
описан. |
Если |
|||||||||
0 -^ / г ^ т —2, то |
в |
(15) |
можно |
принять |
Ап= Е |
и |
а,г |
при |
||||||
/г=0,1, . . . , |
т— 2 выбирать, как в градиентном методе. |
векторы гп, |
||||||||||||
Пусть Rn— матрица, столбцами |
которой являются |
|||||||||||||
гп-\, ■•- , |
гп—т+\, a |
Qn— матрица, |
составленная |
|
из |
|
столбцов |
|||||||
•7 fan 'l- ^n)i |
J fan)t • • • |
i |
>7 fan—m+1 Д ?n—n»+l) |
J' fan—in-\-l)- |
|
ТогдаТсистема -(16) для определения An может быть записана в виде следующего матричного уравнения: AnRn — Qn. Отсюда видно, что если Rn, Qn невырождены, то матрица Ап определяется однозначно,
Ап1 существует и ДГ1= RnQnl. Заметим, что матрицы Rn, Qn отли чаются от Rn+1 и соответственно Q„+1 лишь одним столбцом. Это обстоятельство позволяет получить достаточно простые и удобные
рекуррентные соотношения, связывающие матрицы ДГ+i и ДГ1 [86]. Благодаря этим рекуррентным соотношениям существенно уменьша ется трудоемкость обращения матрицы Ап, и метод (15) — (17) ока зывается более экономичным по сравнению с описанными выше ме тодом Ньютона и его модификацией.
|
Отдельно остановимся на случае, |
когда векторы гп в (16) |
вы |
||||
бираются по закону: rn— Xnei+1, |
где i — остаток |
от деления |
п |
на |
|||
т, |
О ^ г^ / п — 1, числа Л „>0 и Д п->-0 |
при |
оо, |
е ^=( 0, ..., |
0, |
1, |
|
0, |
. . . , 0) — единичный вектор |
по |
оси |
Ou\ |
i— 1, 2, . . . , |
т. |
Тогда система (16) |
решается в явном виде и, как нетрудно видеть, |
|||
матрица Ап будет состоять из столбцов |
|
|||
7 ' (“п -г + |
К —I ei) — 7 ' (un—j) |
7* (un—._j_| Н- 7n_ i+ |gg) — J' Kt-t-|-i) |
||
|
K -i |
|
’ |
V - w |
J ’ (“n + |
— |
J ’ (un) |
J '(u„_m + |+ |
e [+2) — J ' (un_ m + l) |
X |
' |
x m+1 |
’ |
§ 9] Метод штрафных функций 117
|
|
|
(ип—i—1 ~t~^n—t—1e”») |
J |
(un—i—l) |
||
|
|
|
. |
h - l - l |
|
|
|
Для |
сравнения |
вспомним, что матрица J" (и) |
состоит из столбцов |
||||
|
|
" дЧ (и ) - |
|
|
|
“ ’дЧ (и ) ~ |
|
|
|
|
дихди1 |
|
|
|
5u15um |
|
д ]' (и) |
_ |
• |
|
dJ' |
(и) |
|
|
ди1 |
|
|
’ " ’ ’ |
дит |
^ |
|
|
|
|
дЧ (и) |
|
|
|
дЧ (и) |
|
|
|
ди"‘ди1 |
|
|
|
дитдит |
Отсюда видно, что столбцы матрицы Ап представляют собой |
|||||||
разностную аппроксимацию |
соответствующих столбцов матрицы |
||||||
Г (и) |
в специально |
выбираемых точках, |
и метод (15) — (17) пре |
вращается в разностный вариант метода Ньютона. Поэтому мож но ожидать, что метод (15) — (17) будет обладать высокой ско ростью сходимости. Строгое доказательство этого факта для силь но выпуклых функций J(u ) ^ C 2(Em) проведено в работе [86]. Та
ким |
образом, метод (15) — (17) имеет |
скорость |
сходимости, |
близ |
кую |
к скорости сходимости метода |
Ньютона |
и в то же |
время |
является более экономичным по сравнению с методом Ньютона с точки зрения количества вычислений производных минимизируе мой функции и трудоемкости обращения матрицы Ап на каждом
шаге. |
Для |
квадратичной |
функции, |
определяемой |
равенством |
||
(7.7), |
метод |
(15) — (17) |
сходится за |
конечное |
число |
шагов [86]. |
|
Различные варианты метода |
(15)— (17), обзор |
близких |
методов и |
||||
библиографию см. в [84], |
[86], |
[258]. |
|
|
|
Отправляясь от соотношений (15) — (17), в работе [87] постро ен быстросходящийся метод минимизации, не требующий вычисле ния производных минимизируемой функции. В этом методе выра жения градиента, встречающиеся в соотношениях (15) — (17), за меняются разностными отношениями функции в подходящим обра зом выбранных точках. Другие методы минимизации функций, не требующие вычисления производных минимизируемой функции, описаны в работах [235], [262], [265]; библиографию и обзор см. в [87], [265]. Эти методы удобно применять в тех случаях, когда вы числение производных минимизируемой функции связано со зна чительными трудностями.
§ 9. МЕТОД ШТРАФНЫХ ФУНКЦИИ
Пусть функция /(и) определена на всем пространстве Ет и требуется минимизировать I (и) на множестве 1!ф Е т. Идея мето да штрафных функций заключается в замене исходной задачи
118 |
М И Н И М И З А Ц И Я |
Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х |
[T.i. 2 |
|||
задачей |
минимизации |
однопараметрического |
семейства |
функций |
||
Jh (u )= = .J(u )+ P k (u) |
на |
всем пространстве, где Ph(u) — |
функция, |
|||
выражающая собой |
«штраф» за |
нарушение |
ограничений « е У , |
|||
a k — параметр, регулирующий величину «штрафа». |
|
|||||
Для примера возьмем задачу на условный экстремум из клас |
||||||
сического анализа: найти минимум функции |
J (и) на множестве |
|||||
|
U = |
{ u :g i (u) = 0, |
i = 1, 2, . . . |
,s}, |
(1) |
где 7(ы), ё\{и) — заданные функции, определенные на всем про
странстве |
Ет. |
Рассмотрим функцию |
J k ( u ) = J (и )+ k g (u ), где |
|
S |
|
|
|
|
g (u )= |
|
k — достаточно большое положительное число. |
||
£=1 |
|
|
служит «штрафом» за нарушение усло |
|
Слагаемое kg (и) = P h(u) |
||||
вия гге/У: |
если |
и<=0, то |
Р Л(и )з=0, а |
если u £ U , то Р%(и)>0 и |
при небольшом нарушении ограничения g .{u )= 0 величину «штра фа» можно сделать как угодно большой за счет выбора больших
k> 0 . |
Далее |
будем |
решать задачу |
минимизации |
Д (« ) |
на Ет, |
используя те |
или |
иные известные методы минимизации. |
Пусть |
|||
Д (« ) |
достигает своего минимума на Ет в точке %. Можно наде |
|||||
яться, |
что с ростом k функция Jk(u) |
будет достигать |
минимума в |
таких точках Uk, которые все точнее и точнее удовлетворяют огра ничению g(u) = 0 , и, кроме того, Л (uk) - * J “= inf J (и).
|
|
|
|
Функцию Ph(«) |
u£U |
|
|
|
|||
О п р е д е л е н и е |
1. |
называют |
штрафной |
||||||||
функцией множества |
U, |
если Рь(и ) ^ |
0 при всех |
и ^ Е т и /г>0, и |
|||||||
|
lim |
Pk (и) = |
0, |
если |
и 6 U, |
|
|
|
|||
|
оо, |
если |
u ^ U . |
|
|
|
|||||
|
|
|
|
|
|
|
|
||||
Приведем примеры штрафных функций для множеств, зада |
|||||||||||
ваемых с помощью одного неравенства |
|
|
|
|
|
|
|||||
|
|
U = { u :u £ E m, g(u) < 0 } , |
|
|
|
(2) |
|||||
где g(u) — известная функция, |
определенная на |
всем |
простран |
||||||||
стве. |
|
|
|
|
|
|
|
|
|
|
|
Заметим, что в таком виде представимы широкие классы |
мно |
||||||||||
жеств. |
Например, |
множества, |
задаваемые |
системой неравенств |
|||||||
g i(u) ^ 0 |
(г= 1, . . . , |
s), нетрудно |
записать |
в |
виде |
(2): |
для |
этого |
|||
в (2) достаточно взять |
|
|
|
|
|
|
|
|
|||
|
|
|
|
* ( “) = £ |
fei (“)]+. |
|
|
|
|
|
|
|
|
|
|
£=1 |
|
|
|
|
|
|
|
где принято обозначение [g(M)]+ = m ax{0; |
g (u )}. Множества |
вида |
|||||||||
|
|
|
|
|
|
|
|
S |
|
|
|
(1) также записываются в виде (2) при g (и) = £ gf (и).
£=1
§ 9] |
Метод штрафных функций |
119 |
|
В качестве штрафной функции множества (2) |
могут служить, |
||
например, следующие функции: |
|
|
|
Рц (и) = |
k [g («)]+, Р„ (и) = |
k ([g (u)]+)2, |
|
Pk («■) = 4 - |
ekg(u\ Pk (и) = (1 + |
[g («)]+)* - |
1 |
k |
|
|
|
и др. В зависимости от метода, применяемого для минимизации функции J ii ( u ) = J (и) +Ри{и) на Ет> при выборе штрафной функ ции надо учитывать ее гладкость, удобство вычисления значений функции и ее производных и т. п.
Важно заметить, что нет необходимости точно решать задачу
минимизации Д (и ) |
на Ет при фиксированном /е>0, |
а нужно лишь |
|||||||||
позаботиться о том, чтобы с ростом k |
эта |
задача |
решалась все |
||||||||
точнее и точнее. |
А |
именно |
обычно |
берут ка_кую-либо функцию |
|||||||
е —е (6 )> 0 при & > 0 , е(£)-И ) при k-+oo |
и с |
помощью того или |
|||||||||
иного метода минимизации определяют точку Uih такую, чтобы |
|||||||||||
Л = |
inf. J k (и) < |
J k (uk) < |
4 |
-г e (k), |
k > |
0. |
(3) |
||||
|
uSEm |
|
|
|
|
|
|
|
|
|
|
Т е о р е м а |
1. Пусть функции /(u), |
g(u) |
определены |
и непре |
|||||||
рывны на Ет, |
i n f / ( w) > — оо, |
пусть |
U = |
{и : g(u) ^ 0 } . |
Пусть |
||||||
|
т |
|
|
|
|
|
|
|
Pk(u) ==Qh(g(u)) |
||
штрафная функция |
множества U |
имеет |
вид |
(см. выше примеры), причем: 1) для каждого /г функция Q;t(g)
определена, |
непрерывна |
и |
неотрицательна |
при |
всех |
g; |
||||||||||
2) Q k(g)> 0, |
монотонно |
возрастает |
по |
g и 1 im Qk (g) = |
-j- ос при |
|||||||||||
g > 0 ; 3) |
если g ^ O , то |
Qk(g)-+0 |
(Jk-*-+oo) равномерно |
относи |
||||||||||||
тельно gs^O. Пусть {Uk} |
определены из условий (3) |
при некоторых |
||||||||||||||
е(/г) > 0 , г(/г)-+0 |
при k->-+ оо. |
|
|
|
|
|
|
|
|
|
||||||
|
Тогда: 1) |
Нгп / (uk) < |
J" — inf / (и), l i m g ( « ft) < 0 ; |
2) |
если |
мно- |
||||||||||
|
|
|
£-->оо |
|
|
« £ £ / |
|
£ — >4~°° |
бы одну предельную |
|||||||
жество {иА} при k |
+ оо будет |
иметь |
хотя |
|||||||||||||
точку и*, |
то |
и* — точка |
минимума |
J (и) на U\ 3) если |
множество |
|||||||||||
Ue — {u :g (и) ■< 6} |
ограничено хотя |
бы |
при |
одном |
6 = |
60]> 0 , то |
||||||||||
lim J (uk) — Г , |
р (uk, U) = |
inf \uk — и |->-0 |
(6-»-оо) и любая предель- |
|||||||||||||
£ - * о о |
|
|
|
|
|
и £ ( / |
будет точкой минимума J (и) |
на U, |
а в |
|||||||
ная точка {uk} при /г -> + |
о о |
|||||||||||||||
случае единственности точки минимума \uk — и* |-»- О |
[k |
оо). |
|
|||||||||||||
|
Д о к а з а т е л ь с т в о . |
Пусть |
{&,„} — какая-либо гминимизирующая |
|||||||||||||
последовательность |
J {и) |
на |
U, т. |
е. |
ьт6 U |
и J {vm) ->•Г (т |
оо). |
|||||||||
Возьмем |
произвольное е > 0 . |
Тогда |
найдутся |
такие |
числа |
/«о > 0 , |
||||||||||
k 0> |
0, что J |
( o j |
< |
/* + |
е, е (k) < |
е, |
Pk (om) = Qk (g (vm)) < |
г |
при всех |
|||||||
т > |
т0 и &>&„. |
Следовательно, |
с |
учетом (3) |
получаем |
|
|
|