Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач

.pdf
Скачиваний:
15
Добавлен:
25.10.2023
Размер:
14.17 Mб
Скачать

п о М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫХ [Гм. 2

Отсюда находим

ТП— 1

 

т—1

 

 

„2*

 

 

 

 

 

 

f c = f l

 

k=n

k=n

1 — q*n

 

 

 

 

 

 

->-0

 

(7)

при т > / г —»-оо. Таким образом, последовательность {«„}

фундамен­

тальна и поэтому

сходится

к некоторой точке «*. В силу

замкну­

тости множества

U точка

« *e t/ .

Переходя к пределу

в

(7) при

т-*-оо, получим

 

 

 

 

 

 

| и * -и я | < 4

S

? к

(Я = 0 , 1 , . . . ) .

 

 

 

L

л—j

 

 

 

 

 

 

k — n

 

 

 

 

Теперь остается убедиться в том, что «* — точка минимума /(«)

на U. Так как J{u )j= C 2(U),

то /'(«„)-► /'(«*), J" (u n) - + J " (и*) при

п~+оо. Поэтому переходя к пределу в

(4) при л—►-оо,

будем

иметь

(/'(и *), и— «*)^ г 0 при

всех

u ^ U . В

силу теоремы

1.3 и

выпук­

лости J (и) это означает,

что и* есть точка минимума J (и) на U-Jl

Как видно из оценки и

как подтверждает практика,

метод

Ньютона сходится очень быстро, если начальное приближение «0 выбрано достаточно близким к точке минимума и*. Однако если хорошего начального приближения ио нет, то метод Ньютона за­ частую расходится. В этом можно убедиться на простом примере.

Возьмем функцию

 

 

 

 

 

 

 

при

|и |<

б,

 

 

 

 

 

 

 

J (и) = — и2 + 2 1и I — б

 

 

 

 

w

2

 

1 '

4

 

 

 

при |и |> б,

u(zE lt

 

 

 

 

 

 

где б — произвольное малое

положительное

число,

0 < 6 < 1 . Не­

трудно убедиться в том, что

Z (« )e C 2(£ i)

и

J " ( u ) ^ 1, так что

J (и) сильно выпуклая функция.

Эта

функция

достигает своего

минимума на Е i .b точке ы *= 0 . В

качестве начального приближе­

ния возьмем

«о = б . Применяя

метод

Ньютона,

получим последо­

вательность

 

 

 

 

 

 

 

 

 

Г K _ i)

 

 

( л =

1, 2 , . . . ) ,

«„ = «„ _ ,------ = ( - 1 ) " 2

 

 

 

J

(“n-l)

 

 

 

 

 

 

которая расходится, хотя начальное приближение

отличается от

«* = 0 на малое число б.

 

 

 

 

 

 

§ 8}

Метод Ньютона

111

2. Возникает вопрос, нельзя ли изложенный выше мет Ньютона видоизменить так, чтобы модифицированный метод не был столь чувствителен к выбору начального приближения? Такие модификации метода Ньютона существуют, см., например, [81], [82].

Опишем одну из этих модификаций. Пусть U — выпуклое замкнутое множество, / (и )е С 2(£У). Пусть выбрано произвольное начальное приближение u0^ U . Если un^.U уже известно, то сле­ дующее приближение un+i^ U находим так. Возьмем главную квадратичную часть

J п f a ) — ( J ' fa n ) > ^

^ п ) '1 “ ( J fa n ) f a

^н)> ^

 

^ п )

 

 

приращения J (и)— / (« „ )= / „ (« )+о(|ы — ип \2)

и определим

вспо­

могательное приближение йп из условия:

 

 

 

 

 

 

 

 

J n(un) =

m in Jnfa).

 

 

 

 

(8)

 

 

 

 

 

и

 

 

 

 

 

 

 

Сразу заметим, что J п (ип) <

J n (ы„) =

0.

Далее полагаем

 

 

 

 

 

Ц-п-\-\— ип -f- а„ (ип

tin),

 

 

 

 

(9)

где а„ выбирается из условий

 

 

 

 

 

 

 

 

J fa n )

fa n “Т &п fa n

^/1))

 

|J п fa n )

6

^ п

^ »

( 1^)

е — некоторое фиксированное число, 0 < е < 1 . Если

ип не являет­

ся точкой минимума / (и)

на U, то при некоторых

ограничениях

на функцию J (и)

можно

доказать

возможность выбора >йп, а„,

ип+\ из условий (8— 10)

(см. ниже теорему 2),

причем для ускорег

ния поиска минимума желательно выбирать а п как

можно

ближе

к 1. Метод

(8— 10)

естественное обобщение

одного

из вариан­

тов метода

условного

градиента

(см.

(6.1-—2), (6.8)).

В

методе

условного градиента учитывалась лишь линейная часть прираще­ ния J (и)J(u n), а здесь учитывается квадратичная часть этого приращения. Выбор а п из (10) практически можно осуществлять так же, как и в методе условного 'градиента. Именно сначала бе­

рем а „= 1

и

проверяем

условие (10).

Если оно .выполнено,

то

оставляем

ап= 1 ; если

же

(10)

при а „= 1

нарушается,

то

производим

дробление ап до

тех

пор

пока неравенство

(10)

не

выполнится,

стараясь остановиться

на

значении

а„, как

можно

близком к

1.

При некоторых ограничениях на функцию J (и) ука­

занный выбор ап может быть произведен за конечное число дроб­ лений. Замечательно также и то, что независимо от выбора на­ чального приближения описанный 1нетод будет сходиться, причем начиная с некоторой итерации, он превратится в метод Ньютона, обретая свойственную этому методу высокую скорость сходи­ мости.

112

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х

[Гл. 2

Таким

образом, метод (8— 10) ненамного сложнее

метода

Ньютона, по скорости сходимости не уступает ему и в то же вре­ мя не столь чувствителен к выбору начального приближения, как метод Ньютона. При.наличии эффективных методов минимизации

квадратичной функции /и(«)

на U метод

(8— 10) можно с успехом

применять для минимизации достаточно гладких функций.

 

Т е о р е м а

2.

Пусть U

замкнутое выпуклое множество,

/ (ы )е С 2(П ),

ц|||2< (/ "(и )| , .|)<М |||а

при всех

и всех

u<=U, и пусть

||/"(«)—/"(o)J|^L|u— п|

при всех u, vt=U, где ц,

М, L — положительные константы. Пусть ei — некоторое число,

 

 

0 < е 1< — — (1 — б).

 

Тогда на отрезке

e ^ a ^ l

при

каждом

п существуют числа а„,

удовлетворяющие условиям

(10)

и среди них найдется максималь­

ное. Подставляя

это максимальное а п в

(9) для любого

началь­

ного приближения Uo^U, получим последовательность {«п}, для

которой:

1)

{ J (ип)}

монотонно

убывает

 

и

стремится

к

/* = inf/(u) (n-voo); 2)

существует

такой

номер

/г0=/г0(е),

что

 

<7 =

1«п„+1 — ып„| < 1,

и

а п =

I,

un+i = un

 

 

при всех

п ^ щ ,

т. е. метод (8— 10)

с номера

п — п0 превращается

в метод Ньютона, и, следовательно,

будет

верна оценка

(2)

при

всех п ^ п 0.

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о . По условию (У"(ц)£,

g)^|i|£|2

ПРИ всех

и ^ e £ m, p ,= co n st> 0 . Следовательно,

J (и)

сильно выпук­

лая функция

и в силу

теоремы

1.7 ограничена

снизу на

U и до­

стигает своей нижней грани в единственной точке и *еН . Посколь­

ку

J n (и) = 7 " (ип),

то функция J n(u)

также

сильно

выпукла_на U

и

достигает своей

нижней грани

в

единственной

точке

«пе У .

Может случиться,

что ип= и п. Тогда

 

и* = ип= ип. В самом деле,

применив теорему 1.3 к функции /«(и),

имеем

 

 

 

 

 

(/п(ип),

и — ип) > 0 ,

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

(J ' (и-п) + J" («л) («„ — ип),

и — ип) >

О,

и 6 и.

 

Если ип= и п, то

отсюда следует,

что

(J'(un), иип)^ 0,_ и < = и .

В силу теоремы 1.3 и выпуклости / (и)

 

заключаем,

что и*_==ип= ип,

и задача решена.

Поэтому ниже будем считать,

 

что ипФ и п, и,

следовательно, /п (м п )< ^ п (« п )= 0

при всех

п = 0,

 

1, 2, . . .

. Пока­

жем, что на отрезке E i ^ a ^ l

существуют

числа

ап, удовлетво­

ряющие условиям

(10).

 

 

 

 

 

 

 

 

§ 8)

 

 

Метод Ньютона

 

 

113

Обозначим иа= и п+'а(ипип),

0 < ;« ^ 1 . Из выпуклости функ­

ции J n (и)

следует, что

 

 

 

 

 

 

 

J n («а) < a J n (ип) + (1 — а) J n (ип) = a J n (ип) < О,

 

Тогда из формулы

 

 

 

 

 

 

J (Иа) — J (и„) =

J n («а) +

((J" (иа +

(ип — Un))

 

 

 

— Г ( и п))(ип — ип) , й п — ип),

0 < а < 1

(11)

будем иметь

 

 

 

 

 

 

 

j («„) — J Ы

> — J n («а) — — (M — ll)\un — Un \2> 0.\Jn (un)\ —

 

 

- \ ^ М \ й п- и п\\

 

0 < а < 1 .

 

(12)

Так как /п {и)

сильно выпуклая функция и достигает своего мини­

мума на U в точке ип, то согласно теореме 1.6

 

 

\чп — «„12 <

Un(4n) — J n(u„)] =

|/„(“*) I»

n = 0, 1 , . . .

 

 

!*■

 

 

 

 

 

(13)

 

 

 

 

 

 

 

 

Подставим эту оценку в (12). Получим

 

 

 

 

J

(un) — J (иа) > а ^ 1 ----- ~

а ) \J n(un)\> ае| J n (un)\

 

при всех

а,

а ■< —

^ ** < 1 .

Таким образом,

 

 

 

 

 

2М

 

 

 

 

 

множество тех а = а п, для которых выполнено условие (10),

непу­

сто. Из непрерывности J (и) следует, что множество таких а зам­

кнуто и, следовательно, это множество

содержит

свою верхнюю

грань a „ ^ l . В соответствии с (9) полагаем

ип+\=

ыа„.

 

Покажем, что для получаемой таким образом последователь­ ности {ип} при любом выборе начального приближения u0^ U верны все утверждения теоремы.

Прежде всего с учетом an^ e i из (10) имеем

J

{чп)

J

(Wn+l) ^ &<ХП|J n (ип) | 68]^ |J п (ип) |

0,

п = 0,

1, . . .

 

 

 

 

 

 

 

(14)

Следовательно, { J (ип)}

монотонно убывает и,

кроме того,

J (ип) >

>

J* =

inf J

(ы) > — оо.

Тогда существует l i mJ (« J

и |Пш [/(un+I) —

U

П—>оо

П-^оо

114

 

 

М И Н И М И З А Ц И Я Ф У Н К Ц И И

М Н О ГИ Х

ПЕРЕМЕННЫ Х

 

 

 

Гл. 2

— У(ц„)] =

0.

 

Из

(14)

теперь

 

имеем

1

 

(«„) |— 0,

а

из

(13)—

ип|— О (п —> оо).

Следовательно,

существует

такой

 

номер

п0 =

п0(е),

что

-----\un-ия | < 1 — е

при

всех

п>/г0.

Из

(11)

с

учетом

 

 

 

н*

 

 

для

J" (и) и

оценки

(13)

для

всех

а,

условия Липшица

 

<

а < 1,

тогда имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

Ю

— J («а) >

 

 

 

а3£

 

 

 

 

 

 

 

 

 

 

 

 

 

а I J a (и„) I------—

I ипипI3 >

 

 

 

 

 

 

 

 

 

>

IJ,, (М п)

I

1 — -^-'1 Й„ — йпI ^

>

ае I J n (й„) |

 

 

 

 

при

всех /г>/г0. Это означает,

что (10)

выполнено при

всех

а„,

Ч < % < 1

и,

следовательно,

максимальное

среди

таких

ап

есть

an =

1

при всех

п >

п0.

А тогда

согласно

(9)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Un+i =

un,

J n (un+1) =

J n (ип) =

min>„ (и),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u £ U

 

 

 

 

 

 

 

т.

e.

начиная

с

номера п =

п0,

рассматриваемый метод

превращается

в

метод

Ньютона

с

начальным

 

приближением

и„0,

таким,

что

q =

|и„0+1— w„01< 1.

Поэтому

оценка

(2)

будет

верна

 

при всех

п > п0. А

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Существуют и другие способы выбора

 

а п в

(9),

например, в

работах [81], [82] ап предлагается

искать

 

из

условия

минимума

функции J {ип+ а (и п— ы„))

переменной а при 0 - ^ а ^ 1 .

О методе

Ньютона см. также в работах [4, 19, 27,

35,

46, 75,

81, 82,

97,

130,

152,

155, 170,

1.93, 235] и др.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. На каждом шаге метода Ньютона и его модификации пр ходится решать достаточно трудоемкую задачу минимизации квад­ ратичной части J n(u) приращения I{и ) —/(«„) на множестве U. В частности, метод Ньютона для минимизации сильно выпуклой функции J (и) на всем пространстве приводит к итерационному процессу

Un+1 = Un — (J" (мл))-> J' (и„),

п = 0, 1, . . . ,

на каждом шаге которого требуется

обращать

матрицу J"(u n).

Возникает вопрос, нельзя ли построить методы

минимизации,

обладающие высокой скоростью сходимости, как

метод Ньютона,

и в то же время требующие меньшего объема вычислений на каж ­ дой итерации?

В настоящее время такие методы известны. Они приспособле­

§ 8] Метод Ньютона 115

ны для поиска минимума функции на всем пространстве и в общих чертах сводятся к итерационному процессу:

 

un+i = ипа пДГ1J' (и„),

п =

0,

,

(15)

где а пфО

скалярный

 

множитель,

Ап

квадратная

матрица

m-ного порядка, такая, что \\АпJ"(u n) ||-й) (п-+ оо).

 

 

Следуя (86], опишем один из способов выбора матрицы Ап и

величины

а п в процессе

(15). Зафиксируем какую-либо

последо­

вательность векторов

Го,

гь ..., гп, ... ,' обладающую

свойствами:

1) |г'тг| —

при п-*-оо;

2)

существует

число у > 0 , такое,

что опре­

делители Ап матриц, столбцами которых являются нормирован­ ные векторы

 

 

 

 

 

rn

 

гп—1

 

 

rn—m+1

 

 

 

 

 

удовлетворяют

неравенству

Ап^ у

при

 

всех

п = т — 1,

т ,...

В остальном

последовательность {r„}

произвольна.

 

Например,

можно взять

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r0 =

^o®i>

■••, гт—1 =

A.m_i ет,

гт— Хте1л . . . , г2т—i =

 

 

 

:

^ 2 т—1 £т ,

Г2 т =

^2те1> ■■■ I

rn =

 

e i+l>

••• ,

 

 

 

где 6 j=

(0,

. . . ,

0, 1,

0, . . . ,

0 ) — единичный

вектор

по

 

оси

Ои},

i —‘ остаток

от

деления

целого

числа

п

на

целое

число

т, О ^ г^ / п — 1,

последовательность Хп->0

 

при п-*-оо,

Хп> 0 при

всех п— 0,

1, .. .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть последовательность {г„} с указанными свойствами уже

выбрана. Тогда матрица Ап в соотношении

(15) при каждом фик­

сированном п ^ т — 1

определяется из системы линейных алгебраи­

ческих уравнений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

;

- J' (Un—i ~Ь Гп—/)

 

J' (Un—j),

/ =

0, 1, . . .

,

т

1.

 

 

 

 

 

 

 

 

 

матрица Ап невырождена,

 

( 16)

 

Если полученная

при этом

то нахо­

дят ДГ1 и при выполнении условия

(ДГ‘ J' (ип), J'

(«п) ) > 0

присту­

п аю т^

выбору

величины

ап в

(15).

Для

этого

вначале полагают

ап =

“ я. где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

аП= min

 

 

( У ( и п ) , Un

U g ) “| ^

• и„ — и„

 

An

 

J' (Цп)>

 

 

 

\ип—Й„|3 J

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

const > 0 ,

и проверяют справедливость

неравенства

 

 

 

 

 

J(u n+1) — J(Un)<C еа„ (Д (ы„),

ип — ип),

0 < е < - ^ -

(17)

116

М И Н И М И З А Ц И Я Ф У Н К Ц И И М НОГИ Х ПЕРЕМЕННЫ Х

[Гл. 2

(постоянные R, е являются параметрами алгоритма). Если нера­

венство

(17)

выполняется,

то останавливаются

на

выборе

а п= а п,

находят

un+1

по формуле

(15)

и переходят к

следующей

итера­

ции. Если же

неравенство

(17)

не выполняется

пр_и а„ = а„, то

производят дробление ап (например, последовательным делением пополам) до тех пор, пока (17) не окажется справедливым, и полученную в результате дробления величину принимают в каче­ стве ап в (15).

Если при каком-либо

п ^ т — 1

матрица Л„, определенная из

системы

(16),

окажется

вырожденной

или

же

(ДГ1

J'

(ип),

/ ' ( и , ) ) а

то

либо

изменяют вектор

гп

и

-заново

строят

матрицу Ап, либо полагают Ап= Е

(Е — единичная матрица) и

ап в (15)

выбирают, пользуясь каким-либо

вариантом

'градиент­

ного мет.ода; п-й шаг метода

при

всех п ^ т — 1

 

описан.

Если

0 -^ / г ^ т —2, то

в

(15)

можно

принять

Ап= Е

и

а,г

при

/г=0,1, . . . ,

т— 2 выбирать, как в градиентном методе.

векторы гп,

Пусть Rn— матрица, столбцами

которой являются

гп-\, ■•- ,

гп—т+\, a

Qn— матрица,

составленная

 

из

 

столбцов

•7 fan 'l- ^n)i

J fan)t • • •

i

>7 fan—m+1 Д ?n—n»+l)

J' fan—in-\-l)-

 

ТогдаТсистема -(16) для определения An может быть записана в виде следующего матричного уравнения: AnRn — Qn. Отсюда видно, что если Rn, Qn невырождены, то матрица Ап определяется однозначно,

Ап1 существует и ДГ1= RnQnl. Заметим, что матрицы Rn, Qn отли­ чаются от Rn+1 и соответственно Q„+1 лишь одним столбцом. Это обстоятельство позволяет получить достаточно простые и удобные

рекуррентные соотношения, связывающие матрицы ДГ+i и ДГ1 [86]. Благодаря этим рекуррентным соотношениям существенно уменьша­ ется трудоемкость обращения матрицы Ап, и метод (15) — (17) ока­ зывается более экономичным по сравнению с описанными выше ме­ тодом Ньютона и его модификацией.

 

Отдельно остановимся на случае,

когда векторы гп в (16)

вы­

бираются по закону: rn— Xnei+1,

где i — остаток

от деления

п

на

т,

О ^ г^ / п — 1, числа Л „>0 и Д п->-0

при

оо,

е ^=( 0, ...,

0,

1,

0,

. . . , 0) — единичный вектор

по

оси

Ou\

i— 1, 2, . . . ,

т.

Тогда система (16)

решается в явном виде и, как нетрудно видеть,

матрица Ап будет состоять из столбцов

 

7 ' (“п -г +

К —I ei) — 7 ' (un—j)

7* (un—._j_| Н- 7n_ i+ |gg) — J' Kt-t-|-i)

 

K -i

 

V - w

J ’ (“n +

J ’ (un)

J '(u„_m + |+

e [+2) — J ' (un_ m + l)

X

'

x m+1

§ 9] Метод штрафных функций 117

 

 

 

(ипi—1 ~t~^n—t—1e”»)

J

(un—i—l)

 

 

 

.

h - l - l

 

 

 

Для

сравнения

вспомним, что матрица J" (и)

состоит из столбцов

 

 

" дЧ (и ) -

 

 

 

’дЧ (и ) ~

 

 

 

дихди1

 

 

 

5u15um

 

д ]' (и)

_

 

dJ'

(и)

 

 

ди1

 

 

" ’ ’

дит

^

 

 

 

дЧ (и)

 

 

 

дЧ (и)

 

 

 

ди"‘ди1

 

 

 

дитдит

Отсюда видно, что столбцы матрицы Ап представляют собой

разностную аппроксимацию

соответствующих столбцов матрицы

Г (и)

в специально

выбираемых точках,

и метод (15) — (17) пре­

вращается в разностный вариант метода Ньютона. Поэтому мож­ но ожидать, что метод (15) — (17) будет обладать высокой ско­ ростью сходимости. Строгое доказательство этого факта для силь­ но выпуклых функций J(u ) ^ C 2(Em) проведено в работе [86]. Та­

ким

образом, метод (15) — (17) имеет

скорость

сходимости,

близ­

кую

к скорости сходимости метода

Ньютона

и в то же

время

является более экономичным по сравнению с методом Ньютона с точки зрения количества вычислений производных минимизируе­ мой функции и трудоемкости обращения матрицы Ап на каждом

шаге.

Для

квадратичной

функции,

определяемой

равенством

(7.7),

метод

(15) — (17)

сходится за

конечное

число

шагов [86].

Различные варианты метода

(15)— (17), обзор

близких

методов и

библиографию см. в [84],

[86],

[258].

 

 

 

Отправляясь от соотношений (15) — (17), в работе [87] постро­ ен быстросходящийся метод минимизации, не требующий вычисле­ ния производных минимизируемой функции. В этом методе выра­ жения градиента, встречающиеся в соотношениях (15) — (17), за ­ меняются разностными отношениями функции в подходящим обра­ зом выбранных точках. Другие методы минимизации функций, не требующие вычисления производных минимизируемой функции, описаны в работах [235], [262], [265]; библиографию и обзор см. в [87], [265]. Эти методы удобно применять в тех случаях, когда вы­ числение производных минимизируемой функции связано со зна­ чительными трудностями.

§ 9. МЕТОД ШТРАФНЫХ ФУНКЦИИ

Пусть функция /(и) определена на всем пространстве Ет и требуется минимизировать I (и) на множестве 1!ф Е т. Идея мето­ да штрафных функций заключается в замене исходной задачи

118

М И Н И М И З А Ц И Я

Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х

[T.i. 2

задачей

минимизации

однопараметрического

семейства

функций

Jh (u )= = .J(u )+ P k (u)

на

всем пространстве, где Ph(u)

функция,

выражающая собой

«штраф» за

нарушение

ограничений « е У ,

a k — параметр, регулирующий величину «штрафа».

 

Для примера возьмем задачу на условный экстремум из клас­

сического анализа: найти минимум функции

J (и) на множестве

 

U =

{ u :g i (u) = 0,

i = 1, 2, . . .

,s},

(1)

где 7(ы), ё\{и) — заданные функции, определенные на всем про­

странстве

Ет.

Рассмотрим функцию

J k ( u ) = J (и )+ k g (u ), где

S

 

 

 

 

g (u )=

 

k — достаточно большое положительное число.

£=1

 

 

служит «штрафом» за нарушение усло­

Слагаемое kg (и) = P h(u)

вия гге/У:

если

и<=0, то

Р Л(и )з=0, а

если u £ U , то Р%(и)>0 и

при небольшом нарушении ограничения g .{u )= 0 величину «штра­ фа» можно сделать как угодно большой за счет выбора больших

k> 0 .

Далее

будем

решать задачу

минимизации

Д (« )

на Ет,

используя те

или

иные известные методы минимизации.

Пусть

Д (« )

достигает своего минимума на Ет в точке %. Можно наде­

яться,

что с ростом k функция Jk(u)

будет достигать

минимума в

таких точках Uk, которые все точнее и точнее удовлетворяют огра­ ничению g(u) = 0 , и, кроме того, Л (uk) - * J “= inf J (и).

 

 

 

 

Функцию Ph(«)

u£U

 

 

 

О п р е д е л е н и е

1.

называют

штрафной

функцией множества

U,

если Рь(и ) ^

0 при всех

и ^ Е т и /г>0, и

 

lim

Pk (и) =

0,

если

и 6 U,

 

 

 

 

оо,

если

u ^ U .

 

 

 

 

 

 

 

 

 

 

 

Приведем примеры штрафных функций для множеств, зада­

ваемых с помощью одного неравенства

 

 

 

 

 

 

 

 

U = { u :u £ E m, g(u) < 0 } ,

 

 

 

(2)

где g(u) — известная функция,

определенная на

всем

простран­

стве.

 

 

 

 

 

 

 

 

 

 

 

Заметим, что в таком виде представимы широкие классы

мно­

жеств.

Например,

множества,

задаваемые

системой неравенств

g i(u) ^ 0

(г= 1, . . . ,

s), нетрудно

записать

в

виде

(2):

для

этого

в (2) достаточно взять

 

 

 

 

 

 

 

 

 

 

 

 

* ( “) = £

fei (“)]+.

 

 

 

 

 

 

 

 

 

£=1

 

 

 

 

 

 

где принято обозначение [g(M)]+ = m ax{0;

g (u )}. Множества

вида

 

 

 

 

 

 

 

 

S

 

 

 

(1) также записываются в виде (2) при g (и) = £ gf (и).

£=1

§ 9]

Метод штрафных функций

119

В качестве штрафной функции множества (2)

могут служить,

например, следующие функции:

 

 

Рц (и) =

k [g («)]+, Р„ (и) =

k ([g (u)]+)2,

Pk («■) = 4 -

ekg(u\ Pk (и) = (1 +

[g («)]+)* -

1

k

 

 

 

и др. В зависимости от метода, применяемого для минимизации функции J ii ( u ) = J (и) +Ри{и) на Ет> при выборе штрафной функ­ ции надо учитывать ее гладкость, удобство вычисления значений функции и ее производных и т. п.

Важно заметить, что нет необходимости точно решать задачу

минимизации Д (и )

на Ет при фиксированном /е>0,

а нужно лишь

позаботиться о том, чтобы с ростом k

эта

задача

решалась все

точнее и точнее.

А

именно

обычно

берут ка_кую-либо функцию

е —е (6 )> 0 при & > 0 , е(£)-И ) при k-+oo

и с

помощью того или

иного метода минимизации определяют точку Uih такую, чтобы

Л =

inf. J k (и) <

J k (uk) <

4

-г e (k),

k >

0.

(3)

 

uSEm

 

 

 

 

 

 

 

 

 

Т е о р е м а

1. Пусть функции /(u),

g(u)

определены

и непре­

рывны на Ет,

i n f / ( w) > — оо,

пусть

U =

{и : g(u) ^ 0 } .

Пусть

 

т

 

 

 

 

 

 

 

Pk(u) ==Qh(g(u))

штрафная функция

множества U

имеет

вид

(см. выше примеры), причем: 1) для каждого /г функция Q;t(g)

определена,

непрерывна

и

неотрицательна

при

всех

g;

2) Q k(g)> 0,

монотонно

возрастает

по

g и 1 im Qk (g) =

-j- ос при

g > 0 ; 3)

если g ^ O , то

Qk(g)-+0

(Jk-*-+oo) равномерно

относи­

тельно gs^O. Пусть {Uk}

определены из условий (3)

при некоторых

е(/г) > 0 , г(/г)-+0

при k->-+ оо.

 

 

 

 

 

 

 

 

 

 

Тогда: 1)

Нгп / (uk) <

J" — inf / (и), l i m g ( « ft) < 0 ;

2)

если

мно-

 

 

 

£-->оо

 

 

« £ £ /

 

£ — >4~°°

бы одну предельную

жество {иА} при k

+ оо будет

иметь

хотя

точку и*,

то

и* — точка

минимума

J (и) на U\ 3) если

множество

Ue — {u :g (и) ■< 6}

ограничено хотя

бы

при

одном

6 =

60]> 0 , то

lim J (uk) — Г ,

р (uk, U) =

inf \uk и |->-0

(6-»-оо) и любая предель-

£ - * о о

 

 

 

 

 

и £ ( /

будет точкой минимума J (и)

на U,

а в

ная точка {uk} при /г -> +

о о

случае единственности точки минимума \uk — и* |-»- О

[k

оо).

 

 

Д о к а з а т е л ь с т в о .

Пусть

{&,„} — какая-либо гминимизирующая

последовательность

J {и)

на

U, т.

е.

ьт6 U

и J {vm) ->•Г (т

оо).

Возьмем

произвольное е > 0 .

Тогда

найдутся

такие

числа

/«о > 0 ,

k 0>

0, что J

( o j

<

/* +

е, е (k) <

е,

Pk (om) = Qk (g (vm)) <

г

при всех

т >

т0 и &>&„.

Следовательно,

с

учетом (3)

получаем

 

 

 

Соседние файлы в папке книги из ГПНТБ