Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач

.pdf
Скачиваний:
15
Добавлен:
25.10.2023
Размер:
14.17 Mб
Скачать

30

МИНИМИЗАЦИЯ ФУНКЦИИ

о д н о й ПЕРЕМЕННОЙ

а. 1

 

Ь - а ) >

Ъа

 

 

2Fn+i

 

 

 

 

 

 

Пусть теперь щ > и \ . В худшем случае точка и*

мажет на­

ходиться на отрезке [a, ui] длиной

 

 

 

 

 

F

 

 

их — а'> и \ — а =

— 2=i— (b а ),

 

Fn+1

и для установления этого обстоятельства мы должны сделать по крайней мере три вычисления значений функции, причем хотя бы одно из них во внутренней точке отрезка [a, иД Следовательно, для поиска- и* на [а, щ] в своем распоряжении мы имеем самое боль­ шее п—2 вычисления значений функции на этом отрезке. Однако по предположению индукции

6,1_о («х — а)

их — а ^ ы|— а

b а

2Fn-г ^ ZFn-г

2F„+i

 

так что

6«(Рп, Ь — а) > - Ь~ - а- И при

Аналогично доказывается это неравенство для случая ы2< « 2. Та­ ким образом, для всех стратегий Р„, начинающихся с выбора двух точек их, u2 6 [а, b] (s = 2), имеем

бЪп(Ра, Ь - а ) > - ± = £ - { П > 3).

^Гл+1

Перейдем к рассмотрению последовательных стратегий Рп, начи­ нающихся с выбора s точек uv иг, . . . , us 6 [а,Ь\, 2 < s < n . В этом случае, сравнивая значения J (uj), . . . , J ( u s), найдем отрезок [as, 6S],

содержащйй точки и*

и us,

a s<

us< jb s, с

вычисленным

значением

J (us) = min J (uj). Согласно следствию

3.1

при

любых даже

самых

l < i < s

 

 

 

 

будем иметь

 

 

наилучших действиях на классе Q* [a, b]

 

 

bs— a s >

Ьа

где

т =

— > 2

 

 

 

 

 

 

 

 

 

т + 1

 

2

 

 

 

 

при четном s, т =

>

1

при нечетном s > 3 .

 

 

 

Далее нам понадобятся неравенства:

 

 

 

 

 

 

2Fn+i > ( s + 1) F n s +2

при всех

s =

+

1,

3 < s < /г

 

и

 

 

 

 

 

 

 

 

 

 

2Fn+i> ( s +

2)F„_s +2 при всех

s =

2in,

4 <

s <

n,

( 1)

§ Л

 

 

Оптимальный последовательный поиск

для

задачи

Б

 

 

31

справедливость

которых

при

s

п — 1

вытекает

из

 

неравенств

(6 .1 — 2),

а

при s =

n

(1)

просто

доказать

С

помощью

 

индукции

по п.

 

в

стратегии

Рп оказалось

s = п, то

 

 

 

 

 

 

 

 

Если

 

 

 

 

 

 

 

 

 

 

 

 

бВп(Рп,

b а) >

Ьа

>

Ь а

 

 

 

 

 

 

 

 

 

 

 

2Fп+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2(/п+1)

 

 

 

 

 

 

в силу

следствия 3.1

и

неравенств (1)

при

s = n .

Поэтому

пусть

3 ^ s ■< п — 1.

Однако в этом

случае

первые s шагов

 

плана

Фп—i

приводят к

отрезку [а*, 6*] меньшей длины:

 

 

 

 

 

 

 

 

 

 

 

Ы - as = - - ^ - (Ьa) < J ^ L < bs- a s,

 

 

 

 

 

 

 

 

 

 

 

Fn+i

 

 

m + 1

 

 

 

 

 

 

 

 

что вытекает из неравенств (1). Для

получения

отрезка

[as, bs] нам

понадобилось s значений функции,

поэтому для

поиска и1 на [as, 6S]

мы имеем в распоряжении еще п — s + J

значение

функции

на этом

отрезке,

 

включая

точку us с известным J (us).

Однако

по

предпо-

' ложению индукции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6®_s+i {Ь — а) =

bs as

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2Fn-s+г

 

 

 

 

 

 

 

 

поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8ъп (Рп, b - a ) > -bs- -as

>

 

•flo

 

 

b a

 

 

 

 

 

 

2F„_s+2

 

 

2Fn+1

 

 

 

 

 

 

 

 

 

 

 

 

2/Vj-s+2

 

 

 

 

 

 

Таким образом,

доказано,

что бб„(, Рл,

b а) >•

b а

 

для любой

последовательной стратегии Рп (п >

 

 

 

 

 

2Fn+i

 

любого е,

2), и, кроме того, для

О <с е <

■ Ь~

 

, существует

стратегия

Фп,

для которой

 

 

 

 

 

 

2Fл+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Б

Ь— а) <

 

Ь — а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

бп (Ф п,

 

2Fп+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6 ® ( й - а ) =

inf6^(P„,

b а ) =

 

 

А

 

 

 

 

 

 

 

 

 

 

 

 

Рп

 

 

 

2Fn+1

 

 

 

 

 

 

Заметим, что величина е на практике не может быть сколь угодно малой в силу ограниченных возможностей измерительных приборов, ЭВМ и тгп. Пусть е > 0 — тот наименьший сдвиг между

числами, который можно измерить, и пусть 0 < ^ 8 < [-^ — — . Учи-"

2Fn+i

тывая конечность числа е, вместо описанного выше плана Фп можно использовать следующий более точный и полностью сим-

32

МИНИМИЗАЦИЯ ФУНКЦИИ одной ПЕРЕМЕННОЙ

[Гл. 1

метричный план [230]. Этот план начинается с двух симметричных на [а, b] точек

ик = а + — — (b — а) + - Fn-n

1)nfl -в, ut = а + b — ик. F/i+1

Если после k вычислений функции найден отрезок

[aft,

(& >1;

а ± — а, ЬХ=

Ь), содержащий точки и*

и ик с

вычисленным

значени­

ем J (ик) =

min /(«■), то

следующая

точка

берется

так:

Uk+i

= ak + Ьк ик и т. д. После п вычислений получим отрезок

[ап, Ьп\,

и можем положить ип =

я" Ьп .

С

помощью индукции

нетрудно

показать, что

 

 

 

 

 

 

 

^ '

Ь

а

Fn- 1

 

 

 

 

|^

 

2Fn

 

 

 

 

 

2F,n+l

 

 

 

Теперь можно ответить на вопрос: сколько следует произвести наблюдений значений /(к), чтобы с заданной точностью б> 0 оп­ ределить точку и* минимума /(i/)eQ *[a, 6 ]? Количество необхо­ димых для этого наблюдений равно наименьшему из чисел п, удов­ летворяющих неравенству

 

Ь а

I Fa-1

 

 

 

2fn+i

Fn+i

 

 

Очевидно также, что гарантированная наименьшая возможная

.длина

отрезка [а„, Ьп], содержащего точку и*

минимума / (u )s

e Q *[a ,

b], который может быть получен по наблюдениям значений

этой функции в п точках

( п ^ 2 ),

задаваемых

последовательно,

всегда

больше 26^ а) =

—— — .

Наконец, длина отрезка [а,Ь],

 

 

Fn+i

 

 

на котором с заданной точностью 6 > 0 можно найти точку и* ми­ нимума / (ii)eQ *[a , b] по п наблюдениям значений /(w), меньше

Шп+Х.

§ 8. МЕТОД ЗОЛОТОГО СЕЧЕНИЯ

Описанные выше планы Фибоначчи являются эффективным методом отыскания точки и* минимума функции J(u )^ Q *[a, Ь]. Однако, к сожалению, нельзя воспользоваться планами Фибонач­ чи, не зная заранее числа п предполагаемых наблюдений значений ■функции, ибо выбор первых точек и\, «2 в этих планах требует знания числа п. Между тем на практике встречаются ситуации, когда число п по каким-либо причинам не может быть заранее определено. Иногда желательно не ограничивать себя каким-то

.наперед заданным числом п наблюдений значений J (и) и прово­

§ «] Метод золотого сечения 33

дить наблюдения до тех пор, пока не удовлетворится какой-либо интересующий нас критерий, попутно стараясь, однако, чтобы ис­ пользуемый метод поиска по возможности скорее привел к точке минимума. В этом случае можно пользоваться методом деления отрезка пополам, не требующим знания числа п наблюдений зна­

чений /(и). Однако существует еще один метод,

который также

не зависит от намечаемого числа п значений J (и)

и который при

достаточно больших п почти столь же эффективен, как и метод Фибоначчи. Это — метод золотого сечения [230].

Как известно, золотым сечением отрезка называется деление отрезка на две неравные части так, чтобы отношение всего отрезка к большей части равнялось отношению большей части к меньшей. Нетрудно проверить, что золотое сечение отрезка [а, Ь] произво­ дится двумя симметрично расположенными точками

их = а

3_^ 5

 

ы2 = а + b их =

--------— (Ьа) и

 

 

= а +

 

(b — a),

u1< w 2,

причем

 

 

 

 

 

 

ь — а_ =

Ь-

их =

Ь — а

= , и, — а

=

1 + V5 _ j ^18033989.

Ь — их

иха

щ а

Ъи2

 

2

Замечательно здесь то, что точка щ в свою очередь производит золотое сечение отрезка [а, и2]: здесь

 

и„ их<^иха = b — и2; и2а

Г их а

 

 

 

 

 

 

 

 

их— а

« 2 — % ’

 

Аналогично точка и2 производит золотое сечение отрезка [«ь Ь\.

Опираясь

на

это свойство золотого сечения,

можно предложить

следующий метод поиска

точки и* минимума функции J (и) в Q* [а, Ь].

А именно сначала на отрезке [а, Ь] берем точки

их и и2,

задающие

золотое

сечение отрезка

[а,

Ь\ =

[ах,

6 Х].

Сравнивая J(u x) с J (и2),

находим

новый отрезок ,[а2,

А,],

а2 <^и* К

Ьг,

причем

 

 

Ь2— = и 2 а = Ъих

У 51 {Ь — а),

 

 

 

 

 

 

 

 

 

2

 

 

 

и на отрезке

[а2,

6 2] ’ находится

точка

w2, совпадающая с

одной из

точек их или

и»,

в которой

J (и2) = min J (щ)

и производящая золо-

 

 

 

 

 

 

i< ;< 2

 

 

 

_

тое сечение отрезка [а2,

Ь2].

Далее берем

симметричную с и2 точку

и3 — аг + Ь2Щ,

также

производящую

золотое

сечение

отрезка

[а2, 6 2],

вычисляя

значение J (и3)

и сравнивая

его

с J (u 2),

находим

2 Ф. П. Васильев

34 МИНИМИЗАЦИЯ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ л. I

новый отрезок [о3,

6 а], а 3<

и* <

Ь3, и т. д.

Пусть уже

известен

от­

резок

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

/ " с " ___ J

V Л — 1

 

 

 

 

 

 

 

 

 

 

 

(------J

(Ь — а)

и

известна

точка ип, ап< ы л <

Ьп, производящая золотое сечение отрезка [ап,

6 „]

и _совпадающая

 

с

одной

из

точек

ult

и.,, ■<. ,

ы„,

в

которой

J (ип) =

min J (и,).

 

Тогда

в

качестве

« л+1

возьмем

точку

 

l<i<n

_

 

 

 

 

 

 

 

 

 

 

 

ип^\ =

ап -\-Ьп ип,

также

производящую

золотое

сечение

отрезка

[ап, Ьп], вычисляем

значение J(u n+\)

и, сравнивая

с J(u n),

находим

новый отрезок

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[я,1b,i+i],

an+i < w* <

bn+i,

 

 

 

 

 

Ьп+1 — ал+, = [ ^

 

 

 

 

 

1 ) (ь — а)

 

и т. д. Процесс продолжаем до тех пор, пока не получим ы* с до­ статочной точностью или пока не выполнится другой интересующий нас критерий.

Пусть мы остановились на

п

шаге

(п > 2) и нашли отрезок

[a„, 6J , а„ < « * <& „. а также

точку

«л,

а„ < > „ < & „ , с вычислен­

ным значением J ( u n) = min •/(«,), производящую золотое сечение от-

l < i < n

резка \ап, Ьп\. Заметим, что для этого нам понадобилось п вычис­ лений значений функции. Если мы решаем задачу А, то полагаем

ип= ип с погрешностью

|и* — Ип| < ш ах {й л — и„, ип — а„} = ^ ^ 1 ) (6 Л— а„)

Ь — а

( ^ У

Если решаем задачу Б, то полагаем ы„ = ап~^Ьп. с погрешно­

стью

|и* ип|< 6Л- * Л

W / 5 - i y - V - a ) =

Ь - а

О

2 V

2

J

^ / 5 + 1 J " 1

S 5]

Метод ломаных

35

Для сравнения с методами Фибоначчи для решения задач А и Б заметим, что при больших п число

Поэтому при достаточно больших п погрешность, получаемая при применении метода золотого сечения к решению задач А и Б, боль­ ше соответствующей погрешности метода Фибоначчи всего в

 

Л 1 + .^ _ У _ ! _ ~

1,1708

 

Ч

 

2

)

/ 5"

 

раз. Отношение

погрешности метода золотого сечения к погрешности

метода деления отрезка

пополам при решении задачи А равно

 

2 _

2

 

У У 2 ^ (0,87

. . . ) " У 2 .

 

/ 5

+

1

)

очень больших п преимущество ме­

Отсюда видно,

что уже при не

тода золотого сечения становится ощутимым.

На практике иногда сочетают метод золотого сечения с мето­ дом Фибоначчи: на первой стадии поиска минимума применяют ме­ тод золотого сечения, затем, задавшись некоторым натуральным числом п, переходят к плану Фибоначчи Фп и на этом заканчива­

ют поиск.

 

 

~

Упражнение. Пусть заданы /п чисел: а\,

а2, ..., ащ — и пусть

известно, что минимум minа и = а р достигается

при каком-то един-

1<А<т

 

... > а р, ap< a p+i<^ . .. ^ 0+.

ственном р, 1 ^ . р ^ т , причем а \ ^ а г^

Как организовать п выборок из

чисел

а\, а-2,

..., a,n, чтобы ар =

= minaft найти как можно точнее?

Существует ли наилучшая стра-

тегия определения р?

§ 9. МЕТОД ЛОМАНЫХ

N/B этом параграфе рассмотрим один простой метод минимиза­ ции функций /(«), удовлетворяющих условию Липшица на отрез­ ке [а, Ь\ позволяющий найти минимум с любой наперед заданной точностью [85, 182]. Напомним

О п р е д е л е н и е 1-. Говорят, что функция J (и) удовлетворяет условию Липшица на отрезке [а, Ь], если существует такая по­

стоянная L ;> 0, что |/(гг)— J(v) |^L|w— v\ при любых и, v^[a,

Ь].

Пользуясь формулой конечных

приращений Лагранжа,

не­

трудно показать, что непрерывная

на отрезке функция J

(и) с

ку­

сочно-непрерывной производной удовлетворяет условию

Липшица

с константой L = su p [/'(«) |.

 

 

 

2 *

36

МИНИМИЗАЦИЯ

ФУНКЦИЙ

ОДНОЙ

ПЕРЕМЕННОЙ

 

 

[Гл. 1

Зафиксируем произвольную точку v отрезка [а, Ъ] и определим

функцию К{и,

и )= / ( о ) —L\uv\ переменной и, а ^ и ^ Ь . Нетруд­

но видеть,

что

функция К(и, v)

кусочно-линейна,

K{v, v ) = J ( v ) ,

К(и, v )^ .J(u )

при всех и, а ^ .и ^ Ь .

 

 

 

 

 

 

 

 

Опишем

 

метод

ломаных.

В

качестве

начального

при­

ближения может быть взята любая точка и0 £

[а,

6 ]. Далее

состав­

ляем функцию К {и,

«„) =

</(«„)— L |и и01 и следующую

точку

их

определяем

из

условия min /С(и,

и0) = К (и1,

и0)

(очевидно,

их — а

или и1 = Ь).

Зная иь

а<и< 6

 

К {и, их), составляем новую функ­

определяем

цию Рх(м) =

max К, (и, ис) и находим и.2 из условия Р х (и2) — min Р х(ц)

 

i = 0 , 1

 

 

 

.. ■,

и „ (я > 1)

уже

 

 

Тогда

(рис. 4). Пусть точки «0, их,

известны.

составим функцию

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рп (и) =

max К (и, и()

=

max {/([(ы, «„),

Рп~i («)}

 

 

 

 

 

( X i < n

 

 

 

 

 

 

 

 

 

 

 

 

(примем Р0 (и) = К(и, и0)) и следующую точку ип+1

найдем из усло­

вия Рп (u„+i) =

min Рп(и)

и т.

д.

Если

min Рп (и) достигается

в

 

 

a<u< 6

 

 

 

 

 

a<u<b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нескольких точках,

то

в

каче­

 

 

 

 

 

 

 

 

стве нп_)_1 берем

любую

.из

 

 

 

 

 

 

 

 

них.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для доказательства сходи­

 

 

 

 

 

 

 

 

мости этого метода нам пона­

 

 

 

 

 

 

 

 

добятся

следующие

свойства

 

 

 

 

 

 

 

 

Рп(и), п = 0 ,

1,

2 ,...: 1 )

Р„(и ) —

 

 

 

 

 

 

 

 

непрерывная

кусочно-линейная

 

 

 

 

 

 

 

 

функция и график ее представ­

 

 

 

 

 

 

 

 

ляет

собой

ломаную линию,

 

 

 

 

 

 

 

 

состоящую

из

отрезков пря­

 

 

 

 

 

 

 

 

мых

с угловым

наклоном

L

 

 

 

 

 

 

 

 

или — L\

2 ) P n {u).^.Pn+i(u),

 

 

 

 

 

 

 

 

Р п ( и ) ^ / ( и )

 

при

любых

 

 

 

 

 

 

 

 

и, а^.и<С.Ь

и любых

я = 0 ,

1,

 

 

 

 

 

 

 

 

2 , . . . ;

3) Рп ( щ )= Ц щ )

при

 

 

 

 

 

 

 

 

всех

г= 0 , 1

 

 

ибо

1 ( щ ) ~

ДВС -график функции К(и.и ),

 

 

К (Hi, Ui'j ^^Рп(^г)

 

J (^i) t

А;В,-график К (u ,u j, АВС.В,~график

 

 

4) Pn (u)

удовлетворяет

усло­

р,(и}, АгВг Сг -граф ик К(и,иг),АоОгВг Вг8,-

 

граф и к Рг (и)

 

 

 

 

 

 

вию

Липшица

 

на

отрезке

 

Р и с.

4

 

 

 

 

[а, 6 ]

с константой L.

 

 

 

Т е о р е м а

1.

Построенная

выше последовательность

{«„} та­

кова, что:

1)

lim

Pn(un+i) = J * =

in iJ(и) = J (и*)\

2)

любая

пре-

 

 

п-»оо

 

 

 

 

a<u<6

 

 

 

 

 

 

 

 

S 5]

Метод ломаных

37

дельная точка ы последовательности {ип} является точкой мини­ мума функции /(и); 3) если J (и) достигает своего минимума на отрезке [а, b] в единственной точке и*, то вся последовательность {ип} сходится к и*.

 

 

Д о к а з а т е л ь с т в о .

Прежде всего заметим, что последователь­

ность Р п («„-и)

монотонно возрастает и ограничена сверху;

 

 

 

 

р п- 1 («„) = minP„_i (ы)’<

Рп-

1 (ы„+1) <

Рп (ип+1),

 

 

 

 

 

 

 

 

аКи^Ь

 

 

 

 

 

 

 

 

 

 

 

 

 

Рп(«и-О =

min Рп (и) < Рп (а*) < J

(и*).

 

 

 

Следовательно,

существует

limP„r(«n+i) = P*k<

У*.

Покажем,

что

 

 

 

 

 

 

 

/1—>оо

 

 

 

 

 

 

 

Р* = J*. Пусть

и — произвольная предельная

точка последовательно­

сти

{«„}. Тогда

существует подпоследовательность^{«nJ , сходящая к

и,

причем можем

считать,

что

л2< . . .

<C[nk< n k+1 <

) . . . .

Так

как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

О < J

(«;) — Рп(“п+О =

р п (Щ) Рп(«п+ 0 <

L I

— a„+i|

 

при

любом

и

любых

i,

0 <Ci<£n,

то

полагая

здесь

i =

nk—\,

n =

nk — \,

получим

0 < J (aBfc_i) — PBjk_, (aftJt) <

L \ua^ x— « „ J.

От­

сюда при k -+ oo имеем

 

 

 

 

 

 

 

 

 

 

 

J* <

У (Д) =

lim / («„*_,) =

lim Рп,_ ! («„.) = P * < J*,

 

 

 

 

 

 

 

 

*-»oo

 

 

ft-»oo

K

R

 

 

 

 

t .

e.

lim P„ (u„+ i) =

J* = J

(u).

 

 

 

 

 

 

 

 

 

П—>оо

 

 

 

 

 

 

 

 

 

 

 

 

 

Первое и второе утверждения теоремы доказаны. Третье утверждение теоремы теперь является простым следствием первых двух. А

Описанный метод ломаных имеет ряд достоинств. Он позволя­ ет получить приближенное значение точки абсолютного минимума функции J (и) на [а, Ь] и сходится при любом выборе начальной точки «о, лишь бы функция J (и) удовлетворяла условию Липшица. Метод ломаных не требует существования производной J'(u) во всех точках отрезка, наличия строгой квазивыпуклости /(«), кро­ ме того, функция J (и) может иметь сколько угодно локальных и абсолютных минимумов на отрезке [а, Ь]. Если константа Липшица L функции J (и) известна, то метод ломаных прост и удобен для использования на ЭВМ. На каждом шаге этого метода требуется решить простую задачу минимизации кусочно-линейной функции Р п (и), сводящейся к перебору известных вершин ломаной Рп (и), причем перебор здесь существенно упрощается, ибо ломаная Рп (ц) отличается от Р п-\{и) не более чем двумя новыми вершинами.

38

МИНИМИЗАЦИЯ ФУНКЦИИ о д н о й ПЕРЕМЕННОЙ

[ Г л. 1

Нетрудно модифицировать описанный метод ломаных так, чтобы последовательность Р п (ип+\) строго монотонно возрастала.

В работе [83] показано, что метод ломаных близок к опти­ мальным методам поиска минимума на классе функций, удовлет­ воряющих условию Липшица. Оптимальная стратегия поиска ми­ нимума строго квазивыпуклых функций, удовлетворяющих усло­ вию Липшица, рассмотрена в работе [241].

§ 10. ВЫПУКЛЫЕ ФУНКЦИИ. МЕТОД КАСАТЕЛЬНЫХ

. Для минимизации некоторых классов функций можно исполь­ зовать более эффективные варианты метода ломаных. Опишем одну модификацию метода ломаных, пригодную для поиска мини­ мума выпуклых функций, когда в качестве звеньев ломаных бе­

рутся отрезки касательных к графику функции.

 

 

О п р е д е л е н и е

1,- Функция

J{u ), определенная

на

отрезке

а ^ .и ^ Ь , называется выпуклой,

если

 

 

 

J (аи +

[ 1 — а] и) <

а/ (и) -f (1 — а) J (v)

 

(1)

при всех и, v£ [а, b]

и всех а, 0 <

а < I.

 

 

 

Когда а пробегает отрезок [0,

1], точки (а и + (1 — а) и,

a/(u)-f-

+ (1— a ) J ( v ) ) на плоскости

переменных (и, J)

пробегают хорду АВ,

соединяющую точки

Л = .(а ,

J(u ))

и B — (v,

J (и))

на

графике

функции. Поэтому неравенство (1) имеет простой геометрический смысл: график выпуклой функции на любом отрезке [и, o ] s [ a , 6 ] находится ниже хорды, соединяющей точки графика функции на концах отрезка [м, и]. Примерами функций, выпуклых на любом отрезке из области своего определения, могут служить следующие

элементарные

функции:

и2, и, и,

|«|, еи, е~г\ — lnw.

Функция

sinw выпукла

на отрезке

и невыпукла при

О ^ и ^ л .

Более подробное изучение выпуклых функций отложим до сле­ дующей главы, а здесь отметим лишь некоторые свойства выпук­

лых

функций,

необходимые

для описания

метода касательных

(см. также упражнения в конце настоящего параграфа).

 

Т е о р е м а

1. Пусть функция I(и ) выпукла и непрерывно диф­

ференцируема на отрезке [р,

Ь). Тогда: 1) справедливо.неравенство

 

 

/ (и) > J

(v) -f J' (v) (и v)

(2)

при

всех и, i>e[a, b] (иначе

говоря, график

гладкой выпуклой

функции лежит выше графика

любой ее касательной); 2 ) произ­

водная /'(«) не убывает на [а ,

Ь]\ 3) J (и) удовлетворяет на [а, Ь]

условию Липшица с константой

L = m a x {| / '(a + 0 ) |, |J'(b —0)|}.

§ щ

Выпуклые

функции. Метод

касательных

39

 

Д о к а з а т е л ь с т в о .

Перепишем

неравенство

(1) в виде

J (v-\-a(uv ) ) J(v) ^ . a [ J (и) — /(»)]. К левой части этого неравен­ ства применим формулу Лагранжа о конечных приращениях. По­ лучим

или

J ’ (v + Qa(u — о)) а — н ) < а [J {и) J

(v)], О < 0 < 1 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J' (v +

0 а (« — и)) — и) <

J (и) J

(v)

 

 

при

всех

 

О <

а

1.

Отсюда

при

а -»■ +

О сразу

придем к неравен­

ству (2 ).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Переменные и и v в (2 ) равноправны. Меняя их ролями, по­

лучим J(v)

 

(« )+ / '(« ) и)

при всех и,

и е [а , b]. Сложим по­

следнее

неравенство

с

(2)

почленно. Будем иметь

[J'(u)-^J'(v)]

(и— и) ^

0

при всех и,

и е [а , Ь],

что равносильно неубыванию про­

изводной J'(ti)

на отрезке [а, Ь]. Следовательно,

/'(а+ О )

^

J'(b —0)

при всех и,

a ^ lu ^ b . С помощью

формулы Лагранжа о

конечных приращениях отсюда имеем

 

 

 

 

 

 

 

 

 

 

|J (и) J (v) |=

|/' (£) (и — v) |<

L |и v |

 

при

всех

и,

 

v 6 [a,

 

6 J,

где

а < £ , < 6 ,

L = max{ |J' (а -{- 0)j,

(6 0 )|}. А

 

 

 

 

 

 

 

 

 

 

 

 

Обозначим через U* множество точек глобального минимума

функции

 

/(«)

 

на отрезке [а, Ь], т. е.

U * = { и : a ^ . u ^ b , J(u) =

 

 

(и)}.

Возможны

следующие три

случая:

1)

U* — пус-

тое множество

(примером такой функции может служить J (и) = и

при 0 < и ^ 1 ,

7(0) =

1 'на отрезке [0, 1]); 2)

U* состоит из одной

точки и*

 

(примером служит функция 7(ы) = и2на отрезке

[— 1, 1]) ;

3)

U* состоит более чем из одной точки

(примером служит 7(ц) =

=

|ц| + |и— 1 |

на отрезке [—ll, 2]). В последнем случае существу­

ет отрезок [р,

y ]sta ,

b], все внутренние точки которого

принадле­

ж ат

U*,

а концы этого отрезка могут и не принадлежать

U* (при­

мер: J(u )= s0

при O C w ^ l , 7,(0) = 1). В самом деле, если и* и

е У * , и.*фь*,

то

 

 

 

 

 

 

 

 

 

 

 

/ *^ / (а М *+ ((1— а) V*) ^ . а / ( « * ) +

(1a . ) J ( v * )

= 7 * .

Следовательно,

7 (a u * -f (1— a ) u * ) = 7 * при всех a e [0 ,

1], т. е. весь

отрезок [и*, и*]с—U*. Теперь-остается взять p = in f[/ *,

Y=supt/*. А

 

 

Т е о р е м а

2 . Всякая выпуклая на отрезке [а, Ь] функция 7 (и),

достигающая своей нижней грани на этом отрезке, принадлежит подмножеству Q*{a, 6 ] строго квазивыпуклых функций на [а, 6 ].

Д о к а з а т е л ь с т в о .

По условию U* непусто.

Обозначим

p=infC/*, Y =supf7*. Как

было замечено выше, либо U* состоит

из одной точки и* и тогда

P==y = u*< либо P < y и тогда все точ­

ки интервала P < w< y принадлежат U*, т. е. 7 (ы )= 7 *

при Р

Соседние файлы в папке книги из ГПНТБ