книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdf30 |
МИНИМИЗАЦИЯ ФУНКЦИИ |
о д н о й ПЕРЕМЕННОЙ |
[Га. 1 |
|
|
Ь - а ) > |
Ъ— а |
|
|
|
2Fn+i |
|
||
|
|
|
|
|
|
Пусть теперь щ > и \ . В худшем случае точка и* |
мажет на |
||
ходиться на отрезке [a, ui] длиной |
|
|
|
|
|
• |
|
F |
|
|
их — а'> и \ — а = |
— 2=i— (b — а ), |
|
Fn+1
и для установления этого обстоятельства мы должны сделать по крайней мере три вычисления значений функции, причем хотя бы одно из них во внутренней точке отрезка [a, иД Следовательно, для поиска- и* на [а, щ] в своем распоряжении мы имеем самое боль шее п—2 вычисления значений функции на этом отрезке. Однако по предположению индукции
6,1_о («х — а) |
их — а ^ ы|— а |
b — а |
|
2Fn-г ^ ZFn-г |
2F„+i |
||
|
так что
6«(Рп, Ь — а) > - Ь~ - а- И при
Аналогично доказывается это неравенство для случая ы2< « 2. Та ким образом, для всех стратегий Р„, начинающихся с выбора двух точек их, u2 6 [а, b] (s = 2), имеем
бЪп(Ра, Ь - а ) > - ± = £ - { П > 3).
^Гл+1
Перейдем к рассмотрению последовательных стратегий Рп, начи нающихся с выбора s точек uv иг, . . . , us 6 [а,Ь\, 2 < s < n . В этом случае, сравнивая значения J (uj), . . . , J ( u s), найдем отрезок [as, 6S],
содержащйй точки и* |
и us, |
a s< |
us< jb s, с |
вычисленным |
значением |
|||||
J (us) = min J (uj). Согласно следствию |
3.1 |
при |
любых даже |
самых |
||||||
l < i < s |
|
|
|
|
будем иметь |
|
|
|||
наилучших действиях на классе Q* [a, b] |
|
|
||||||||
bs— a s > |
Ь— а |
где |
т = |
— > 2 |
|
|
|
|||
|
|
|
|
|
||||||
|
т + 1 |
’ |
|
2 |
|
|
|
|
||
при четном s, т = |
> |
1 |
при нечетном s > 3 . |
|
|
|
||||
Далее нам понадобятся неравенства: |
|
|
|
|
|
|
||||
2Fn+i > ( s + 1) F n s +2 |
при всех |
s = |
2т + |
1, |
3 < s < /г |
|
||||
и |
|
|
|
|
|
|
|
|
|
|
2Fn+i> ( s + |
2)F„_s +2 при всех |
s = |
2in, |
4 < |
s < |
n, |
( 1) |
§ Л |
|
|
Оптимальный последовательный поиск |
для |
задачи |
Б |
|
|
31 |
|||||||||||
справедливость |
которых |
при |
s |
п — 1 |
вытекает |
из |
|
неравенств |
||||||||||||
(6 .1 — 2), |
а |
при s = |
n |
(1) |
просто |
доказать |
С |
помощью |
|
индукции |
||||||||||
по п. |
|
в |
стратегии |
Рп оказалось |
s = п, то |
|
|
|
|
|
|
|
|
|||||||
Если |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
бВп(Рп, |
b — а) > |
Ь— а |
> |
Ь — а |
|
|
|
|
|
|||||||
|
|
|
|
|
|
2Fп+1 |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
2(/п+1) |
|
|
|
|
|
|
|||||
в силу |
следствия 3.1 |
и |
неравенств (1) |
при |
s = n . |
Поэтому |
пусть |
|||||||||||||
3 ^ s ■< п — 1. |
Однако в этом |
случае |
первые s шагов |
|
плана |
Фп—i |
||||||||||||||
приводят к |
отрезку [а*, 6*] меньшей длины: |
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
Ы - as = - - ^ - (Ь— a) < J ^ L < bs- a s, |
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
Fn+i |
|
|
m + 1 |
|
|
|
|
|
|
|
|
||
что вытекает из неравенств (1). Для |
получения |
отрезка |
[as, bs] нам |
|||||||||||||||||
понадобилось s значений функции, |
поэтому для |
поиска и1 на [as, 6S] |
||||||||||||||||||
мы имеем в распоряжении еще п — s + J |
значение |
функции |
на этом |
|||||||||||||||||
отрезке, |
|
включая |
точку us с известным J (us). |
Однако |
по |
предпо- |
||||||||||||||
' ложению индукции |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
6®_s+i {Ь — а) = |
bs — as |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
2Fn-s+г |
|
|
|
|
|
|
|
|
||||||
поэтому |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8ъп (Рп, b - a ) > -bs- -as |
> |
|
•flo |
|
|
b — a |
|
|
|
|
||||||||
|
|
2F„_s+2 |
|
|
2Fn+1 |
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
2/Vj-s+2 |
|
|
|
|
|
|
||||||
Таким образом, |
доказано, |
что бб„(, Рл, |
b — а) >• |
b — а |
|
для любой |
||||||||||||||
последовательной стратегии Рп (п > |
|
|
|
|
|
2Fn+i |
|
любого е, |
||||||||||||
2), и, кроме того, для |
||||||||||||||||||||
О <с е < |
■ Ь~ |
|
, существует |
стратегия |
Фп, |
для которой |
|
|
|
|
|
|||||||||
|
2Fл+1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
Б |
Ь— а) < |
|
Ь — а |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
бп (Ф п, |
|
2Fп+1 |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Следовательно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
6 ® ( й - а ) = |
inf6^(P„, |
b — а ) = |
|
|
А |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
Рп |
|
|
|
2Fn+1 |
|
|
|
|
|
|
Заметим, что величина е на практике не может быть сколь угодно малой в силу ограниченных возможностей измерительных приборов, ЭВМ и тгп. Пусть е > 0 — тот наименьший сдвиг между
числами, который можно измерить, и пусть 0 < ^ 8 < [-^ — — . Учи-"
2Fn+i
тывая конечность числа е, вместо описанного выше плана Фп можно использовать следующий более точный и полностью сим-
32 |
МИНИМИЗАЦИЯ ФУНКЦИИ одной ПЕРЕМЕННОЙ |
[Гл. 1 |
метричный план [230]. Этот план начинается с двух симметричных на [а, b] точек
ик = а + — — (b — а) + - Fn-n
1)nfl -в, ut = а + b — ик. F/i+1
Если после k вычислений функции найден отрезок |
[aft, |
(& >1; |
|||||
а ± — а, ЬХ= |
Ь), содержащий точки и* |
и ик с |
вычисленным |
значени |
|||
ем J (ик) = |
min /(«■), то |
следующая |
точка |
берется |
так: |
Uk+i — |
|
= ak + Ьк — ик и т. д. После п вычислений получим отрезок |
[ап, Ьп\, |
||||||
и можем положить ип = |
я" Ьп . |
С |
помощью индукции |
нетрудно |
|||
показать, что |
|
|
|
|
|
|
|
|
^ ' |
Ь — |
а |
Fn- 1 |
|
|
|
|
&П|^ |
|
2Fn |
|
|
|
|
|
|
2F,n+l |
|
|
|
Теперь можно ответить на вопрос: сколько следует произвести наблюдений значений /(к), чтобы с заданной точностью б> 0 оп ределить точку и* минимума /(i/)eQ *[a, 6 ]? Количество необхо димых для этого наблюдений равно наименьшему из чисел п, удов летворяющих неравенству
|
Ь — а |
I Fa-1 |
|
|
|
2fn+i |
Fn+i |
|
|
Очевидно также, что гарантированная наименьшая возможная |
||||
.длина |
отрезка [а„, Ьп], содержащего точку и* |
минимума / (u )s |
||
e Q *[a , |
b], который может быть получен по наблюдениям значений |
|||
этой функции в п точках |
( п ^ 2 ), |
задаваемых |
последовательно, |
|
всегда |
больше 26^ (Ь— а) = |
—— — . |
Наконец, длина отрезка [а,Ь], |
|
|
|
Fn+i |
|
|
на котором с заданной точностью 6 > 0 можно найти точку и* ми нимума / (ii)eQ *[a , b] по п наблюдениям значений /(w), меньше
Шп+Х.
§ 8. МЕТОД ЗОЛОТОГО СЕЧЕНИЯ
Описанные выше планы Фибоначчи являются эффективным методом отыскания точки и* минимума функции J(u )^ Q *[a, Ь]. Однако, к сожалению, нельзя воспользоваться планами Фибонач чи, не зная заранее числа п предполагаемых наблюдений значений ■функции, ибо выбор первых точек и\, «2 в этих планах требует знания числа п. Между тем на практике встречаются ситуации, когда число п по каким-либо причинам не может быть заранее определено. Иногда желательно не ограничивать себя каким-то
.наперед заданным числом п наблюдений значений J (и) и прово
§ «] Метод золотого сечения 33
дить наблюдения до тех пор, пока не удовлетворится какой-либо интересующий нас критерий, попутно стараясь, однако, чтобы ис пользуемый метод поиска по возможности скорее привел к точке минимума. В этом случае можно пользоваться методом деления отрезка пополам, не требующим знания числа п наблюдений зна
чений /(и). Однако существует еще один метод, |
который также |
не зависит от намечаемого числа п значений J (и) |
и который при |
достаточно больших п почти столь же эффективен, как и метод Фибоначчи. Это — метод золотого сечения [230].
Как известно, золотым сечением отрезка называется деление отрезка на две неравные части так, чтобы отношение всего отрезка к большей части равнялось отношению большей части к меньшей. Нетрудно проверить, что золотое сечение отрезка [а, Ь] произво дится двумя симметрично расположенными точками
их = а |
3_^ 5 |
|
ы2 = а + b — их = |
|||
--------— (Ь— а) и |
||||||
|
|
= а + |
|
(b — a), |
u1< w 2, |
|
причем |
|
|
|
|
|
|
ь — а_ = |
Ь- |
их = |
Ь — а |
= , и, — а |
= |
1 + V5 _ j ^18033989. |
Ь — их |
их— а |
щ — а |
Ъ— и2 |
|
2 |
Замечательно здесь то, что точка щ в свою очередь производит золотое сечение отрезка [а, и2]: здесь
|
и„ — их<^их— а = b — и2; и2— а |
Г их — а |
|
||||||||
|
|
|
|
|
|
|
их— а |
« 2 — % ’ |
|
||
Аналогично точка и2 производит золотое сечение отрезка [«ь Ь\. |
|||||||||||
Опираясь |
на |
это свойство золотого сечения, |
можно предложить |
||||||||
следующий метод поиска |
точки и* минимума функции J (и) в Q* [а, Ь]. |
||||||||||
А именно сначала на отрезке [а, Ь] берем точки |
их и и2, |
задающие |
|||||||||
золотое |
сечение отрезка |
[а, |
Ь\ = |
[ах, |
6 Х]. |
Сравнивая J(u x) с J (и2), |
|||||
находим |
новый отрезок ,[а2, |
А,], |
а2 <^и* К |
Ьг, |
причем |
|
|||||
|
Ь2— = и 2 — а = Ъ— их |
У 5— 1 {Ь — а), |
|
||||||||
|
|
|
|
|
|
|
|
2 |
|
|
|
и на отрезке |
[а2, |
6 2] ’ находится |
точка |
w2, совпадающая с |
одной из |
||||||
точек их или |
и», |
в которой |
J (и2) = min J (щ) |
и производящая золо- |
|||||||
|
|
|
|
|
|
i< ;< 2 |
|
|
|
_ |
|
тое сечение отрезка [а2, |
Ь2]. |
Далее берем |
симметричную с и2 точку |
||||||||
и3 — аг + Ь2— Щ, |
также |
производящую |
золотое |
сечение |
отрезка |
||||||
[а2, 6 2], |
вычисляя |
значение J (и3) |
и сравнивая |
его |
с J (u 2), |
находим |
2 Ф. П. Васильев
34 МИНИМИЗАЦИЯ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ [Гл. I
новый отрезок [о3, |
6 а], а 3< |
и* < |
Ь3, и т. д. |
Пусть уже |
известен |
от |
|||||||
резок |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/ " с " ___ J |
V Л — 1 |
|
|
|
|
|
|
|
|
|
|
|
(— ------J |
(Ь — а) |
и |
известна |
||||
точка ип, ап< ы л < |
Ьп, производящая золотое сечение отрезка [ап, |
6 „] |
|||||||||||
и _совпадающая |
|
с |
одной |
из |
точек |
ult |
и.,, ■<. , |
ы„, |
в |
которой |
|||
J (ип) = |
min J (и,). |
|
Тогда |
в |
качестве |
« л+1 |
возьмем |
точку |
|||||
|
l<i<n |
_ |
|
|
|
|
|
|
|
|
|
|
|
ип^\ = |
ап -\-Ьп— ип, |
также |
производящую |
золотое |
сечение |
отрезка |
|||||||
[ап, Ьп], вычисляем |
значение J(u n+\) |
и, сравнивая |
с J(u n), |
находим |
|||||||||
новый отрезок |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
[я,1+ь b,i+i], |
an+i < w* < |
bn+i, |
|
|
|
|
|||
|
Ьп+1 — ал+, = [ ^ |
|
|
|
|
|
1 ) (ь — а) |
|
и т. д. Процесс продолжаем до тех пор, пока не получим ы* с до статочной точностью или пока не выполнится другой интересующий нас критерий.
Пусть мы остановились на |
п-м |
шаге |
(п > 2) и нашли отрезок |
[a„, 6J , а„ < « * <& „. а также |
точку |
«л, |
а„ < > „ < & „ , с вычислен |
ным значением J ( u n) = min •/(«,), производящую золотое сечение от-
l < i < n
резка \ап, Ьп\. Заметим, что для этого нам понадобилось п вычис лений значений функции. Если мы решаем задачу А, то полагаем
ип= ип с погрешностью
|и* — Ип| < ш ах {й л — и„, ип — а„} = ^ ^ 1 ) (6 Л— а„)
Ь — а
( ^ У
Если решаем задачу Б, то полагаем ы„ = ап~^Ьп. с погрешно
стью
|и* — ип|< 6Л- * Л |
W / 5 - i y - V - a ) = |
Ь - а |
О |
2 V |
2 |
J |
^ / 5 + 1 J " 1 |
S 5] |
Метод ломаных |
35 |
Для сравнения с методами Фибоначчи для решения задач А и Б заметим, что при больших п число
Поэтому при достаточно больших п погрешность, получаемая при применении метода золотого сечения к решению задач А и Б, боль ше соответствующей погрешности метода Фибоначчи всего в
|
Л 1 + .^ _ У _ ! _ ~ |
1,1708 |
||||
|
Ч |
|
2 |
) |
/ 5" |
|
раз. Отношение |
погрешности метода золотого сечения к погрешности |
|||||
метода деления отрезка |
пополам при решении задачи А равно |
|||||
|
2 _ |
2 |
|
У У 2 ^ (0,87 |
. . . ) " У 2 . |
|
|
/ 5 |
+ |
1 |
) |
очень больших п преимущество ме |
|
Отсюда видно, |
что уже при не |
тода золотого сечения становится ощутимым.
На практике иногда сочетают метод золотого сечения с мето дом Фибоначчи: на первой стадии поиска минимума применяют ме тод золотого сечения, затем, задавшись некоторым натуральным числом п, переходят к плану Фибоначчи Фп и на этом заканчива
ют поиск. |
|
|
~ |
Упражнение. Пусть заданы /п чисел: а\, |
а2, ..., ащ — и пусть |
||
известно, что минимум minа и = а р достигается |
при каком-то един- |
||
1<А<т |
|
... > а р, ap< a p+i<^ . .. ^ 0+. |
|
ственном р, 1 ^ . р ^ т , причем а \ ^ а г^ |
|||
Как организовать п выборок из |
чисел |
а\, а-2, |
..., a,n, чтобы ар = |
= minaft найти как можно точнее? |
Существует ли наилучшая стра- |
тегия определения р?
§ 9. МЕТОД ЛОМАНЫХ
N/B этом параграфе рассмотрим один простой метод минимиза ции функций /(«), удовлетворяющих условию Липшица на отрез ке [а, Ь\ позволяющий найти минимум с любой наперед заданной точностью [85, 182]. Напомним
О п р е д е л е н и е 1-. Говорят, что функция J (и) удовлетворяет условию Липшица на отрезке [а, Ь], если существует такая по
стоянная L ;> 0, что |/(гг)— J(v) |^L|w— v\ при любых и, v^[a, |
Ь]. |
||
Пользуясь формулой конечных |
приращений Лагранжа, |
не |
|
трудно показать, что непрерывная |
на отрезке функция J |
(и) с |
ку |
сочно-непрерывной производной удовлетворяет условию |
Липшица |
||
с константой L = su p [/'(«) |. |
|
|
|
2 *
36 |
МИНИМИЗАЦИЯ |
ФУНКЦИЙ |
ОДНОЙ |
ПЕРЕМЕННОЙ |
|
|
[Гл. 1 |
|||||||||
Зафиксируем произвольную точку v отрезка [а, Ъ] и определим |
||||||||||||||||
функцию К{и, |
и )= / ( о ) —L\u— v\ переменной и, а ^ и ^ Ь . Нетруд |
|||||||||||||||
но видеть, |
что |
функция К(и, v) |
кусочно-линейна, |
K{v, v ) = J ( v ) , |
||||||||||||
К(и, v )^ .J(u ) |
при всех и, а ^ .и ^ Ь . |
|
|
|
|
|
|
|
|
|||||||
Опишем |
|
метод |
ломаных. |
В |
качестве |
начального |
при |
|||||||||
ближения может быть взята любая точка и0 £ |
[а, |
6 ]. Далее |
состав |
|||||||||||||
ляем функцию К {и, |
«„) = |
</(«„)— L |и — и01 и следующую |
точку |
их |
||||||||||||
определяем |
из |
условия min /С(и, |
и0) = К (и1, |
и0) |
(очевидно, |
их — а |
||||||||||
или и1 = Ь). |
Зная иь |
а<и< 6 |
|
К {и, их), составляем новую функ |
||||||||||||
определяем |
||||||||||||||||
цию Рх(м) = |
max К, (и, ис) и находим и.2 из условия Р х (и2) — min Р х(ц) |
|||||||||||||||
|
i = 0 , 1 |
|
|
|
.. ■, |
и „ (я > 1) |
уже |
” |
|
|
Тогда |
|||||
(рис. 4). Пусть точки «0, их, |
известны. |
|||||||||||||||
составим функцию |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Рп (и) = |
max К (и, и() |
= |
max {/([(ы, «„), |
Рп~i («)} |
|
|
|
|||||||||
|
|
( X i < n |
|
|
|
|
|
|
|
|
|
|
|
|
||
(примем Р0 (и) = К(и, и0)) и следующую точку ип+1 |
найдем из усло |
|||||||||||||||
вия Рп (u„+i) = |
min Рп(и) |
и т. |
д. |
Если |
min Рп (и) достигается |
в |
||||||||||
|
|
a<u< 6 |
|
|
|
|
|
a<u<b |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
нескольких точках, |
то |
в |
каче |
|||||
|
|
|
|
|
|
|
|
стве нп_)_1 берем |
любую |
.из |
||||||
|
|
|
|
|
|
|
|
них. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для доказательства сходи |
||||||||
|
|
|
|
|
|
|
|
мости этого метода нам пона |
||||||||
|
|
|
|
|
|
|
|
добятся |
следующие |
свойства |
||||||
|
|
|
|
|
|
|
|
Рп(и), п = 0 , |
1, |
2 ,...: 1 ) |
Р„(и ) — |
|||||
|
|
|
|
|
|
|
|
непрерывная |
кусочно-линейная |
|||||||
|
|
|
|
|
|
|
|
функция и график ее представ |
||||||||
|
|
|
|
|
|
|
|
ляет |
собой |
ломаную линию, |
||||||
|
|
|
|
|
|
|
|
состоящую |
из |
отрезков пря |
||||||
|
|
|
|
|
|
|
|
мых |
с угловым |
наклоном |
L |
|||||
|
|
|
|
|
|
|
|
или — L\ |
2 ) P n {u).^.Pn+i(u), |
|||||||
|
|
|
|
|
|
|
|
Р п ( и ) ^ / ( и ) |
|
при |
любых |
|||||
|
|
|
|
|
|
|
|
и, а^.и<С.Ь |
и любых |
я = 0 , |
1, |
|||||
|
|
|
|
|
|
|
|
2 , . . . ; |
3) Рп ( щ )= Ц щ ) |
при |
||||||
|
|
|
|
|
|
|
|
всех |
г= 0 , 1 |
|
|
ибо |
1 ( щ ) ~ |
|||
ДВС -график функции К(и.и ), |
|
|
— К (Hi, Ui'j ^^Рп(^г) |
|
J (^i) t |
|||||||||||
А;В,-график К (u ,u j, АВС.В,~график |
|
|
4) Pn (u) |
удовлетворяет |
усло |
|||||||||||
р,(и}, АгВг Сг -граф ик К(и,иг),АоОгВг Вг8,- |
|
|||||||||||||||
граф и к Рг (и) |
|
|
|
|
|
|
вию |
Липшица |
|
на |
отрезке |
|||||
|
Р и с. |
4 |
|
|
|
|
[а, 6 ] |
с константой L. |
|
|
|
|||||
Т е о р е м а |
1. |
Построенная |
выше последовательность |
{«„} та |
||||||||||||
кова, что: |
1) |
lim |
Pn(un+i) = J * = |
in iJ(и) = J (и*)\ |
2) |
любая |
пре- |
|||||||||
|
|
п-»оо |
|
|
|
|
a<u<6 |
|
|
|
|
|
|
|
|
S 5] |
Метод ломаных |
37 |
дельная точка ы последовательности {ип} является точкой мини мума функции /(и); 3) если J (и) достигает своего минимума на отрезке [а, b] в единственной точке и*, то вся последовательность {ип} сходится к и*.
|
|
Д о к а з а т е л ь с т в о . |
Прежде всего заметим, что последователь |
||||||||||||
ность Р п («„-и) |
монотонно возрастает и ограничена сверху; |
|
|
||||||||||||
|
|
р п- 1 («„) = minP„_i (ы)’< |
Рп- |
1 (ы„+1) < |
Рп (ип+1), |
|
|
||||||||
|
|
|
|
|
|
аКи^Ь |
|
|
|
|
|
|
|
|
|
|
|
|
|
Рп(«и-О = |
min Рп (и) < Рп (а*) < J |
(и*). |
|
|
|
||||||
Следовательно, |
существует |
limP„r(«n+i) = P*k< |
У*. |
Покажем, |
что |
||||||||||
|
|
|
|
|
|
|
/1—>оо |
|
|
|
|
|
|
|
|
Р* = J*. Пусть |
и — произвольная предельная |
точка последовательно |
|||||||||||||
сти |
{«„}. Тогда |
существует подпоследовательность^{«nJ , сходящая к |
|||||||||||||
и, |
причем можем |
считать, |
что |
л2< . . . |
<C[nk< n k+1 < |
) . . . . |
Так |
||||||||
как |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
О < J |
(«;) — Рп(“п+О = |
р п (Щ) — Рп(«п+ 0 < |
L I |
— a„+i| |
|
||||||||
при |
любом |
/г |
и |
любых |
i, |
0 <Ci<£n, |
то |
полагая |
здесь |
i = |
nk—\, |
||||
n = |
nk — \, |
получим |
0 < J (aBfc_i) — PBjk_, (aftJt) < |
L \ua^ x— « „ J. |
От |
||||||||||
сюда при k -+ oo имеем |
|
|
|
|
|
|
|
|
|
||||||
|
|
J* < |
У (Д) = |
lim / («„*_,) = |
lim Рп,_ ! («„.) = P * < J*, |
|
|
||||||||
|
|
|
|
|
|
*-»oo |
|
|
ft-»oo |
K |
R |
|
|
|
|
t . |
e. |
lim P„ (u„+ i) = |
J* = J |
(u). |
|
|
|
|
|
|
|
||||
|
|
П—>оо |
|
|
|
|
|
|
|
|
|
|
|
|
|
Первое и второе утверждения теоремы доказаны. Третье утверждение теоремы теперь является простым следствием первых двух. А
Описанный метод ломаных имеет ряд достоинств. Он позволя ет получить приближенное значение точки абсолютного минимума функции J (и) на [а, Ь] и сходится при любом выборе начальной точки «о, лишь бы функция J (и) удовлетворяла условию Липшица. Метод ломаных не требует существования производной J'(u) во всех точках отрезка, наличия строгой квазивыпуклости /(«), кро ме того, функция J (и) может иметь сколько угодно локальных и абсолютных минимумов на отрезке [а, Ь]. Если константа Липшица L функции J (и) известна, то метод ломаных прост и удобен для использования на ЭВМ. На каждом шаге этого метода требуется решить простую задачу минимизации кусочно-линейной функции Р п (и), сводящейся к перебору известных вершин ломаной Рп (и), причем перебор здесь существенно упрощается, ибо ломаная Рп (ц) отличается от Р п-\{и) не более чем двумя новыми вершинами.
38 |
МИНИМИЗАЦИЯ ФУНКЦИИ о д н о й ПЕРЕМЕННОЙ |
[ Г л. 1 |
Нетрудно модифицировать описанный метод ломаных так, чтобы последовательность Р п (ип+\) строго монотонно возрастала.
В работе [83] показано, что метод ломаных близок к опти мальным методам поиска минимума на классе функций, удовлет воряющих условию Липшица. Оптимальная стратегия поиска ми нимума строго квазивыпуклых функций, удовлетворяющих усло вию Липшица, рассмотрена в работе [241].
§ 10. ВЫПУКЛЫЕ ФУНКЦИИ. МЕТОД КАСАТЕЛЬНЫХ
. Для минимизации некоторых классов функций можно исполь зовать более эффективные варианты метода ломаных. Опишем одну модификацию метода ломаных, пригодную для поиска мини мума выпуклых функций, когда в качестве звеньев ломаных бе
рутся отрезки касательных к графику функции. |
|
|
|||||
О п р е д е л е н и е |
1,- Функция |
J{u ), определенная |
на |
отрезке |
|||
а ^ .и ^ Ь , называется выпуклой, |
если |
|
|
|
|||
J (аи + |
[ 1 — а] и) < |
а/ (и) -f (1 — а) J (v) |
|
(1) |
|||
при всех и, v£ [а, b] |
и всех а, 0 < |
а < I. |
|
|
|
||
Когда а пробегает отрезок [0, |
1], точки (а и + (1 — а) и, |
a/(u)-f- |
|||||
+ (1— a ) J ( v ) ) на плоскости |
переменных (и, J) |
пробегают хорду АВ, |
|||||
соединяющую точки |
Л = .(а , |
J(u )) |
и B — (v, |
J (и)) |
на |
графике |
функции. Поэтому неравенство (1) имеет простой геометрический смысл: график выпуклой функции на любом отрезке [и, o ] s [ a , 6 ] находится ниже хорды, соединяющей точки графика функции на концах отрезка [м, и]. Примерами функций, выпуклых на любом отрезке из области своего определения, могут служить следующие
элементарные |
функции: |
и2, и, — и, |
|«|, еи, е~г\ — lnw. |
Функция |
sinw выпукла |
на отрезке |
— |
и невыпукла при |
О ^ и ^ л . |
Более подробное изучение выпуклых функций отложим до сле дующей главы, а здесь отметим лишь некоторые свойства выпук
лых |
функций, |
необходимые |
для описания |
метода касательных |
(см. также упражнения в конце настоящего параграфа). |
||||
|
Т е о р е м а |
1. Пусть функция I(и ) выпукла и непрерывно диф |
||
ференцируема на отрезке [р, |
Ь). Тогда: 1) справедливо.неравенство |
|||
|
|
/ (и) > J |
(v) -f J' (v) (и — v) |
(2) |
при |
всех и, i>e[a, b] (иначе |
говоря, график |
гладкой выпуклой |
функции лежит выше графика |
любой ее касательной); 2 ) произ |
водная /'(«) не убывает на [а , |
Ь]\ 3) J (и) удовлетворяет на [а, Ь] |
условию Липшица с константой |
L = m a x {| / '(a + 0 ) |, |J'(b —0)|}. |
§ щ |
Выпуклые |
функции. Метод |
касательных |
39 |
|
Д о к а з а т е л ь с т в о . |
Перепишем |
неравенство |
(1) в виде |
J (v-\-a(u— v ) ) —J(v) ^ . a [ J (и) — /(»)]. К левой части этого неравен ства применим формулу Лагранжа о конечных приращениях. По лучим
или |
J ’ (v + Qa(u — о)) а (и — н ) < а [J {и) — J |
(v)], О < 0 < 1 , |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
J' (v + |
0 а (« — и)) (и — и) < |
J (и) — J |
(v) |
|
|
|||||
при |
всех |
|
О < |
а |
1. |
Отсюда |
при |
а -»■ + |
О сразу |
придем к неравен |
|||||
ству (2 ). |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Переменные и и v в (2 ) равноправны. Меняя их ролями, по |
|||||||||||||
лучим J(v) |
|
(« )+ / '(« ) (и— и) |
при всех и, |
и е [а , b]. Сложим по |
|||||||||||
следнее |
неравенство |
с |
(2) |
почленно. Будем иметь |
[J'(u)-^J'(v)] |
||||||||||
(и— и) ^ |
0 |
при всех и, |
и е [а , Ь], |
что равносильно неубыванию про |
|||||||||||
изводной J'(ti) |
на отрезке [а, Ь]. Следовательно, |
/'(а+ О ) |
^ |
||||||||||||
J'(b —0) |
при всех и, |
a ^ lu ^ b . С помощью |
формулы Лагранжа о |
||||||||||||
конечных приращениях отсюда имеем |
|
|
|
|
|
||||||||||
|
|
|
|
|
|J (и) — J (v) |= |
|/' (£) (и — v) |< |
L |и — v | |
|
|||||||
при |
всех |
и, |
|
v 6 [a, |
|
6 J, |
где |
а < £ , < 6 , |
L = max{ |J' (а -{- 0)j, |
||||||
|Л (6 — 0 )|}. А |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
Обозначим через U* множество точек глобального минимума |
|||||||||||||
функции |
|
/(«) |
|
на отрезке [а, Ь], т. е. |
U * = { и : a ^ . u ^ b , J(u) = |
||||||||||
— |
|
— |
|
(и)}. |
Возможны |
следующие три |
случая: |
1) |
U* — пус- |
||||||
тое множество |
(примером такой функции может служить J (и) = и |
||||||||||||||
при 0 < и ^ 1 , |
7(0) = |
1 'на отрезке [0, 1]); 2) |
U* состоит из одной |
||||||||||||
точки и* |
|
(примером служит функция 7(ы) = и2на отрезке |
[— 1, 1]) ; |
||||||||||||
3) |
U* состоит более чем из одной точки |
(примером служит 7(ц) = |
|||||||||||||
= |
|ц| + |и— 1 | |
на отрезке [—ll, 2]). В последнем случае существу |
|||||||||||||
ет отрезок [р, |
y ]sta , |
b], все внутренние точки которого |
принадле |
||||||||||||
ж ат |
U*, |
а концы этого отрезка могут и не принадлежать |
U* (при |
||||||||||||
мер: J(u )= s0 |
при O C w ^ l , 7,(0) = 1). В самом деле, если и* и |
||||||||||||||
е У * , и.*фь*, |
то |
|
|
|
|
|
|
|
|
|
|||||
|
|
/ *^ / (а М *+ ((1— а) V*) ^ . а / ( « * ) + |
(1— a . ) J ( v * ) |
= 7 * . |
|||||||||||
Следовательно, |
7 (a u * -f (1— a ) u * ) = 7 * при всех a e [0 , |
1], т. е. весь |
|||||||||||||
отрезок [и*, и*]с—U*. Теперь-остается взять p = in f[/ *, |
Y=supt/*. А |
||||||||||||||
|
|
Т е о р е м а |
2 . Всякая выпуклая на отрезке [а, Ь] функция 7 (и), |
достигающая своей нижней грани на этом отрезке, принадлежит подмножеству Q*{a, 6 ] строго квазивыпуклых функций на [а, 6 ].
Д о к а з а т е л ь с т в о . |
По условию U* непусто. |
Обозначим |
p=infC/*, Y =supf7*. Как |
было замечено выше, либо U* состоит |
|
из одной точки и* и тогда |
P==y = u*< либо P < y и тогда все точ |
|
ки интервала P < w< y принадлежат U*, т. е. 7 (ы )= 7 * |
при Р |