5.2. Общие принципы многомерной минимизации

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Книга_МО.pdf

Скачиваний:

554

Добавлен:

05.06.2015

Размер:

12.36 Mб

Скачать

☆

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 1617 / 3317 18 19 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

выпуклых функций, так как в достаточно малой окрестности точки минимума x дважды дифференцируемая функция f (x) с положительно определенной матрицей Гессе H (x) хорошо аппроксимируется сильно выпуклой квадратичной функцией.

5.2. Общие принципы многомерной минимизации
Для численного решения задач безусловной минимизации f (x) → min ,	x En
разработано много алгоритмов, использующих итерационные процедуры вида
xk +1 = Φ(xk , xk −1 , ..., x0 ) , x0 En .	(5.3)

Эти алгоритмы позволяют при определенных условиях построить последовательность {xk }такую, что

lim f (xk ) = f = min			f (x), если U ≠ Ø			(5.4а)
k →∞		En				(5.4б)
lim f (xk ) = f = inf			f (x), если U = Ø			(5.4б)
k →∞		En
где U − множество		точек	глобального	минимума	функции	f (x) .
Последовательность	{xk },	удовлетворяющая		требованию	(5.4), называется
минимизирующей для	функции f (x) . Если, кроме того, для случая					U ≠ Ø
дополнительно выполняется условие
	lim ρ (xk , U ) = 0 ,					(5.5)
	k	→∞
то говорят, что минимизирующая последовательность сходится к множеству U .

Если множество U состоит из единственной точки					x , то для сходящейся к U
минимизирующей последовательности lim xk = x .
	k→∞
	Необходимо отметить, что
	1. ρ (x, U ) = inf ρ(x, y) есть расстояние от точки x до множества U .
	y U
	2. Минимизирующая последовательность может и не					сходиться к точке
минимума. Например, для функции		f (x) =	x2	,	x E ,	последовательность
минимума. Например, для функции		f (x) =		,	x E ,	последовательность
			1 + x4		1
			1 + x4
xk	= k является минимизирующей, но не сходится к единственной точке минимума
x	= 0 . Напротив, минимизирующая последовательность xk =1/ k						сходится к точке
минимума x = 0 .
	Вопрос о существовании точки минимума обычно решается с помощью
теоремы Вейерштрасса: если функция		f (x)	непрерывна			в	En и множество

U α = {x : f (x) ≤α} для некоторого α непусто и ограничено, то f (x) достигает

глобального минимума в En .

Важной характеристикой сходящихся минимизирующих последовательностей является скорость сходимости. Последовательность {xk } сходится к точке x

линейно (со скоростью геометрической прогрессии), если существует такое число

q (0, 1) ,	что	выполняется		неравенство		ρ (xk , x ) ≤ q ρ (xk −1 , x ) ,		т.е.
ρ (xk , x ) ≤ qk ρ (x0 , x ) .
Сходимость		называется сверхлинейной, если				ρ (xk , x ) ≤ qk ρ (xk −1 , x ) , и
qk → +0 при k → ∞.
Наконец,		термин	квадратичная		сходимость		используется,	если

ρ (xk , x ) ≤ [cρ(xk −1 , x )]2 , c > 0 .

Установление сходимости последовательности {xk } из (5.5) и оценка скорости сходимости дают существенную информацию об итерационном процессе. Конкретный вычислительный алгоритм на основе (5.3), в котором может получаться, вообще говоря, бесконечная последовательность {xk }, необходимо

дополнять критерием окончания итерационного процесса. На практике используются следующие условия прекращения итераций

ρ (xk +1 , xk ) < ε1


f (xk +1 ) − f (xk )		< ε2	(5.6)
f (xk )	< ε3		(5.6)
f (xk )	< ε3

где εi − заранее заданные параметры точности.

Далее будут рассмотрено несколько двухслойных вычислительных алгоритмов, основанных на рекуррентных формулах вида

		xk +1 = xk +αk	pk , k = 0, 1, ... ,			(5.7)
где вектор	pk − направление поиска из точки			xk в точку xk +1 ,		а число αk −
величина	шага,	которая	выбирается	так,	чтобы	выполнялось

условие f (xk +1 ) < f (xk ) . Эти алгоритмы будут различаться способом построения вектора pk и выбора шага αk .

Определение. В итерационном процессе (5.7) производится исчерпывающий спуск, если величина шага αk находится из решения одномерной задачи минимизации

→

min ,

f (x

k +α

) .

(5.8)

k ( )

Таким образом, при исчерпывающем спуске на каждом шаге полностью

реализуется возможность уменьшить значение целевой функции		f (x) при
перемещении из точки	xk в направлении, коллинеарном вектору pk .	Величина
шага αk может быть	найдена с помощью рассмотренных ранее	методов

одномерной минимизации. В дальнейшем будет использоваться следующее важное свойство исчерпывающего спуска.

Теорема. Если функция	f (x)		дифференцируема					в En , то в	итерационном
процессе (5.7) с выбором шага с исчерпывающим								спуском для	любого k ≥1
выполняется условие
	f (x	k +1	), p	k	)	=	0 .		(5.9)
(	f (x		), p		)		0 .

□ Запишем необходимое условие минимума функции одной переменной Φk (α)

из (5.8), используя правило дифференцирования сложной функции

	d Φk (α)	n	∂ f (xk +1 ) d xkj +1
		= ∑					= 0 .
	d α	= ∑	∂ x j		d α		= 0 .
	d α	j=1	∂ x j		d α
				d xk +1
Учитывая, что xkj +1 = xkj +α pkj		, поэтому			j	= pkj		. Отсюда получаем условие
Учитывая, что xkj +1 = xkj +α pkj		, поэтому		dα		= pkj		. Отсюда получаем условие
				dα
(5.9). ■
Геометрическая иллюстрация		соотношения				(5.9)		в E2 выглядит так. При

перемещении из точки xk вдоль прямой, задаваемой вектором pk в направлении

убывания функции,	происходит пересечение линий уровня функции f (x) . Это
происходит до тех	пор, пока	либо не	будет достигнута стационарная	точка
( f (xk +1 ) = 0 ), либо	прямая не	коснется	в точке xk +1 некоторой линии	уровня

функции f (x) . Равенство (5.9) и есть условие касания (рис.5.1).

f (x)

Рис. 5.1. Ортогональность направления pk градиенту f (xk +1 ) при исчерпывающем спуске

Свойство

( f (xk +1 ), pk ) = 0 позволяет в явном виде найти величину α k

для

квадратичной функции.

Теорема.

Для квадратичной функции

f (x) =

(A x, x) + (b, x) + c величина

αk

исчерпывающего спуска в итерационном процессе xk +1 = xk +αk pk ,

k = 0, 1, ... равна

αk = −

( f (xk ), pk )

= −

(Axk + b, pk )

(5.10)

(Apk , pk )

□ Действительно, умножив равенство

xk +1 = xk +αk pk слева

на

матрицу

квадратичной

функции

f (x) и прибавив

к обеим частям вектор

b , получим

Axk +1 + b = Ax k

+ b +αk Ap k .

Учитывая,

что градиент квадратичной функции равен

f (x) = Ax + b , имеем f (xk +1 ) = f (xk ) +αk Ap k . Подставляя выражение для f (xk +1 )

в равенство ( f (xk +1 ), pk ) = 0 , получаем формулу (5.10). ■

Определение. Направление вектора pk называется направлением убывания

функции f (x) в точке xk , если при всех достаточно малых положительных α выполняется неравенство f (xk +α pk ) < f (xk ) .

В итерационном процессе используются, как правило, направления убывания. Сформулируем признак направления убывания.

Теорема (достаточное условие направления убывания). Пусть функция

дифференцируема в точке xk . Если	вектор pk удовлетворяет условию
( f (xk ), pk ) < 0 , то направление вектора pk	является направлением убывания.
	78

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 1617 / 3317 18 19 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
27.03.201629.56 Кб28Кейс 4.docx
#
25.09.20192.02 Mб20КиД.doc
#
26.04.2019510.84 Кб29КиСА Экзамен.docx
#
27.03.201612.16 Mб33Клюшин Введение в дискретку.djvu
#
05.06.20151.16 Mб84книга по английскому.doc
#
05.06.201512.36 Mб554Книга_МО.pdf
#
05.06.2015420.05 Кб6колбок по линалу.pdf
#
18.11.20191.15 Mб5Колл.doc
#
05.06.201591.48 Кб69коллоквиум по химии вопросы 1-15.docx
#
05.06.201527.65 Кб67Коллоквиум Химия.doc
#
05.06.20151.17 Mб29Командообразование ДЗ1.docx