- •1. Задачи оптимизации
- •1.1. Основные понятия
- •1.2. Постановка задачи оптимизации
- •1.2.1 Задача безусловной оптимизации
- •1.2.2. Задача условной оптимизации
- •1.2.3. Классическая задача на условный экстремум
- •1.2.4. Понятия выпуклого множества и выпуклой функции
- •1.2.5. Выпуклая задача оптимизации
- •1.2.6. Задача математического программирования
- •1.2.7. Задачи выпуклого программирования
- •1.2.8. Задачи линейного и квадратичного программирования
- •1.2.9. Задача дискретной оптимизации
- •1.2.10. Задачи оптимального управления
- •2.Начальные сведения о численных методах оптимизации
- •2.1. Понятие о численных методах оптимизации
- •2.2. Сходимость методов оптимизации
- •2.3. Условия остановки (критерии окончания счета)
- •2.4. Направление убывания и методы спуска
- •2.5. Выбор длины шага из условия минимизации функции вдоль заданного направления
1.2.1 Задача безусловной оптимизации
Задача (1.1) называется задачей безусловной оптимизации, если Х = Rn, т.е. если она имеет вид
f(x) min, х Rn. (1.5)
При изучении любого типа задач оптимизации важное место занимает вопрос об условиях оптимальности, или, как еще говорят, условиях экстремума. Различают необходимые условия оптимальности, т. е. условия, которым должна удовлетворять точка, являющаяся решением задачи, и достаточные условия оптимальности, т. е. условия, из которых следует, что данная точка является решением задачи.
Напомним соответствующие результаты необходимых и достаточных условий оптимальности в задачах безусловной оптимизации и их простые доказательства из курса математического анализа.
Пусть
- вектор первых частных производных (градиент) функции f в точке х* Rn;
- матрица вторых частных производных (гессиан) функции f в точке х* Rn.
Нижеследующая теорема указывает необходимое условие локальной оптимальности первого порядка.
Теорема 1.2. Пусть функция f дифференцируема в точке х* Rn. Если х* — локальное решение задачи (1.5), то
f'(x*) = 0. (1.6)
Точка х*, удовлетворяющая условию (1.6), называется стационарной точкой функции f или задачи (1.5). Стационарная точка не обязана быть решением, т.е. (1.6) не является достаточным условием оптимальности. Для выявления «посторонних» стационарных точек может использоваться необходимое условие локальной оптимальности второго порядка.
Теорема 1.3. Пусть функция f дважды дифференцируема в точке х* Rn. Если х* - локальное решение задачи (1.5), то матрица f" (х*) неотрицательно определена, т. е.
при всех h Rn. (1.7)
Достаточное условие локальной оптимальности содержит характерное усиление требований на матрицу f"(х*).
Теорема 1.4. Пусть функция f дважды дифференцируема в точке х* Rn. Предположим, что f'(х*) = 0, а матрица f"(х*) положительно определена, т.е.
при всех h Rn, h 0. (1.8)
Тогда х* - строгое локальное решение задачи (1.5).
В тех случаях, когда функция f достаточно проста, теоремы 1.2-1.4 позволяют явным образом решить задачу (1.5). При этом для исследования матрицы f"(х*) на неотрицательную и положительную определенность, как правило, используется критерий Сильвестра.
Пример 1.1. Рассмотрим задачу
, х* Rn.
Условие (1.6) имеет здесь вид
, .
Решениями этой системы (стационарными точками) являются xl = (0,0) и x2 = (1,1). При этом
, , .
По критерию Сильвестра матрица f"(х1) не является неотрицательно определенной, а матрица f"(х2) положительно определена. Тогда, в силу теоремы 1.3, точка х1 не может быть решением задачи; в силу теоремы 1.4 точка х2 - строгое локальное решение задачи.
1.2.2. Задача условной оптимизации
Задача (1.1) называется задачей условной оптимизации (условной задачей), если X - собственное подмножество пространства Rn. Для такой задачи сохраняют силу утверждения теорем 1.2—1.4, если ее локальное решение x* является внутренней точкой допустимого множества Х (х* int X). Однако для многих условных задач минимум достигается именно на границе, в силу чего для них эти классические результаты анализа неприменимы. При переходе от безусловных к условным задачам все вопросы оптимизации становятся более сложными.
В дальнейшем мы часто будем прибегать к геометрической интерпретации задач оптимизации, основанной на понятии линий (или поверхностей) уровня функции f, т.е. множеств вида
, R.
Для геометрической интерпретации данной (двумерной) задачи необходимо изобразить ее допустимое множество Х и несколько характерных линий уровня целевой функции f (рис.1.1).
Рис.1.1. Геометрическая
интерпретация задач оптимизации
а) б)
Чтобы отразить характер изменения функции, у данной линии уровня L полезно ставить знак «+» с той стороны, где f принимает значения, большие , и знак «—» - с другой. В геометрическом плане поиск (глобального) решения сводится к нахождению минимального числа * среди всех таких, что линия уровня L, имеет непустое пересечение с Х. При этом любая точка является решением задачи, а само * = f(х*) - минимальным значением функции f на X. Как отмечалось, возможны два случая: х* лежит внутри (рис.1.1, а) и на границе (рис.1.1, б) множества X.
Пример 1.2. Пусть в задаче (1.1) допустимое множество Х представляет собой круг единичного радиуса с центром в нуле, а целевая функция f имеет вид f (x)=(x1 - 2)2+(x2 - 1)2 (рис.1.2). Ее линия уровня L, при > 0 является окружностью радиуса с центром в точке (2, 1), при = 0 вырождается в эту точку, а при < 0 пуста. Геометрически ясно, что здесь - это та из указанных окружностей, которая касается круга X. Отсюда без труда определяется, что решением данной задачи служит .
Рис 1.2