Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Власов_Методы оптимизации и оптимального управления_2013

.pdf
Скачиваний:
113
Добавлен:
27.03.2016
Размер:
710.95 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЯДЕРНЫЙ УНИВЕРСИТЕТ «МИФИ»

В.А. Власов, А.О. Толоконский

МЕТОДЫ ОПТИМИЗАЦИИ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Рекомендовано УМО “Ядерные физика и технологии” в качестве учебного пособия

для студентов высших учебных заведений

Москва 2013

УДК 681.51(075.8) ББК 32.965я7 В58

Власов В.А., Толоконский А.О. Методы оптимизации и оптимального управления. Учебное пособие. М.: НИЯУ МИФИ, 2013. – 88 с.

Предназначено для студентов групп А7-01-02-03 и студентов Эконо- мико-аналитического института НИЯУ МИФИ.

Содержит следующие основные разделы:

методы оптимизации функций многих переменных при наличии ограничений;

применение вариационных методов для поиска оптимальных управлений динамическими объектами;

применение принципа максимума Понтрягина для определения оптимального управления;

дискретная и непрерывная формы метода динамического программирования;

методы линейного программирования.

Внастоящее время практически отсутствуют литературные источники, которые были бы изданы в последние годы и в которых достаточно просто излагались бы комплексно перечисленные вопросы.

Подготовлено в рамках Программы создания и развития НИЯУ МИФИ.

Рецензент проф. каф. «Информационные системы», д-р техн. наук Сальников Н.Л.

ISBN 978-5-7262-1806-9

©

Национальный исследовательский

 

ядерный университет «МИФИ», 2013

Редактор Е.К. Коцарева

Подписано в печать 15.11.2012.

Формат 60x84 1/16

Печ. л. 5,5.

Уч.-изд. л. 5,75.

Тираж 120 экз.

Изд. № 57/1

Заказ № 11.

Национальный исследовательский ядерный университет «МИФИ». Типография НИЯУ МИФИ,

ООО «Полиграфический комплекс «Курчатовский». 144000, Московская область, г. Электросталь, ул. Красная, д. 42.

Оглавление

 

ВВЕДЕНИЕ.....................................................................................................................

6

ГЛАВА 1. ОПТИМИЗАЦИЯ СТАТИЧЕСКИХ ОБЪЕКТОВ.....................................

6

1.1. Понятие статических и динамических объектов..............................................

6

1.2. Задача нелинейного программирования...........................................................

7

1.3. Задачи на условный экстремум, неопределенные множители Лагранжа......

9

1.4. Пример применения метода неопределенных множителей Лагранжа для

 

поиска наибольших значений функций.................................................................

14

1.5. Общая постановка задачи линейного оценивания параметров.....................

16

Контрольные вопросы. ............................................................................................

22

ГЛАВА 2. ОСНОВЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ..............................

22

2.1. Постановка задачи............................................................................................

22

2.2. Основные геометрические фигуры в линейном программировании............

23

2.3. Экстремальные точки.......................................................................................

24

2.4. Основные теоремы об экстремальных точках................................................

27

2.5. Симплексный метод решения задач линейного программирования............

27

2.6. Учет ограничений типа неравенств.................................................................

32

2.7. Поиск начальной экстремальной точки..........................................................

33

Контрольные вопросы.............................................................................................

34

ГЛАВА 3. СПОСОБЫ ОПИСАНИЯ ДИНАМИЧЕСКИХ СИСТЕМ.......................

34

3.1. Передаточные функции....................................................................................

34

3.2. Описание в форме Коши..................................................................................

37

3.3. Управляемость, наблюдаемость, стабилизируемость, обнаруживаемось....

38

3.4. Понятие фильтра и общая задача регулирования ..........................................

41

Контрольные вопросы.............................................................................................

42

ГЛАВА 4. ПРИМЕНЕНИЕ ВАРИАЦИОННЫХ МЕТОДОВ ДЛЯ ПОИСКА

 

ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ ............................................................................

43

4.1. Понятие линейного пространства....................................................................

43

4.2. Функционал и его вариация.............................................................................

45

3

4.3. Вычисление вариации функционала...............................................................

46

4.4. Задача Эйлера....................................................................................................

46

4.5. Применение уравнения Эйлера для поиска оптимального закона

 

управления................................................................................................................

48

4.6. Уравнение Эйлера – Пуассона и его применение..........................................

49

4.7. Функционалы, зависящие от векторного аргумента......................................

50

4.8. Неопределенные множители Лагранжа в вариационном исчислении.........

51

Контрольные вопросы.............................................................................................

52

ГЛАВА 5. ВАРИАЦИОННЫЕ ЗАДАЧИ С ПОДВИЖНЫМИ ГРАНИЦАМИ.......

53

5.1.Основные виды задач с подвижными границами ...........................................

53

5.2. Скольжение граничных точек по заданным траекториям.............................

53

Контрольные вопросы.............................................................................................

55

ГЛАВА 6. ПРИНЦИП МАКСИМУМА И ДИНАМИЧЕСКОЕ

 

ПРОГРАММИРОВАНИЕ............................................................................................

56

6.1. Постановка задачи поиска оптимального управления...................................

56

6.2. Пояснения к получению принципа максимума..............................................

57

6.3. Динамическое программирование...................................................................

58

6.4. Примеры применения динамического программирования...........................

59

Контрольные вопросы.............................................................................................

63

ГЛАВА 7. АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ РЕГУЛЯТОРОВ (АКОР) ..

63

7.1. Постановка задачи............................................................................................

63

7.2. Решение задачи АКОР......................................................................................

64

7.3. Уравнение Риккати...........................................................................................

68

7.4. Общие свойства решения уравнения Риккати................................................

70

7.5. Способы решения уравнения Риккати............................................................

71

7.6. Пример решения задачи АКОР........................................................................

72

7.7. Метод диагонализации.....................................................................................

75

Контрольные вопросы.............................................................................................

77

ГЛАВА 8. СЛУЧАЙНЫЕ ПРОЦЕССЫ В СИСТЕМАХ УПРАВЛЕНИЯ...............

77

8.1. Описание случайных процессов......................................................................

77

4

8.2. Стохастические дифференциальные уравнения.............................................

80

8.3. Прогнозирование (оценивание) значений случайных величин с

 

использованием закона распределения..................................................................

81

8.4. Линейное оценивание значений случайных величин....................................

82

Контрольные вопросы.............................................................................................

83

ГЛАВА 9. ФИЛЬТР КАЛМАНА.................................................................................

84

9.1. Постановка задачи............................................................................................

84

9.2. Основные принципы получения формул дискретного фильтра Калмана....

84

9.3. Получение формул фильтра Калмана.............................................................

85

Контрольные вопросы.............................................................................................

87

СПИСОК ЛИТЕРАТУРЫ............................................................................................

88

5

ВВЕДЕНИЕ

Методы оптимизации широко используются в различных прикладных разделах теории управления. Это и выбор оптимальных управляющих воздействий, и построение разнообразных фильтров, и учет случайных возмущений на системы и т.д.

Однако, не смотря на многочисленные опубликованные монографии, в которых подробно рассматриваются определенные разделы теории управления, отсутствуют литературные источники, в которых были бы компактно собраны основные теоретические методы, применяемые для решения такого широкого круга вопросов. Кроме того, многие монографии изданы достаточно давно и либо отсутствуют, либо имеются в незначительных количествах в библиотечных фондах. Данное учебное пособие направлено на устранение этих недостатков.

ГЛАВА 1. ОПТИМИЗАЦИЯ СТАТИЧЕСКИХ ОБЪЕКТОВ

1.1. Понятие статических и динамических объектов

Объект, поведение которого описывается дифференциальными уравнениями, будем называть динамическим. Такие объекты обычно рассматриваются в теории автоматического управления. Примерами таких объектов могут служить электрические цепи, содержащие конденсаторы и индуктивности (например, колебательные контуры, двигатели, R-C цепи и т.д.). Полнота описания таких объектов зависит от конкретных постановок задач регулирования и управления.

Наряду с динамическими объектами имеются статические объекты. Простейшим таким объектом является делитель сопротивлений. Очень часто динамические объекты с целью упрощения решения задач относят к объектам статическим. Например, электронный усилитель, который входит в состав системы автоматического управления достаточно инерционными устройствами, может с достаточной степенью точности описываться коэффициентом усиления. Однако, если объект управления мало инерционен, то в том же усилителе приходится учитывать его динамические характеристики

6

(время нарастания фронта выходного импульса; паразитные связи, возникающие из-за малых паразитных емкостей и т.д.).

Статические объекты в общем случае описываются системами нелинейных уравнений (в простейших ситуациях – системами линейных уравнений), но эти уравнения не являются дифференциальными.

Динамические объекты, вообще говоря, описываются дифференциальными уравнениями. Но наиболее ощутимые практические результаты связаны, в основном, с использованием линейных дифференциальных уравнений.

1.2. Задача нелинейного программирования

Основные понятия нелинейного программирования можно най-

ти в [1].

Пусть x – элемент множества X и f (x) – функция, заданная

на множестве и принимающая вещественные значения. Задача состоит в том, чтобы среди элементов множества X , удовлетворяющих ограничениям:

gi (x) 0, hi (x) =0,(i =1, 2,..., n; j =1, 2,..., k) ,

(1.2.1)

найти такое x , чтобы для всех элементов x , удовлетворяющих условиям (1.1), значение f (x) было наименьшим, т.е. выполнялось

соотношение f (x) f (x) . Элемент x , удовлетворяющий ограни-

чениям (1.2.1), называется допустимым решением задачи математического программирования. Допустимое решение x называется оптимальным.

Здесь gi (x) и hi (x) – функции, определенные на множестве X

и также принимающие вещественные значения.

Ограничения (1.2.1) обычно записываются либо в виде неравенств, либо в виде равенств.

Элементы x множества X могут иметь самый разнообразный физический смысл.

7

Примеры

Пример 1.1. Рассмотрим школьную задачу (предлагается часто на вступительных экзаменах в вуз). Среди всех прямоугольников заданной площади S0 найти такой прямоугольник, у которого пе-

риметр P = 2(a +b) имеет наименьшее значение, где a,b – длины сторон прямоугольника.

X – множество всех прямоугольников, x – выбранный прямоугольник. Ограничений в виде неравенств нет. Имеется ограничение в виде равенства S(x) S0 = 0 . Длины сторон a,b прямоуголь-

ника однозначно связаны с выбранным прямоугольником x . По-

этому задачу можно сформулировать

так.

Имеется функция

P = f (a,b) = 2(a +b) двух переменных

a,b

(это составляющие

элементов x ). На переменные наложено ограничение ab S0 = 0 .

Найти такие a и b , чтобы значение f (a,b) в условиях действия

ограничения было наименьшим.

Пример 1.2 (заимствован из [1]). Найти наименьшее значение

функции

f (x , x ) = (x

3)2 +(x 2)2

при

условиях

 

1

2

1

2

 

 

x12 x2 3 0, x2 10, x1 0 .

Решение. Здесь X – множество точек плоскости, а также имеется три ограничения в виде неравенств:

g1 (x1, x2 ) 0,g2 (x1, x2 ) 0,g3 (x1, x2 ) 0,

где

g (x , x ) = x2 x 3,

1 1 2 1 2

g2 (x1 , x2 ) = x2 1,

g3 (x1 , x2 ) = −x1.

Ограничений в виде равенств нет. Решается эта задача просто из геометрических соображений с применением понятия линий уровня [1]. Линией уровня называется множество точек, удовлетво-

8

ряющих условию, f (x1, x2 ) =C , где C – константа. В многомерном случае рассматривается обобщение этого понятия – поверхность уровня, описание которой имеет вид f (x1 , x2 ,...xn ) =C .

Простое решение задачи нелинейного программирования встречается редко. Поэтому рассматриваются типовые классы задач, для которых разработаны эффективные методы решения. В остальных ситуациях приходится применять численные методы поиска оптимальных решений.

Замечания:

всякое ограничение, записанное в виде неравенства gi (x) 0 , может быть сведено к эквивалентному огра-

ничению gi (x) 0 , где gi (x) = −gi (x) ;

задача поиска наибольшего значения функции f (x) эк-

вивалентна задаче поиска наименьшего значения функции f (x) , где f (x) = − f (x) .

1.3.Задачи на условный экстремум, неопределенные множители Лагранжа

Метод множителей Лагранжа обычно применяется при решении задач отыскания экстремума соответствующего критерия оптимальности, когда на независимые переменные наложены ограничения в виде равенств. Пусть требуется найти экстремум функции

f (x1 , x2 ,...xn ) ,

(1.3.1)

зависящей от n переменных (i=1,2,..., n). Значения переменных xi в свою очередь связанны соотношениями

φk (x1, x2 ,...xn ) = 0, k =1,2,..., m .

(1.3.2)

Экстремум, который достигается функцией (1.3.1) с учетом выполнения соотношений (1.3.2), называется условным или связанным.

Число m соотношений (1.3.2) в изложенной постановке задачи должно быть меньше числа независимых переменных n. Если допустить равенство m = n , то в этом случае можно попытаться ре-

9

шить систему уравнений (1.3.2), поскольку число уравнений равно числу неизвестных. Полученное решение, если оно существует, определит дискретное множество точек (если эта система не имеет решения, то ограничения (1.3.2) определяют пустое множество). Поэтому решение задачи сведется к перебору допустимых точек (решений), удовлетворяющих соотношениям (1.3.2).

Если m < n , то в общем случае для решения задачи с такими ограничениями используется метод неопределенных множителей Лагранжа, сводящий задачу с ограничениями вида равенств к обычной экстремальной задаче без ограничений. Это делается следующим способом:

составляется вспомогательная функция n + m равно-

правных переменныхxi , λj ,(i =1, 2,...,n, j =, 2,..., m)

Ф(x1, x2 ,..., xn 1 2 ,..., λm ) = f (x1 , x2 ,...xn ) + λ1φ1 (x1, x2 ,...xn ) +... + +λmφm (x1, x2 ,...xn ),

(здесь λ1 ,..., λk – дополнительные переменные, называемые неопределенными множителями Лагранжа);

находится точка M с координатами x1 ,...xn 1 ,..., λk (или точки, если их много) безусловного экстремума функции Ф;

по найденной точке M определяется точка M , имеющая координаты x1 ,...xn (найденные значения λ1 ,..., λk

введенных переменных далее не рассматриваются); точка M является точкой условного экстремума функции f , если такой экстремум существует.

Решим Пример 1.1 из раздела 1.2, применяя метод неопределенных множителей Лагранжа.

Функция Ф в этом примере имеет вид Ф = 2(a +b) + λ(ab S0 ) .

Приравнивая частные производные от функции Ф по аргументам a,b, λ нулю, получим систему уравнений

2 + λb = 0,2 + λa = 0,

ab = S0 .

10