Вариационное исчисление / вариационное исчисление.doc
Уфимский государственный авиационный технический университет
ЭЛЕМЕНТЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ
И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Учебное пособие
Уфа 2003
I. Элементы вариационного исчисления
1.1. Введение и вспомогательные утверждения
Вспомним понятие экстремума числовой функции числового аргумента :
Точка — точка локального максимума (минимума), а значение локальный максимум (минимум), если для всех точек ,
| достаточно близких к , выполняется неравенство , т.е. существует окрестность , такая, что . |
При этом, если существует производная , то (необходимое условие локального экстремума). Если , то наличие или отсутствие локального экстремума проверяется с помощью достаточного признака локального экстремума.
В вариационном исчислении решают задачи на экстремум числовых функций функционального аргумента: у таких функций значениями функций тоже являются числа, но значениями аргумента является не числа, а функции. В отличие от функций векторного аргумента такие функции называют функционалами.
Пример. Среди всех гладких кривых, соединяющих точки
| и , найти ту, длина которой наименьшая (решение очевидное: ). Формализуем задачу. Обозначим множество всевозможных функций , непрерывно дифференцируемых на , т.е. гладких функций. |
Нужно среди функций , принимающих заданные значения , найти ту, для которой длина графика
(1)
наименьшая.
Формула (1) каждой функции ставит в соответствие определенное число длину кривой, так что имеем отображение . Это и есть пример функционала. Аргументом функционала является гладкая кривая , а значением функции — число . При значении аргумента функционал имеет минимум, равный .
Ввиду удобства геометрического языка аргумент функционала называют «точкой», так что функционал в примере имеет минимум в точке .
Для характеристики близости точек (т.е. близости функций) вводят понятия расстояния между функциями, окрестности точки (т.е. окрестности функции). Это позволяет рассматривать вопрос об экстремуме функционала.
Рассмотрим некоторые утверждения, используемые в дальнейшем.
1.1.1. Пример.
| Построим бесконечно дифференцируемую функцию, положительную на заданном интервале и равную нулю вне этого интервала. |
|
□ Покажем сначала, что функция бесконечно дифференцируема (т.е. имеет производные любого порядка) на . В точках это очевидно: если , то , если , то можно найти по правилам дифференцирования. При имеем
и т.д. Заметим, что производная любого порядка имеет вид
,
где некоторый многочлен от
и т.д.
В точке производные придется вычислять по определению производной:
(если пределы при слева и справа существуют и совпадают, то их общее значение и будет ).
Ищем
так как экспонента растет быстрее . Нашли .
Ищем
так как экспонента растет быстрее любого многочлена. Нашли .
Так можно найти при любом : если найдено, что , то
Нашли .
Итак, бесконечно дифференцируема во всех точках интервала .
Функции тоже бесконечно дифференцируемы во всех точках как сложные функции, составленные из бесконечно дифференцируемых звеньев (например, состоит из бесконечно дифференцируемых функций (как было показано) и ). Поэтому произведение бесконечно дифференцируемых функций
бесконечно дифференцируема на . Это и есть искомая функция. Она положительна на интервале , так как
| и равна нулю при . |
1.1.2. Лемма Лагранжа
Если функция непрерывна на отрезке и
(2)
при любой функции , бесконечно дифференцируемой на отрезке и обращающейся на его концах в нуль: то на отрезке .
□ Допустим, что имеется точка , в которой , например . Тогда по свойству сохранения знака непрерывной функцией, в некоторой окрестности точки будет найдется отрезок такой, что ( или могут совпадать с одним из концов отрезка ).
По условию леммы, для функции , построенной в примере 1.1 для этого отрезка, равенство (2) тоже выполняется, но, поскольку вне , то фактически .
| C другой стороны . Возьмем На этом отрезке функция непрерывна и отрицательна. |
По теореме Вейерштрасса она имеет в некоторой точке максимальное значение , которое, конечно, тоже отрицательно: поэтому Значение этого интеграла уменьшится, если добавим и , так что тем более
Таким образом, получим , что противоречит равенству . Следовательно, допущение неверно. ■
Следующую теорему сформулируем без доказательства.
1.1.3. Теорема Лейбница (о дифференцировании под знаком интеграла)
Если функция и её частная производная непрерывна в прямоугольнике , то .
1.2. Основные понятия
Как известно из линейной алгебры, линейным пространством называется множество (с элементами произвольной природы), если в этом множестве введены две линейные операции: операция сложения элементов , сопоставляющая им элемент этого же множества , называемый суммой и обозначаемый , и операция умножения элемента на число , сопоставляющая им элемент этого же множества , называемый произведением элемента на число и обозначаемый , причем эти линейные операции удовлетворяют 8-ми аксиомам:
Для любых элементов и любых чисел :
1) (переместительность сложения),
2) (сочетальность сложения),
3) существует элемент такой, что (существование нулевого элемента),
4) для каждого существует элемент, обозначаемый такой, что (существование противоположного элемента),
5) (поглощение единицы),
6) (сочетательность умножения на число),
7) (распределительность умножения на число относительно сложения чисел),
8) (распределительность умножения на число относительно сложения элементов).
Примером линейного пространства является мерное арифметическое пространство
1.2.1. Определение. Линейное пространство называется нормированным пространством, если каждому элементу поставлено в соответствие число норма этого элемента — так, что для любых и любого числа
1) (неотрицательность),
2) (однородность),
3) (неравенство треугольника).
Примером нормированного пространства является евклидово пространство , в котором нормой элемента является его модуль (так что ).
В нормированном пространстве можно ввести понятие расстояния между элементами.
1.2.2. Определение. Расстоянием между элементами x,y нормированного пространства L называется норма их разности: . В частности , так что норма элемента есть расстояние от этого элемента до нулевого элемента.
1.2.3. Теорема (о свойствах расстояния)
Число обладает свойствами:
1) (неотрицательность).
2) (симметричность),
3) (неравенство треугольника).
□ 1) (по определению 1.2.1)
(по определению 1.2.1).
2) (по определению 1.2.1) .
3) ( по определению 1.2.1) . ■
Мы будем иметь дело с множеством функций, непрерывных на отрезке , которое будем обозначать , и с множеством функций, раз непрерывно дифференцируемых на (т.е. имеющих непрерывные производные до го порядка включительно), которое будем обозначать . Если сложение функций и умножение функции на число понимать как обычно:
то при этих линейных операциях множества и являются линейными пространствами. Например, если , т.е. имеют непрерывные производные , то сумма , тоже непрерывно дифференцируема на , т.е. если то тоже непрерывно дифференцируема на , т.е. Легко проверить, что эти линейные операции удовлетворяют всем 8 аксиомам линейного пространства, так как при каждом фиксированном сложение функции и умножение функции на число сводится к сложению и умножению чисел, а для чисел все аксиомы выполняются. Нулевым элементом пространства является функция, тождественно равная нулю на Противоположным элементом для функции является функция .
Аналогично, тоже является линейным пространством.
Итак, и являются линейными пространствами с обычными правилами сложения функций и умножения функции на число.
Введем нормы элементов в этих пространствах, что позволит ввести понятие расстояния между элементами этих пространств (т.е. между функциями).
| Норма есть расстояние от функции до функции . В пространстве непрерывных функций естественно считать функцию близкой к функции (на всем отрезке |
!) если близко к нулю значение (такое максимальное значение при некотором существует в силу теоремы Вейерштрасса для функции, непрерывной на отрезке).
Поэтому положим .
1.2.4. Теорема (о норме )
Величина, определенная равенством , является нормой.
□ Проверим свойства нормы (1.2.1).
1) Очевидно, что , так что . Очевидно также, что .
2) При равенство очевидно, так как и . Пусть . Тогда
и, в частности, , т.е. . (1)
Обратно, по доказанному, для . (2)
Из неравенств (1) и (2) получаем .
3)
и, в частности, , т.е. .■
Таким образом, пространство с нормой является нормированным пространством. Расстоянием между точками и этого пространства является число — максимальное расстояние по вертикали между графиками функций и .
Элементы пространства непрерывно дифференцируемые, т.е. гладкие функции. Функция в каждой точке имеет невертикальную касательную с угловым коэффициентом , которая ввиду непрерывности непрерывно (без скачков) меняет свое положение при движении вдоль графика . Поэтому элементы этого пространства естественно считать близкими, если не только мало расстояние по вертикали между их графиками, но еще мало отличаются их касательные на всем , т.е. разность мала. Поэтому расстоянием следует считать число
( тоже существует, т.к. функция непрерывна на отрезке ). Следовательно, нормой элемента (т.е. расстоянием до ) следует считать число . Вообще, .
1.2.5. Замечание.
Очевидно, что .
1.2.6. Теорема (о норме )
Величина, определенная равенством , является нормой.
□ Докажем для (для доказательство аналогично).
Проверим свойства нормы (1.2.1) учитывая, что для они проверены.
1) Пусть , т.е. . Тогда хотя бы одно из чисел и больше нуля. Если , то по теореме 1.2.4 (1) . Если , то по той же теореме , т.е. . Таким образом, в любом случае .
Пусть обратно, . Тогда по теореме 1.2.4 (1) , значит, .
Доказано, что . Далее очевидно.
2) При равенство очевидно: и . Пусть . Тогда то по теореме 1.2.4 (2) , , а согласно замечанию 1.2.5 . Поэтому и . Значит, и
, т.е. . (3)
Обратно, по доказанному для . (4)
Из неравенств (3) и (4) получаем .
3) По теореме 1.2.4 (3) , , а согласно замечанию 1.2.5 и . Поэтому и , значит, , т.е.
. ■
Таким образом, пространство с нормой является нормированным пространством.
Расстоянием между точками является число
.
Замечание. Функции, близкие по норме пространства , могут сильно отличаться по норме пространства . Например, функции и обе принадлежат
| и пространству и пространству (при любых (возьмем )). По норме : |
. По норме .
Но , так что . С возрастанием функция становится сколь угодно близкой к функции по норме , т.к. , тогда как всегда отстоит от неё на расстояние по норме .
1.2.7. Определение. окрестностью точки пространства называется множество точек (т.е. функций) , удовлетворяющих неравенству
т.е. отстоящих от меньше чем на .
|
| в пространстве означает, что график функции находится между кривыми |
и . В пространстве этого недостаточно: надо ещё, чтобы изгибы кривой мало отличались от изгибов кривой .
1.2.8. Определение. Пусть множество каких — либо функций. Отображение , сопоставляющее каждой функции определенное число , называется функционалом, определенным на множестве функций .
Отображение , сопоставляющее каждому набору из функций (т.е. вектор — функции) определенное число ) называется функционалом, определенным на множестве наборов функций из (на множестве вектор — функций).
В п. 1.1 был рассмотрен пример функционала , определенного в пространстве . Еще примеры:
Пусть
Тогда
Пусть
Тогда
1.2.9. Определение. Говорят, что функционал
определенный на множестве допустимых вектор — функций с координатными функциями , имеет в точке локальный максимум (минимум), если для всех , достаточно близких к , выполняется неравенство
, т.е. существует такое, что
Для исследования функционала на экстремум введем понятие, аналогичное понятию производной числовой функции числовой переменной.
Пусть функционал определен на некотором множестве допустимых функций , и фиксированные допустимые функции. Рассмотрим числовую функцию числовой переменной (в предположении, что при любом функция остается допустимой функцией: ). Приращение аргумента и просто называют вариацией аргумента.
1.2.10. Определение. Если существует производная функции в точке , то она называется первой вариацией функционала в точке при данной вариации аргумента, и обозначается :
(заметим, что в числителе стоит приращение функционала в точке , вызванное приращением (вариацией) аргумента. При это приращение аргумента стремится к нулю: =| по определению 1.2.1|=, так как ).
Для функционала от функций (от мерной вектор — функции) производная функции в точке является первой вариацией функционала в точке по аргументу при данной вариации этого аргумента:
.
1.2.11. Теорема (необходимое условие локального экстремума функционала в терминах первой вариации).
Пусть функционал , определенный на множестве допустимых вектор—функций с координатами имеет в точке локальный экстремум. Если в этой точке функционал имеет первую вариацию по аргументу при какой-либо вариации этого аргумента, то эта первая вариация равна нулю:
.
□ Пусть, например точка минимума: существует такое, что
. Возьмем точку
. Для нее . При достаточно малом будет , так как , где . Поэтому имеем
,
т.е. , или .
Таким образом, при всех достаточно малых выполняется неравенство . Это означает, что функция
имеет минимум в точке . По условию, при данной вариации существует первая вариация по аргументу , т.е. существует . Но, по теореме Ферма, если в точке локального экстремума числовая функция числового аргумента имеет производную, то она равна нулю: .
Следовательно, . ■
Замечание. Если найдена вектор — функция в которой первые вариации функционала обращаются в нуль, то это ещё не значит, что в точке функционал действительно имеет экстремум: ведь это необходимое условие экстремума. Достаточные условия экстремума функционала сложны, их не будем рассматривать. Но если по смыслу задачи экстремум есть, а найдена только одна вектор — функция , в которой первые вариации обращаются в нуль (“критическая точка”), то в точке обязан быть экстремум.
В достаточных условиях экстремума используется понятие второй вариации функционала, которое мы не будем рассматривать. Поэтому в дальнейшем вместо “первая вариация” будем говорить просто “вариация”.
1.3. Вычисление вариации интегрального функционала.
Мы будем рассматривать экстремумы только интегральных функционалов, когда значения функционалов вычисляются с помощью определенного интеграла:
Подынтегральную функцию называют интегрантом функционала. Это сложная функция с промежуточными аргументами которые являются функциями от
Так как мы рассматриваем функции , то все функции непрерывны на . Будем предполагать в дальнейшем, что функция непрерывна при всех и любых . Тогда интегрант как сложная функция от непрерывна на и потому интеграл существует. Более того, будем предполагать, что функция имеет непрерывные частные производные нужных порядков по всем аргументам при и любых . Это обеспечит законность предстоящих вычислений.
Достаточно вычислить вариацию функционала от одной функции
(1)
(В п. 1.1 имели пример такого функционала с интегрантом ), так как вариация функционала от вектор-функции по аргументу вычисляется при фиксированных значениях остальных аргументов, т.е. как вариация функционала от одной функции .
1.3.1. Теорема (о вариации интегрального функционала)
Пусть - некоторое множество допустимых функций. Вариация функционала (1) в точке при любой допустимой вариации аргумента существует и равна
(2)
□ Докажем при (при доказательство аналогично). В этом случае . Как было отмечено выше, интеграл при существует. Надо найти , где
.
Имеем где . Ввиду непрерывности и непрерывности функций сложная функция непрерывна при и любых , т.е. в прямоугольнике (бесконечной длины) .
