Variatsionnoe_ischislenia
.pdfМинистерство общего и профессионального образования Российской Федерации
Уфимский государственный авиационный технический университет
РАМАЗАНОВ М. Д.
ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
учебное пособие
Уфа 2003
Оглавление
Предисловие |
|
3 |
||
I |
Бесконечномерный анализ |
4 |
||
I.1 |
Определения производных и дифференциалов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
4 |
||
|
|
I.1.1 |
Общие отображения f : B1 → B2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
4 |
|
|
I.1.2 |
Отображение f : B → R1 (или C) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
7 |
|
|
I.1.3 |
Понятие дифференциала . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
9 |
I.2 Определение интеграла отображения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
10 |
|||
|
|
I.2.1 |
Интеграл Бохнера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
10 |
|
|
I.2.2 |
Понятие об общем интеграле Лебега . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
11 |
I.3 |
Основные теоремы математического анализа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
11 |
||
|
|
I.3.1 |
Взаимосвязь различных определений производной . . . . . . . . . . . . . . . . . . . . . . . . |
11 |
|
|
I.3.2 |
Производная сложной функции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
13 |
|
|
I.3.3 |
Формула Тейлора с остаточным членом в интегральном виде . . . . . . . . . . . . . . . . . |
14 |
II Простейшая задача вариационного исчисления |
16 |
|||
II.1 |
Задача о брахистохроне . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
16 |
||
II.2 |
Уравнение Эйлера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
19 |
||
|
|
II.2.1 |
Вывод дифференциального уравнения Эйлера . . . . . . . . . . . . . . . . . . . . . . . . . . |
19 |
|
|
II.2.2 |
Вывод интегрального уравнения Эйлера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
20 |
|
|
II.2.3 |
Роль метрики области определения функционала . . . . . . . . . . . . . . . . . . . . . . . . |
21 |
II.3 |
Экстремаль с подвижными концами . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
21 |
||
|
|
II.3.1 |
Вывод уравнения Эйлера для функционалов на вектор-функциях . . . . . . . . . . . . . . |
21 |
|
|
II.3.2 |
Формула вариации функционала . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
22 |
|
|
II.3.3 |
Условия трансверсальности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
23 |
|
|
II.3.4 |
Условия на изломе экстремали . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
24 |
III |
Условный экстремум |
26 |
||
III.1 |
Функционал с одним интегральным ограничением. . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
26 |
||
|
|
III.1.1 |
Условный экстремум . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
26 |
|
|
III.1.2 |
Простейшая задача вариационного исчисления . . . . . . . . . . . . . . . . . . . . . . . . . . |
27 |
|
|
III.1.3 |
Задача Дидоны . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
28 |
III.2 |
Задача Лагранжа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
29 |
||
|
|
III.2.1 |
Формулировка теоремы по задаче поиска минимума функционала с несколькими ограни- |
|
|
|
|
чениями . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
29 |
|
|
III.2.2 |
Задача Лагранжа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
29 |
IV |
Функционалы на функциях нескольких переменных |
31 |
||
IV.1 |
Связь вариационных задач со спектральными. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
31 |
||
|
|
IV.1.1 |
Вывод уравнения Эйлера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
31 |
|
|
IV.1.2 |
Спектральные задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
31 |
|
|
IV.1.3 |
Задачи Дирихле и Неймана для оператора Лапласа . . . . . . . . . . . . . . . . . . . . . . . |
32 |
IV.2 |
Вариационный вывод уравнений малых колебаний стержня . . . . . . . . . . . . . . . . . . . . . . |
32 |
||
|
|
IV.2.1 |
Продольные колебания стержня . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
32 |
IV.3 |
Поперечные колебания тонкого стержня струны . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
34 |
||
IV.4 |
Поперечные колебания толстого стержня - балки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
35 |
2
V Необходимые и достаточные условия минимума функционала |
37 |
||
V.1 |
Общие условия локального минимума . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
37 |
|
|
V.1.1 |
Контрпримеры к необходимому условию . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
37 |
|
V.1.2 |
Общие теоремы о достаточных и необходимых условиях слабого минимума . . . . . . . . . |
37 |
V.2 |
Квадратичные функционалы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
38 |
|
|
V.2.1 |
Симметричность оператора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
38 |
|
V.2.2 |
Критерий слабого минимума квадратичного функционала . . . . . . . . . . . . . . . . . . . |
39 |
V.3 |
Необходимые условия минимума в простейшей вариационной задаче . . . . . . . . . . . . . . . . . |
40 |
|
|
V.3.1 |
Условие Лежандра . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
40 |
|
V.3.2 Условие Якоби . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
41 |
|
V.4 |
Достаточные условия минимума простейшей вариационной задачи . . . . . . . . . . . . . . . . . . |
42 |
|
|
V.4.1 |
Достаточное условие слабого локального минимума . . . . . . . . . . . . . . . . . . . . . . . |
42 |
|
V.4.2 Достаточное условие сильного минимума. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
43 |
|
|
V.4.3 Совпадение слабого и сильного минимума вариационной задачи в случае простейшего квад- |
|
|
|
|
ратичного функционала . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
47 |
VI |
Преобразование Лежандра |
49 |
||
VI.1 |
Общее определение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
49 |
||
VI.2 |
Алгебраическое определение преобразования... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
50 |
||
VI.3 |
Каноническая форма уравнения Эйлера . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
53 |
||
VI.4 |
Понятие о теореме Эммы Нётер . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
53 |
||
VI.5 |
Геометрическая интерпретация канонических уравнений . . . . . . . . . . . . . . . . . . . . . . . . |
54 |
||
|
|
VI.5.1 |
Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
54 |
|
|
VI.5.2 |
Вывод уравнения Гамильтона-Якоби . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
55 |
VII Принцип максимума Понтрягина |
58 |
|||
VII.1 Формулировка общей теоремы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
58 |
|||
|
|
VII.1.1 |
Задача с ограничениями на управление . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
58 |
|
|
VII.1.2 |
Примеры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
59 |
VII.2 Обоснование принципа максимума . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
61 |
|||
|
|
VII.2.1 |
Частный случай общей теоремы с одним закрепленным, другим свободным концами и без |
|
|
|
|
фазовых ограничений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
61 |
|
|
VII.2.2 |
Задача о синтезе управления . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
64 |
VIII Элементы теории динамического программирования |
66 |
|||
VIII.1Основные понятия динамического программирования . . . . . . . . . . . . . . . . . . . . . . . . . . |
66 |
|||
|
|
VIII.1.1 Вывод уравнения Беллмана . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
66 |
|
|
|
VIII.1.2 Об эквивалентности принципов Беллмана и Понтрягина . . . . . . . . . . . . . . . . . . . . |
67 |
|
|
|
VIII.1.3 Принцип оптимальности . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
67 |
|
VIII.2Дискретная задача оптимального управления . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
68 |
|||
IX |
Прямые методы вариационного исчисления |
69 |
||
IX.1 |
Метод Ритца . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
69 |
||
|
|
IX.1.1 |
Схема метода . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
69 |
|
|
IX.1.2 |
Сходимость метода Ритца . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
70 |
IX.2 |
Приближенные методы нахождения минимума... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
71 |
||
|
|
IX.2.1 |
Метод скорейшего спуска . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
71 |
|
|
IX.2.2 |
Метод Ньютона . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
73 |
X Геометрические проблемы вариационного исчисления |
74 |
|||
X.1 Уравнения минимальных поверхностей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
74 |
|||
|
|
X.1.1 |
Уравнение поверхности минимальной площади . . . . . . . . . . . . . . . . . . . . . . . . . . |
74 |
|
|
X.1.2 |
Минимальная поверхность вращения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
74 |
X.2 |
Геодезические . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
77 |
||
|
|
X.2.1 |
Вывод дифференциального уравнения геодезических . . . . . . . . . . . . . . . . . . . . . . |
77 |
|
|
X.2.2 |
Примеры геодезических простых поверхностей . . . . . . . . . . . . . . . . . . . . . . . . . . |
77 |
|
|
X.2.3 |
Задача о траектории движения по инерции материальной точки на поверхности . . . . . . |
78 |
X.3 Задача о глобальных геодезических . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
78 |
|||
|
|
X.3.1 |
Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
78 |
|
|
X.3.2 |
Пример подсчета числа геодезических на двумерной сфере . . . . . . . . . . . . . . . . . . . |
78 |
|
|
X.3.3 |
Числа Бетти . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . |
80 |
Предисловие
Вариационное исчисление изучает проблемы экстремумов функционалов. Это одна из классических ветвей математического анализа - первая задача решена в 1696 году, явилась фундаментом математического исследования задач естествознания. Достаточно сказать, что основной физический принцип "стационарного действия"формулируется в терминах функционала действия. В то же время в течение столетий это полигон возникновения новых математических понятий и теорий. Так, теория обобщенных функций возникла из вариационных постановок задач математической физики, а название современного большого раздела математики - "функциональный анализ"в первоначальной трактовке означает анализ функционалов - основного объекта вариационного исчисления. Ныне наиболее развитой частью вариационного исчисления является теория оптимального управления. Мы тоже уделяем много места оптимизационным задачам и темой этих лекций можно было бы назвать теорию оптимальных решений. Предлагаемый курс вариационного исчисления является компилятивным, то есть состоит лишь из материалов, опубликованных в уже известных учебниках и монографиях. Нашей целью является дать постановки основных теоретических проблем, пытаясь дойти до самых абстрактных понятий и, "приземляя"изложение разбором примеров и методов численной реализации решений. Наибольшее влияние оказали на нас работы: гектографированный курс Л. Тонелли, который находится в библиотеке ГПНТБ СО РАН (г. Новосибирск), учебное пособие А.М.Галеева Курс лекций по вариационному исчислению и оптимальному управлению, М.,МГУ, 1996г., учебник И.М.Гельфанда и С.В.Фомина Вариационное исчисление, М., Физматгиз,1961г., монография Л.Янга Вариационное исчисление и оптимальное управление, М., Мир,1974г.
4
Глава I
Бесконечномерный математический анализ
I.1 Определения производных и дифференциалов
I.1.1 Производная отображения банахова пространства в банахово
Банаховым1) пространством B мы называем полное линейное нормированное пространство, то есть пару (B, k·k),
состоящую из линейного пространства и нормы. Линейное пространство это множество элементов, снабженное операциями сложения и умножения на элементы некоторого поля, например, поля вещественных или комплексных чисел. Любое линейное нормированное пространство можно пополнить, то есть задать такое полное линейное нормированное пространство, что некоторое плотное в нем подмножество будет изоморфно и изометрично первоначальному линейному пространству. Такое пополнение определяется однозначно с точностью до изоморфизма. Например, так пополняется линейное пространство рациональных чисел до полного линейного пространства всех действительных чисел. Примерами банаховых пространств могут служить (с обычными операциями и традиционными нормами): множество действительных чисел R : kxk = |x|; множество ком-
n |
; множество |
плексных чисел C : kxk = |x|; множество n мерных вещественных векторов Rn : kxk = sj=1 xj2 |
|
P |
|
определенных на отрезке [a, b] функций с конечной заданной нормой, например, множество непрерывных функ-
ций |
C[a, b] |
|
|
|
|
|
|
max |
| |
f (x) ; множество функций, определенных в области Ω |
|
Rn, c конечной |
||||||||
|
с нормой kf k = x [a,b] |
| |
|
|
|
|
|
|
|
|||||||||||
нормой kf k = |
r |
Ω dx |f (x)|2 |
|
обозначается L2(Ω); пространство Cm(Ω)¯ функций, определенных на некото- |
||||||||||||||||
|
|
|
|
|
R |
¯ |
|
Rn |
|
|
max |
α |
f (x)|, где 0 |
6 |
α1 |
+ . . . + αn ≡ |α|, |
||||
ром замкнутом множестве Ω |
|
|
с конечной нормой kf k = x Ω¯ ,|α|6m |D |
|
|
|||||||||||||||
Dαf (x) = D |
α |
. . . Dαn f (x) = |
∂α1+...+αn f (x) |
. Частным случаем банаховых пространств являются гильбертовы2) |
||||||||||||||||
1 |
|
α1 |
|
αn |
||||||||||||||||
|
|
|
1 |
|
|
n |
∂x1 |
...∂xn |
|
дополнительная операция, называемая скалярным произведением |
||||||||||
пространства (H, k·k), на которых определена |
H × H → C. Скалярное произведение элементов f и g мы обозначаем hf, gi. Эта операция обладает свойствами
f, g |
i |
= |
g, f |
, |
α f |
|
+ α f2, g |
i |
= α |
f |
, g |
i |
+ α |
|
f |
, g |
i |
для любых комплексных чисел α , α |
и связана с нормой |
|||||||||||||||||||||
h |
|
|
h |
i h |
1 |
1 |
2 |
2 |
. |
|
|
1h |
1 |
|
|
|
2h |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
||||||||
соотношением hf, f i = kf k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
Задача 1. R, C, Rn,L2(Ω) гильбертовы пространства. |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
Рассмотрим произвольное отображение f , действующее из банахова пространства B1 в банахово простран- |
||||||||||||||||||||||||||||||||||||||
ство B2, с областью определения Df B1 и областью значения Rf B2. |
|
|||||||||||||||||||||||||||||||||||||||
|
h |
Как известно, отображение f называется непрерывным в точке x Df , если kf (x + h) − f (x)kB2 = o(1) при |
||||||||||||||||||||||||||||||||||||||
k |
kB1 |
→ 0 для всех h с условием |
x+h |
Df . Это |
определение совпадает с обычным определением непрерывности |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
1 |
|
|
|
1 |
|
|
|
1 |
) и является его естественным обобщени- |
|||||||||||||||||||||||
вещественной функции одной переменной (B |
1 |
= B2 = R |
|
, f : |
R |
|
→ |
R |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
R1 |
→ |
R1 |
|
|
|
быть напрямую обобщено на произвольные |
|||||||||||
ем. А вот определение производной функции f : |
|
|
|
|
|
не может |
|
f |
|
|||||||||||||||||||||||||||||||
банаховы пространства B1, так как теряет смысл операция деления |
|
|
для произвольных элементов x B1. |
|||||||||||||||||||||||||||||||||||||
x |
||||||||||||||||||||||||||||||||||||||||
Поэтому за основу обобщения берем известную теорему о конечном приращении: |
|
|||||||||||||||||||||||||||||||||||||||
|
|
для f : |
R1 → R1 в точке x существует производная |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Df (x) = lim |
f (x + h) − f (x) |
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
h→0 |
|
|
|
|
h |
|
|
|
|
|
|
|
|
1)Banach S. ( Банах Стефан, 1892-1945) польский математик, один из создателей бесконечномерного анализа.
2)Hilbert D.(Гильберт Давид, 1862 - 1943) немецкий математик, на втором международном ъезде математиков в 1900г. поставил знаменитые "Проблемы Гильберта в вариационном исчислении известны Гильберта инвариантный интеграл и теорема существования абсолютного экстремума.
5
тогда и только тогда, когда существует такое число A(x), с которым для любых h имеем f (x + h) − f (x) =
A(x) · h + o(|h|) при |h| → 0, и тогда A(x) ≡ Df (x).
Определение 1. Если для f : B1 → B2 c Df = Ω B1 в точке x int Ω выполняется формула конечных
приращений
f (x + h) = f (x) + A(x) · h + o(khkB1 )
при khkB1 → 0 с некоторым линейным непрерывным оператором A(x) (A(x) L(B1, B2)), то A(x) называется сильной производной отображения f в точке x, или производной Фреше3) функции f в точке x, обозначается
A(x) ≡ Df (x) ≡ F Df (x).
С использованием понятия производной Фреше на отображения банаховых пространств естественным образом обобщаются основные свойства производной функции одной вещественной переменной. Например, справедлива
Теорема 1. Если существует Df (ˆx), то f непрерывна в точке xˆ.
Задача 2. Доказать самостоятельно теорему 1.
Для функций f : Rn → R1 известно определение производной по направлению: обозначая eh = h/khk,
полагаем |
|
|
|
|
|
|
|
|
|
|
|
|
f (x + th) − f (x) |
|
|
|
|
||||||||||||
|
|
|
D |
|
f (x) |
· |
h |
|
lim |
|
, |
|
|
||||||||||||||||
|
|
|
|
eh |
|
|
|
≡ t→+0 |
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
|
|||||
если этот предел существует. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Например, для f (x) = kxk = p |
hx, xi |
и любого h |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
D |
|
|
f (0) |
· |
h = |
|
lim |
kthk |
= |
k |
h |
k |
= |
|
e |
, h |
i ≡ |
eT h.4) |
|||||||||||
|
eh |
|
|
t→+0 |
t |
|
|
|
h h |
|
|
h |
|
|
|||||||||||||||
Если же x 6= 0, то |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
lim |
kx + thk − kxk |
|
= |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
Deh f (x) · h ≡ t→+0 |
|
|
|
|
|
t |
|
|
|
|
|
|
|
|||||||||||||
|
|
lim |
kx + thk2 − kxk2 |
|
= |
hx, hi |
|
≡ |
1 |
|
· |
|
xT |
· |
h. |
||||||||||||||
|
|
|
|
|
kxk |
|
|||||||||||||||||||||||
= t→+0 t [kx + thk + kxk] |
|
|
|
|
kxk |
|
|
|
|
Это определение имеет естественное обобщение на отображения банаховых пространств.
Определение 2. Если для f : B1 → B2 c Df = Ω B1 в точке x int Ω для любого h B1 существует предел
lim |
f (x + th) − f (x) |
= B(x) |
· |
h |
||||||||
t→+0 |
|
t |
|
|
|
|
|
|
|
|
||
с некоторым линейным непрерывным оператором B(x) |
|
L(B |
1 |
, B |
2 |
), то B(x) называется слабой производной |
||||||
отображения f в точке x, или производной Гато |
5) |
|
|
|
|
|
|
|
||||
|
функции f в точке x, обозначается |
B(x) ≡ Df (x) ≡ GDf (x).
Впредыдущем примере у функции kxk производная Гато существует при любом x 6= 0 и не существует при x = 0 (нет линейности по h).
Легко доказывается
Теорема 2. Если существует F Df (ˆx), то существует GDf (ˆx) и GDf (ˆx) = F Df (ˆx).
Задача 3. Доказать самостоятельно теорему 2.
Для f : R1 → R1 определения производной Гато и Фреше совпадают. В общем случае из существования
производной Гато не следует существование производной Фреше.
Пример 1. Зададим отображение f : R2 → R1 правилом
f (x) = |
1 |
при x2 = x2, x1 > 0, |
0 |
в остальных1точках. |
3)Frechet M. (Фреше Морис Рене, 1878 - 1973) французский математик, предложил это определение в 1911-1912 г.г.
4)eT означает транспонирование матрицы e. В данном случае вектор e есть вектор-столбец, а eT вектор-строка.
5)Gateaux R. (Гато Р. , 1890-1914) французский математик, предложил это определение в 1913 году.
Рис. I.1:
Рис. I.2:
Cм. рис. I. 1. В точке xˆ = 0 производная Фреше не существует функция f разрывна в нуле. Производная
Гато в нуле существует и равна нулю.
Исторически известны (и употребляются до сих пор) и более слабые понятия, характеризующие локальную линейную аппроксимацию отображения.
Определение 3. Производная в точке x по направлению h для f : B1 → B2 есть отображение h → Bf (x, h),
B f (x, h) |
lim |
f (x + th) − f (x) |
. |
|
≡ t→+0 |
t |
В отличие от определения производной Гато не требуется линейности отображения h → B f (x, h).
Определение 4. Если производная по направлению существует для всех h B1 и является нечетной функцией от h, то есть
B f (x, −h) = −B f (x, h),
то отображение h → B f (x, h) ≡ δf (x, h) называется вариацией по Лагранжу6).
Это понятие употребляется обычно для функционалов, то есть отображений f : B1 → R1.
Очевидно, самым слабым понятием является производная по направлению.
Пример 2. Непрерывная функция не имеет в точке xˆ производной ни по одному направлению.
f : R1 |
→ |
R1 |
, |
f (x) = |
x sin x1 |
при |
x 6= 0, |
|
|
|
|
0 |
при |
x = 0. |
xˆ = 0 (см. рис. I. 2).
Пример 3. Непрерывная функция имеет в точке xˆ производные по всем направлениям, но не имеет вариации
по Лагранжу
f : R1 → R1, f (x) = |x|.
xˆ = 0 (см. рис. I. 3).
6) Lagrange J.(Лагранж Жозеф Луи, 1736 - 1813) французский математик и механик, один из основателей вариационного
исчисления.
Рис. I.3:
Рис. I.4:
Рис. I.5:
Пример 4. Oтображение имеет в точке xˆ вариацию по Лагранжу, непрерывно в этой точке, но не имеет
производной Гато
f : R |
2 |
→ R |
1 |
, |
x = |
x1 |
= (r, ϕ), |
f (x) = r cos 3 ϕ |
|
|
x2 |
||||||
в полярных координатах. Здесь вариация по Лагранжу не является линейным оператором по h. |
||||||||
xˆ = 0 (см. рис. I. 4). |
|
|
|
|
|
|
|
|
Дадим еще одно полезное усиление понятия производной |
|
Определение 5. Пусть отображение f : B1 → B2 дифференцируемо по Фреше в точке xˆ и, кроме того, ε > 0
δ > 0 : x1, x2
(||x1 − xˆ||B1 < δ, ||x2 − xˆ||B1 < δ)
||f (x1) − f (x2) − Df (ˆx)(x1 − x2)||B2 6 ε||x1 − x2||B1 .
Тогда оно называется строго дифференцируемым по Фреше в точке xˆ и производная обозначается SDf (ˆx).
Теорема 3. Если существует SDf (ˆx), то функция f непрерывна в некоторой окрестности точки xˆ.
Задача 4. Доказать самостоятельно теорему 3.
Пример 5. Функция дифференцируема по Фреше, но не строго. Возьмем f : R1 → R1 (см. рис. I. 5)
2, |
для рациональных x, |
f (x) = x0, |
для иррациональных x. |
Производная Фреше в точке xˆ = 0 существует и равна нулю. Но в любой окрестности нуля функция разрывна, а ведь строгая дифференцируемость в точке xˆ влечет непрерывность функции в некоторой окрестности точки xˆ.
I.1.2 Производная функционала
Множество линейных непрерывных функционалов, заданных на банаховом пространстве B, снабженных обычной операторной нормой klk = sup |(l, u)|, образует новое банахово пространство. Оно обозначается B и
kukB 61
называется пространством, сопряженным к B. Например, для банахова пространства Lp[a, b] = {f | f : R1 → R1,
b
( dx|f (x)|p )1/p ≡ kf kp < ∞} при p (1, ∞) сопряженное пространство (с точностью до изометрического изо- |
||||
R |
′ |
′ |
1 |
1′ |
a |
|
|
|
|
морфизма) есть Lp [a, b] с p , удовлетворяющим условию p + p = 1. Для пространства L1[a, b] сопряженным
является L∞[a, b] = {f | f : R |
1 |
1 |
, ess |
sup f (x) |
| ≡ k |
f |
k∞ < ∞}. |
|
→ R |
x | |
|
В случае гильбертова пространства B оказывается изометрически изоморфным B, B = B .
Задача 5. L2[a, b] = L2[a, b].
При любом банаховом пространстве B на сопряженном пространстве B снова можно рассмотреть пространство линейных непрерывных функционалов сопряженное к B пространство B . Известно, что B изометрически изоморфно некоторому подпространству в B . Но часто (для обычно употребляемых пространств) оказывается, что B изометрически изоморфно всему B . Пространства, обладающие свойством B = B , на-
зываются рефлексивными.
Задача 6. Пространства Lp[a, b] при p (1, ∞) рефлексивные. Пространство L1[a, b] не является рефлексивным.
Для отображений f : B → R производная Df (x) является элементом B , то есть линейным непрерывным
функционалом.
В гильбертовых пространствах, как известно, определена специальная функция двух переменных скалярное произведение, и любой линейный функционал l : x → (l, x) может быть записан в виде скалярного произведения с помощью некоторого однозначно определенного этим функционалом y элемента (l : x → hy, x¯i) по теореме об общем виде линейного функционала. Поэтому для функционала f , определенного на гильбертовом пространстве H (f : H → R), мы получаем такую формулу конечных приращений
¯
f (x + h) = f (x) + hDf (x), hi + o(khkH ) ≡ f (x) + hh, Df (x)i + o(khkH )
с обычным отождествлением этого элемента y с самим линейным функционалом Df (x). Кстати, Df (x) H ≡ H, поэтому можно считать, что Df : x → Df (x) действует из H в H.
От первой производной можно взять следующую. Пусть вторая производная по Фреше существует и непрерывна в некоторой окрестности точки xˆ. По теореме 2 ее можно вычислять как вторую производную Гато
|
d |
|
d |
|
|
D2f (x) (h1, h2) ≡ dt2 |
t2=0 |
dt1 |
t1 =0 f (x + t1h1 |
+ t2h2) = |
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
|
d |
t2=0 Df (x + t2h2) · h1 = |
|
|
|
|
|
|
|
|
||||
|
dt2 |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
d |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
h1 |
, Df (x + t2h2) = h1 |
, D2f (x)h2 |
|
= h1 |
, h2 |
, D2f (x) |
||||||
|
= |
|
i |
||||||||||||
|
|
dt2 t2 =0 h |
|
|
i h |
|
|
h |
|
h |
ii |
Если функция ϕ : (t1, t2) → f (x + t1h1 + t2h2) является дважды непрерывно дифференцируемой в окрестности
нуля.
Задача 7. Это можно вывести из непрерывности F D2f (x)в окрестности точки xˆ то порядки вычисления производных по t1 и t2 можно переставить и
D2f (x) (h1, h2) = |
d |
|
d |
|
|
dt1 |
t1 =0 |
dt2 |
t2=0 |
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
= hh2, hh1, D2f (x)ii = D2f (x) (h2, h1) .
таким образом, в этом случае справедлива
Теорема 4. Билинейный функционал D2f (x) : H × H → R является симметричным относительно своих аргументов.
Пример 6. Возьмем f : Rn → R. Здесь Rn является гильбертовым пространством. Если f C2, то
f (x + h) = f (x) + (Df (x))T · h + 12 D2f (x)(h, h) + o(khk2).
Как известно, Df (x) вектор-столбец первых производных (он называется градиентом функции f ), D2f (x) =
|
∂2 f |
n |
|
|
|
j,k=1 |
является симметричной матрицей n × n. |
||
∂xj ∂xk |
Задача 8. Доказать симметричность D2f (x)(h1, h2) относительно аргументов h1, h2 в случае общего отображения f : B1 → B2.
I.1.3 Понятие дифференциала
Мы говорим "дифференцируемая функция "функция, имеющая производную". По-английски это: "differentiable function "derivative function". Какова взаимосвязь этих понятий?
Ранее мы уже определили производную отображения f : B1 → B2 как оператор Df (x) L(B1, B2). В строгой
("педантичной") математической терминологии дифференциалом функции называется значение этого линейного оператора на заданном приращении аргумента Df (x) ·h, и теорема о конечном приращении есть теорема о дифференциале: "приращение функции равно ее дифференциалу с точностью до o(khkB1 )". Таким образом, су-
ществование, вид и свойства дифференциала взаимнооднозначно соответствуют существованию, виду, свойствам производной эти понятия эквивалентны. Поэтому часто их отождествляют и для них применяют одинаковые обозначения см. "Математическую энциклопедию". Например, для f : R1 → R1, строго говоря, дифференциал df (x) ≡ f ′(x)dx (dx есть обозначение h с дополнительным предположением khk → 0), а теперь повсеместно cаму производную обозначают f ′(x) ≡ Df (x). Происхождение этой путаницы в истории возникновения и становления математического анализа в XVII - XIX веках. Как известно, основоположники анализа Лейбниц7) и Ньютон8) создали его почти одновременно и независимо друг от друга. Так получилось, что из эквивалент-
ных понятий производной и дифференциала Ньютон взял за основу производную, а Лейбниц дифференциал.
Поэтому, например, в идущем от Лейбница обозначении f ′(x) = df (x) в принципе предусмотрена возможность
dx
деления на dx, но сейчас считается, что дробь df (x) неразделима математически, то есть является символи-
dx
кой такого же типа, что и R dx. Канонизация строгой логической схемы, произведенная Коши9), положив в
основу понятие производной, направила математический анализ по пути Ньютона. Путь же Лейбница оказался основным в дифференциальной геометрии. Путаница может происходить, когда мы стремимся опереться на обе логические схемы одновременно. Приведем в качестве примера прояснения возникающей смуты правильное обоснование классического метода решения обыкновенных дифференциальных уравнений с разделяющимися переменными.
Пример 7. Требуется найти общее решение уравнения
y′(x) = f (x)g(y).
"Учебник"(см., например, Понтрягин Л. С.10) "Обыкновенные дифференциальные уравнения") дает: если g(y) =6 0, то
|
dy |
1 |
|
|
(I.1) |
||||
|
|
|
· |
|
|
= f (x) |
|||
|
dx |
g(y) |
|||||||
Далее |
|
dy |
|
|
|
|
|
||
|
|
= f (x)dx |
(I.2) |
||||||
|
|
g(y) |
|||||||
|
|
|
|
|
|
||||
и |
|
dy |
|
|
|
|
|||
Z |
|
= Z |
f (x)dx |
(I.3) |
|||||
|
|
|
|||||||
|
g(y) |
"Наведем"критику: с современной точки зрения (по Коши) переходы (I.1) → (I.2) и (I.2) → (I.3) бесмысленны.
Дадим строгий вывод формулы общего решения, не обращаясь к понятию дифференциала.
Пусть y = y(x) решение уравнения. Подстановка этого решения обращает уравнение в тождество:
y′(x) ≡ f (x) · g(y(x)) |
или |
y′(x) |
≡ f (x). |
g(y(x)) |
x
Возьмем от обех частей тождества определенный интеграл с переменным верхним пределом R dξ, предполагая,
|
|
|
|
|
|
x |
a |
x |
|
|
|
|
|
|
|
y′(ξ) |
|||
что g(y(x)) не обращается в нуль на участке интегрирования. Получается тождество a dξ |
|
|
≡ a dξf (ξ). |
||||||
g(y(ξ)) |
|||||||||
Используем решение y = |
y(x) для замены переменных в интеграле по формуле |
|
иR придем к |
тождеству |
|||||
|
|
|
|
t = y(ξ) |
R |
||||
|
y(x) |
dt |
x |
|
|
|
|
|
|
|
Z |
≡ Z |
dξf (ξ) |
|
|
|
|
(I.4) |
|
|
|
|
|
|
|
||||
|
g(t) |
|
|
|
|
||||
|
y(a) |
|
a |
|
|
|
|
|
|
7)Leibnitz G. (Лейбниц Готфрид Вильгельм, 1646 - 1716) немецкий математик, физик и философ, заложил основы символической логики, ввел понятие определителя, одновременно с Ньютоном, но независимо от него, завершил создание дифференциального
иинтегрального исчисления, опубликовал первое в мире печатное произведение, посвященное дифференциальному исчислению "Nova metodus pro maximis et minimis(1684)"
8)Newton I. (Ньютон Исаак, 1643 - 1727) английский математик, физик, механик, астроном, в частности, ему принадлежит метод численного решения алгебраических уравнений (метод Ньютона).
9)Cauchy A.L.(Коши Огюст, 1789 - 1857) французский математик, создал употребляемую сейчас строгую логическую систему математического анализа.
10)Понтрягин Лев Семенович (1908 - 1988) русский математик, создатель одного из основных современных методов решения оптимизационных задач "принципа максимума".