Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Rozova_Maximova

.pdf
Скачиваний:
153
Добавлен:
15.04.2015
Размер:
714.37 Кб
Скачать

Обозначим первое слагаемое в приращении за L( x )[h] (это слагаемое линейно по h), а второе – за r( x ,h).

Для доказательства дифференцируемости нужно оценить остаток:

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2f h2 + 2

 

2

f

 

 

 

 

 

 

 

 

2

2f h2

 

 

 

r(x, h)

 

1

 

 

 

 

 

 

 

 

 

 

 

hh

+

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 a

 

 

 

x

 

 

 

 

 

 

 

 

xx

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

2f

 

 

 

 

 

 

 

 

2

f

 

 

 

 

 

 

 

 

 

 

2

2f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[

 

 

h2

 

+ 2

 

 

hh

+

 

 

 

 

h2

]dt

 

 

 

 

 

 

 

 

 

xx

 

 

 

 

 

 

 

2 a

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

2f

 

 

 

 

 

2

f

 

 

 

 

 

 

 

2

2f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c21 .

 

 

[

 

 

 

 

 

+ 2

 

 

 

 

+

 

 

 

 

 

]dt

 

 

 

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

xx

 

 

 

x

 

 

 

 

 

 

2 a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В силу условий на функцию f(t,x, x ) имеем:

 

r(x.h)

 

1 b K1dt

 

 

 

h

 

 

 

2 K

 

 

 

h

 

 

 

2 = K

 

 

 

h

 

 

 

 

 

 

 

h

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выбираем любое ε>0, так, чтобы K h < ε .

Тогда h < Kε = δ (ε ) .

Имеем r(x, h) < ε h, h < δ (ε ) , что и доказывает дифференцируемость по Фреше в C1[a,b] функционала F(x).

11

3.Принцип Ферма

исопутствующие утверждения

Лемма Ферма. Пусть функционал F(x): XR диффе-

ренцируем по

Фреше

в

точке x X. Тогда функция

ϕ h (t) = F(x + th) ,

h X,

t R

дифференцируема при t=0 и

ϕ (0) = F (x)[h] .

 

 

 

h

 

 

 

Док-во.

Рассмотрим производную функции ϕh (t) в нуле:

ϕ

(0) = lim

ϕ h (t) ϕ h (0)

= lim

F(x + th) F(x)

 

 

h

t0

t

t0

t

 

= lim

L(x)[th] + r(x, th)

= lim[L(x)[h] +

r(x, th)

]

t

t

t0

t0

 

 

 

 

= L(x)[h] + lim

r(x, th)

.

 

 

 

 

 

 

t 0

t

 

=

=

 

r(x,th)

 

<

ε

 

 

 

th

 

 

 

 

при

 

 

 

th

 

 

 

< δ (ε , x) (в силу дифференци-

Но

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

руемости F(x) по Фреше).

 

r(x,th)

 

<

ε

 

t

 

 

 

 

 

 

h

 

 

 

 

= ε

 

 

 

h

 

 

 

, т.е.

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

r(x, th)

= 0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t0

 

 

 

 

t

И таким образом, ϕ (0)

= L(x)[h] = F (x)[h].

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

Что и требовалось доказать.

Замечание. Лемма остается верной и в случае дифференцируемости функционала F(x) по Лагранжу или Гато.

12

Упражнение 1. Доказать лемму Ферма для случаев дифференцируемости функционала F(x) по Лагранжу и Гато.

Опр.1. Функционал F(x): XR имеет в точке x0 X локальный экстремум, если существует δ>0 такое, что приращение F(x0) =F(x0+h) F(x0) не меняет знак при h < δ .

Причем, если F(x0)≥0, то экстремум называется минимумом, а если F(x0) 0, то – максимумом.

Принцип Ферма. Пусть функционал F(x) в точке x X дифференцируем (одним из трех способов) и имеет в этой точке экстремум. Тогда F (x)[h] = 0 h X.

Док-во. Рассмотрим функцию ϕ h (t) = F(x + th) .

Поскольку F(x) имеет в точке x экстремум, то

 

F(x)=F(x+th)-

F(x) ≥0 (или 0) при

 

 

 

th

 

 

 

< δ , тогда

 

 

 

 

 

 

 

δ

 

not

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ϕ h (t) ϕ h (0)

 

0 (или 0) при

 

t

 

<

 

 

 

h

=

δ1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для любого фиксированного h.

Таким образом, по определению функция ϕ h (t) имеет

в точке ноль экстремум и ϕ

(0)

= 0

(по известному факту из

h

 

 

 

математического анализа).

 

 

 

Тогда по лемме Ферма ϕ (0) = F (x)[h] , и, следова-

h

тельно, F (x)[h] = 0 для любого h. Что и требовалось доказать.

13

4. Экстремумы дифференцируемых функционалов

Напомним, что функционал F(x): XR имеет в точке x0 X локальный экстремум, если существует δ>0 такое, что

приращение F(x0)=F(x0+h)F(x0)

не меняет знак при

 

h

 

 

 

< δ .

 

 

 

 

 

Замечание. Для дифференцируемости второго порядка, в отличие от первого, условие разложимости приращения

F в виде

F = L(x)[h] + 12 B(x)[h, h] + r1 (x, h)

с оценкой остатка

ε>0 δ>0: r1 (x, h) < ε h 2

не является определением дважды дифференцируемого функционала. (Здесь B(x)[h,h] - билинейный функционал, т.е. линейный по каждому аргументу при фиксированном другом.)

Вспомним теорему о необходимом и достаточном условии минимума для функции одного переменного.

Теорема. Пусть функция f(t) дважды дифференцируема в точке t0.

Необходимое условие экстремума: если в точке t0 функция достигает локального минимума, то

f (t0 ) = 0, f ′′(t0 ) 0 .

Достаточное условие экстремума: если f (t0 ) = 0, f ′′(t0 ) > 0 ,

то t0 –точка локального минимума функции.

14

Сформулируем аналогичную теорему для функционалов.

Теорема (необходимое и достаточное условие минимума дважды дифференцируемого функционала).

Пусть функционал F(x) дважды дифференцируем по Фреше в точке x. Необходимое условие экстремума: если точка x – точка локального минимума функционала F(x), то

Fф(x)[h] = 0, Fф′′(x)[h, h] 0, h X .

Достаточное условие экстремума: если

Fф(x)[h] = 0, Fф′′(x)[h, h] ch 2 , h X

при некотором c>0, то x – точка локального минимума функционала F(x).

Замечание. Таким образом, для функционалов требуется значительно более сильное достаточное условие, нежели для функции, – вторая производная должна быть отделена от нуля в соответствии с приведенной оценкой.

Док-во. Необходимость

Если функционал F(x) достигает минимума, то по

принципу Ферма Fф(x)[h] = 0, h X .

Тогда

приращение

функционала примет вид

 

 

 

 

 

 

 

 

 

F = 1 B(x)[h, h] + r (x, h) .

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r1 (x, h)

 

Пусть r (x, h) = θ (x, h) ε

 

 

 

h

 

 

 

2

, т.е.

θ (x, h)

=

и

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

ε

 

h

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

θ (x, h) < 1.

Учитывая такое представление остатка, по определению минимума выпишем условие знакопостоянства приращения:

F = 12 B(x)[h, h] + θ (x, h)ε h 2 0 при h < δ (ε , x) .

15

Выберем произвольное h X и зафиксируем его. Рассмотрим направление th, t R:

F = 12 B(x)[th,th] + θ (x,th)ε th 2 =

=

t 2

B(x)[h, h] + θ (x,th)εt 2

 

 

 

 

 

 

 

h

 

 

 

2 =

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= t 2 (

1

B(x)[h, h] + θ (x,th)ε

 

 

 

h

 

 

 

2 ) 0 .

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как θ (x,th) ограничена, h 2 0 , а ε – произвольно. Та-

ким образом, варьируя ε, мы всегда можем добиться того, чтобы знак приращения F определялся знаком первого сла-

гаемого 12 B(x)[h, h], следовательно, h X ,

F ′′(x)[h, h] = B(x)[h, h] 0 .

Достаточность

Запишем приращение в следующем виде:

F =

1

B(x)[h, h] + θ (x, h)ε

 

 

 

h

 

 

 

2 ,

 

 

 

 

h

 

 

 

< δ , h X .

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используем имеющуюся оценку второй производной:

F

c

 

 

h

 

 

 

2 + θ (x, h)ε

 

 

 

h

 

 

 

2 =

 

 

 

h

 

 

 

2 (

c

+ θ (x, h)ε ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

c

 

 

θ (x, h)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Учитывая, что

 

 

> 0,

 

 

< 1, а величина ε в нашей вла-

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

сти, можно утверждать, что h X знак приращения определяется первым слагаемым 2c .

То есть h X ε>0: F≥0, т.е. функционал F(x) достигает минимума. Что и требовалось доказать.

16

Покажем на примере, что совокупность ограничений

Fф(x0 )[h] = 0, Fф′′(x0 )[h, h] > 0

не является достаточным условием экстремума дважды дифференцируемого функционала.

Пример.

Рассмотрим функционал F(x): XR.

F(x)= 1

 

x2 (t)(t x(t))dt, x(t) C[0;1], x0(t)0.

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В точке x0(t)0

выполнены условия

F

(x0 ) =

′′

> 0,

 

0, F (x0 )

но экстремума в этой точке нет.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Действительно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

F = (x + h)2 (t x h)dt x2 (t x)dt =

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

=

 

 

(2xt 3x2 )hdt + (t 3x)h2 dt h3 dt .

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

Пусть r1 (x, h) = − 1

 

h3 dt . Оценим остаток:

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r1 (x, h)

 

 

1

h3 dt

 

 

 

 

 

 

 

h

 

 

 

C3

[0;1] 1

dt =

 

 

 

 

h

 

 

 

C3

[0;1] , т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r (x,t)

 

<

 

 

 

h

 

 

 

 

 

 

 

h

 

 

 

2 < ε

 

 

 

h

 

 

 

2 при

 

 

 

h

 

 

 

< δ = ε .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверим

условия:

 

 

 

 

 

 

 

 

 

 

 

F (x)[h] = (2xt 3x2 )hdt ,

т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (0)[h] = 0 .

F ′′(0)[h] = th2 dt > 0 при h0. Итак, условия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выполнены.

Покажем, что точка x=0 не является точкой минимума для данного функционала. Пусть функция hε(t) имеет вид:

17

ε ,t = 0,

hε (t) = ε t,0 < t < ε ,0,ε t 1.

Очевидно, что δ > 0, ε > 0 : hε < δ .

Предположим, что функционал F(x) имел бы в точке x минимум, тогда приращение имело бы постоянный знак в некоторой окрестности этой точки

F 0 при h < δ .

1

 

ε

4

 

Однако F(0) = F(hε ) = (ε t)2 (t ε + t)dt = −

 

< 0.

0

 

6

 

Таким образом, δ > 0hε :

F(0) = F(hε ) < 0 , и стало быть,

минимума нет.

 

 

 

 

18

5. Необходимое условие экстремума первого порядка

Рассмотрим задачу классического вариационного исчисления:

b

F(x) = f (t, x(t), x(t))dt extr, x(a)=xa, x(b)=xb.

a

Здесь t [a;b], f (t, x(t), x(t)) – функция трех перемен-

ных, дважды непрерывно дифференцируемая по совокупности аргументов.

Экстремум в задаче рассматривается среди функций

x(t) C1[a;b], удовлетворяющих краевым условиям x(a)=xa, x(b)=xb. Такие функции называют допустимыми.

Опр.1. Допустимая функция xˆ(t) доставляет слабый локальный минимум в поставленной задаче, если существует такое δ>0, что для любой допустимой функции x(t), для которой x(t) xˆ(t) C1[a;b] < δ , выполнено неравенство

F(x(t)) F(xˆ(t)) .

Замечание. Наряду со слабым экстремумом в классическом вариационном исчислении изучается также сильный экстремум. Речь об этом пойдет в пункте 8.7.

Итак, пусть функционал F(x) достигает на функции x(t) экстремума, тогда по принципу Ферма

b

f

 

f

 

 

F (x)[h] = [

h +

h]dt = 0 , h.

(5.1)

 

x

a

x

 

 

 

 

 

 

 

 

 

 

 

 

19

 

Возникает проблема нахождения функций x(t), удовлетворяющих (5.1). Для нахождения таких функций используется необходимое условие экстремума первого порядка, называемое уравнением Эйлера, которое имеет вид

f d f = 0 , t [a;b], x(a)=xa, x(b)=xb. x dt x

Опр.2. Функции, удовлетворяющие уравнению Эйлера, называются экстремалями. Экстремали, удовлетворяющие заданным краевым условиям, называются допустимыми экстремалями.

Для вывода уравнения Эйлера нам потребуется несколько утверждений, которые будут сформулированы и доказаны в данной главе.

5.1. Основные леммы вариационного исчисления

Лемма Лагранжа. Если A(t) C[a;b] и

b

A(t)h(t)dt = 0 , h(t) C [a;b]: h(a)=h(b)=0 , то A(t)0 на

a

отрезке [a;b].

Док-во. (от обратного).

Пусть A(t)0. Тогда t* (a;b): A(t*)=C0. Пусть C>0

(без ограничения общности можно считать, что точка t* не лежит на концах отрезка [a;b], так как, по непрерывности, если значение функции отлично от нуля в одном из концов отрезка, то оно отлично от нуля и в некоторой односторонней окрестности этой точки). Тогда, по непрерывности, су-

ществует окрестность Sδ( t*), в которой A(t)> С2 .

20