Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

A_G_2014

.pdf
Скачиваний:
43
Добавлен:
10.02.2015
Размер:
2.75 Mб
Скачать

§ 7. Инварианты оператора

191

Доказательство теоремы предоставляется читателю.

Упражнение. Пусть операторы A, B, действующие в пространстве Xn, есть операторы простой структуры и пусть их характеристические полиномы совпадают. Доказать, что тогда существует невырожденный оператор Q : Xn Xn такой, что B = QAQ1.

§7. Инварианты оператора

Вэтом параграфе существенно используется

1. Лемма. Для любого x C справедливо разложение

 

 

a11 + x

a12 . . .

a1n

 

 

d(x) =

 

a21

a22 + x . . .

a2n

 

=

 

 

 

. . . . . .

. . .

 

 

 

. . .

 

 

 

 

 

 

 

 

 

 

 

an1

 

 

 

 

 

 

an2 . . . ann + x

 

= xn + c1xn−1 + c2xn−2 + · · · + cn−1x + cn, (7.1)

где

 

 

 

ap1,p1

ap1,p2

ck =

 

ap2,p1 ap2,p2

 

 

 

 

. . .

 

 

. . .

16p1

<p2<···<pk6n

 

 

 

 

 

 

 

 

 

 

apk,p1 apk,p2

. . . ap1,pk

. . . ap2,pk

. . . . . .

. . . apk,pk

, (7.2)

k = 1, 2, . . . , n. Суммирование в (7.2) распространяется на все Cnk определителей порядка k указанного вида.

Определители, входящие в правую часть равенства (7.2), называ-

ются диагональными минорами порядка k матрицы

 

 

 

a11 a12 . . . a1n

 

 

 

a. .n1. . .a.n.2. ....... .a.nn. .

 

A = a21

a22 . . . a2n

.

 

Отметим, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a11

a12 . . . a1n

 

 

 

 

a21

a22 . . . a2n

c1 = a11 + a22 + + ann, cn =

.

 

· · ·

 

 

 

. . . . . . . . .

 

 

 

. . .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

an1

an2 . . . ann

Доказательство леммы 1. Обозначим через a1, a2, . . . , an столбцы матрицы A и будем трактовать определитель матрицы A

192

Глава 11. Строение линейного оператора

как функцию ее столбцов, т. е. det A = ∆(a1, a2, . . . , an). Тогда функцию d(x) можно представить в виде

d(x) = ∆(a1 + xi1, a2 + xi2, . . . , an + xin),

где, как обычно, через i1, i2, . . . , in обозначены единичные векторы пространства Cn. Как мы знаем, определитель линеен по каждому из своих столбцов, поэтому, проводя элементарные вычисления, получим

d(x) = ∆(a1, a2, . . . , an)+

+x(∆(i1, a2, . . . , an)+∆(a1, i2, . . . , an)+· · ·+∆(a1, a2, . . . , an−1, in))+

+x2(∆(i1, i2, a3 . . . , an) + · · · + ∆(a1, a2, . . . , an−2, in−1, in))+

+· · · + xn∆(i1, i2, . . . , in). (7.3)

Поясним, что множителем при xk является сумма Cnk определителей, каждый из которых получается заменой k столбцов определителя ∆(a1, a2, . . . , an) на соответствующие единичные векторы. Для завершения доказательства леммы остается заметить, что ∆(i1, i2, . . . , in) = 1, a заменяя k столбцов в определителе ∆(a1, a2, . . . , an) на единичные векторы с теми же номерами, мы получаем соответствующий диагональный минор порядка n − k матрицы A.

2. Характеристический полином матрицы Ae оператора A с точностью до знака совпадает с det(λI − Ae). Записывая этот определитель в виде разложения по степеням λ, получим

det(λI − Ae) = Pn(λ) = λn − I1λn−1 + I2λn−2 + · · · + (1)nIn. (7.4)

Как уже отмечалось, коэффициенты полинома Pn являются инвариантами оператора A. Все они выражаются через элементы матрицы оператора, но при этом важно помнить, что никакое преобразование базиса их значений не меняет. В связи этим приняты обозначения Ik = Ik(A), k = 1, 2, . . . , n. Используя формулы (7.1), (7.2), нетрудно получить следующие выражения для инвариантов Ik(A) оператора A через элементы матрицы Ae:

 

 

 

 

 

 

 

 

 

e

 

e

 

e

 

 

 

 

 

 

 

 

 

 

ai1,i1

ai1,i2

. . . ai1,ik

 

 

 

 

 

 

 

 

 

 

e

 

e

 

e

 

 

 

( ) =

 

 

 

 

 

ai2,i1

ai2,i2

. . . ai2,ik

,

(7.5)

k

 

16i1

<i2

<

 

<ik6n

. . . . . .

. . . . . .

 

 

I A

···

 

a

e

a

e

. . . a

e

 

 

 

 

 

 

 

 

ik,i1

ik,i2

ik,ik

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

§ 7. Инварианты оператора

 

193

k = 1, 2, . . . , n, в частности,

 

 

I1(A) = a11e + a22e + · · · + anne ,

In(A) = det Ae,

(7.6)

причем вследствие формул Вьета (см. п. 25, с. 25)

 

a11e + a22e + · · · + anne = λ1 + λ2 + · · · + λn,

det Ae = λ1λ2 · · · λn, (7.7)

где λ1, λ2, . . . , λn — характеристические числа оператора A. Вообще, Ik(A) есть сумма всевозможных произведений k различных характеристических чисел оператора A.

3. Полезно отметить, что, поскольку всякая квадратная матрица A = {aij}ni,j=1 порождает линейный оператор (умножения на вектор), действующий в пространстве Cn, ей можно отнести величины Ik(A), k = 1, 2, . . . , n, вычисляемые по формулам вида (7.5) с заменой aeij на aij. Понятно, что эти величины не меняются ни при каком подобном преобразовании матрицы A и потому называются

инвариантами матрицы A.

4. Теорема. Пусть A — оператор, действующий в конечномерном пространстве Xn. Тогда существует положительное число ε0 такое, что если |ε| < ε0 и ε ≠ 0, то оператор A + εI обратим.

Доказательство этой теоремы поручается читателю в качестве упражнения.

5. Величину I1(A) = ae11 + ae22 + · · · + aenn = λ1 + λ2 + · · · + λn

называют следом оператора A и обозначают через tr(A). Отметим

следующие полезные формулы:

 

tr(αA + βB) = α tr(A) + β tr(B),

(7.8)

tr(AB) = tr(BA).

(7.9)

Здесь A, B — произвольные линейные операторы, действующие в конечномерном линейном пространстве, α, β — произвольные числа.

Равенство (7.8) непосредственно вытекает из определения следа оператора. Равенство (7.9) легко проверяется переходом к матрицам операторов и прямыми вычислениями величин, записанных в его правой и левой частях.

194

Глава 11. Строение линейного оператора

§ 8. Инвариантные функции операторного аргумента

1. Функцию f, ставящую в соответствие каждому оператору

A : Xn Xn число, назовем инвариантоной скалярной функцией операторного аргумента на операторе A, если

f(QAQ1) = f(A)

(8.1)

для любого невырожденного оператора Q : Xn Xn.

1.1. Теорема. Для того, чтобы скалярная функция f операторного аргумента была инвариантной на любом операторе простой структуры, необходимо и достаточно, чтобы она зависела только от инвариантов оператора.

Доказательство. Характеристические полиномы операторов QAQ1 и A при любом невырожденном операторе Q совпадают. Поэтому, если скалярная функция зависит только от инвариантов оператора, то она инвариантна. Обратно, пусть все инварианты операторов простой структуры A и B совпадают. Тогда (см. задачу 3, с. 228) существует невырожденный оператор Q такой, что B = QAQ1 и, если функция f инвариантна, то f(B) = f(A).

Упражнение. Приведите примеры инвариантных скалярных функций операторного аргумента.

2. Операторную функцию f, т. е. функцию, отображающую линейное пространство операторов в себя, назовем инвариантной на операторе A, если

f(QAQ1) = Qf(A)Q1

для любого невырожденного оператора Q : Xn Xn.

2.1. Теорема. Операторная функция f инвариантна на любом операторе A простой структуры тогда и только тогда, когда для любого оператора A : Xn Xn простой структуры имеет место представление:

f(A) = φ0I + φ1A + φ2A2 + . . . + φn−1An−1,

(8.2)

где φi = φi(A), φi, i = 0, 1, . . . , n−1, есть инвариантные скалярные функции операторного аргумента.

Доказательство. При любом невырожденном операторе Q характеристические полиномы, а значит, и инварианты операторов QAQ1 и A совпадают. Очевидно также, что (QAQ1)p = QApQ1

§ 8. Инвариантные функции операторного аргумента

195

при любом целом неотрицательном p. Поэтому любая функция вида (2.1) инвариантна.

Докажем обратное утверждение. Пусть A — оператор простой структуры, {ek}nk=1 — его собственные векторы, образующие базис

пространства Xn, Aek = λkek, k = 1, 2, . . . , n. Определим оператор Q

равенствами Qe1 = −e1, Qek = ek, k = 2, 3, . . . , n. Нетрудно видеть, что Q1 = Q. Очевидно также, что QAQ1ek = Aek, k = 1, 2, . . . , n,

т. е. QAQ1 = A. Положим D = f(A). Тогда QDQ1 = Qf(A)Q1. По условию теоремы Qf(A)Q1 = f(A), значит, QDQ1 = D, или QD = DQ. Следовательно,

 

QDe1 = −De1.

(8.3)

С другой стороны, если

 

De1

= d1e1 + d2e2 + · · · + dnen,

(8.4)

то

= −d1e1 + d2e2 + · · · + dnen.

(8.5)

QDe1

Из равенств (8.3)–(8.5), очевидно, вытекает, что d2, d3, . . . , dn = 0, а это означает, что De1 = d1e1, т. е. e1 — собственный вектор оператора D. Аналогично доказывается, что и все остальные векторы систе-

мы {ek}nk=1 — собственные векторы оператора D, т. е. f(A)ek = dkek, k = 1, . . . , n.

Заметим теперь, что для любого обратимого оператора Q справедливы равенства Qf(A)Q1gk = dkgk, где gk = Qek, k = 1, 2, . . . , n, следовательно, f(QAQ1)gk = dkgk, k = 1, 2, . . . , n. Таким образом,

все собственные числа операторов f(A) и f(QAQ1) совпадают. Это означают, что все собственные числа оператора f(A) — инвариантные скалярные функции оператора A и потому зависят только от инвариантов оператора A.

Пусть e1, e2 — собственные векторы оператора A, соответствующие одному и тому же собственному числу: Ae1 = λe1, Ae2 = λe2. Тогда и собственные числа оператора D, отвечающие собственным

векторам e1, e2, также совпадают: De1

= de1, De2

= de2. Для дока-

зательства этого утверждения введем в рассмотрение оператор Q,

определяемый равенствами Qe1 = e2, Qe2

= e1,

1Qe3 = e3, . . . ,

e

= e

n. Нетрудно убедиться, что

оператор

Q

существует и

Q n

1

 

1

 

 

 

QAQek

= Aek, k = 1, 2, . . . , n, т. е. QAQ

 

= A, а значит, и

 

 

QDQ1 = D.

 

 

 

 

 

(8.6)

196

Глава 11. Строение линейного оператора

Пусть теперь e = β1e1 + β2e2, где β1, β2 — произвольные числа, не равные нулю одновременно. В силу (8.6) имеем QDe = DQe, или

Q(d1β1e1 + d2β2e2) = D(β1e2 + β2e1),

поэтому

d1β1e2 + d2β2e1 = β1d2e2 + β2d1e1,

откуда вытекает, что d1β1 =β1d2, d2β2 =β2d1, следовательно, d1 =d2. Как нетрудно убедиться, это означает, что кратности всех собственных чисел операторов A и D совпадают и, таким образом, установлено, что если

A = λ1P1 + λ2P2 + · · · + λsPs,

(8.7)

s 6 n, есть спектральное представление оператора

A (см. (6.1),

с. 190), то спектральное представление оператора D имеет вид

D = d1P1 + d2P2 + · · · + dsPs.

(8.8)

При этом существенно, что операторы проектирования Pk, k = 1, 2, . . . , s, в равенстве (8.7) те же самые, что и в равенстве (8.8). Как показано в § 6, с. 189, каждый из операторов Pk, k = 1, 2, . . . , s, есть полином степени не выше s − 1 от оператора A с коэффициентами, зависящими лишь от собственных чисел оператора A. Отсюда, очевидно, следует справедливость представления (2.1).

3. Отметим особо случай n = 3 как наиболее интересный для приложений в механике. В этом случае представление инвариантной операторной функции от оператора простой структуры имеет вид

f(A) = φ0E + φ1A + φ2A2,

где φi = φi(I1(A), I2(A), I3(A))), i = 0, 1, 2. По теореме Кэли — Гамильтона любой оператор A удовлетворяет своему характеристиче-

скому уравнению, т. е.

A3 − I1A2 + I2A − I3 = 0,

откуда

A2 = I1A − I2I + I3A1,

если оператор A1 существует, и, следовательно, для обратимого оператора A простой структуры справедливо представление:

f(A) = ψ0I + ψ1A + ψ2A1,

где ψ0, ψ1, ψ2 — некоторые функции инвариантов оператора A.

§9. Инвариантные подпространства оператора в вещественном пространстве 197

4.Теорема. Для того, чтобы функция f была линейной и инвариантной на любом операторе простой структуры, необходимо и достаточно, чтобы она имела вид

f(A) = λ tr(A)I + 2µA,

(8.9)

где λ, µ — числа.

Доказательство этой теоремы поручается читателю в качестве упражнения.

§ 9. Инвариантные подпространства оператора в вещественном пространстве

1. Пусть теперь оператор A действует в вещественном пространстве Xn. Матрица Ae оператора A в любом базисе En вещественна. Уравнение (2.3), с. 184, т. е. характеристическое уравнение матрицы Ae, — алгебраическое уравнение с вещественными коэффициентами. Оно, вообще говоря, имеет как вещественные, так и комплексные корни.

Если λ — вещественный корень уравнения (2.3), то система уравнений

(Ae − λI)ξ = 0

(9.1)

имеет нетривиальное вещественное решение ξ, и для вектора x = Enξ выполнено равенство Ax = λx, т. е. x — собственный вектор оператора A. Таким образом, все вещественные характеристические числа матрицы Ae — собственные числа оператора A.

Если число λ не совпадает ни с одним из вещественных корней уравнения (2.3), то система уравнений (9.1) не может иметь нетривиальных вещественных решений, поэтому, если все корни уравнения (2.3) — комплексные числа, то оператор A не имеет собственных векторов.

Таким образом, линейный оператор, действующий в вещественном пространстве, может не иметь одномерных инвариантных подпространств.

2. Каждому комплексному характеристическому числу матрицы Ae соответствует двумерное инвариантное подпространство оператора A.

Действительно, если λ = α + — комплексное характеристическое число матрицы Ae, то det(Ae − λI) = 0, и система уравнений

(Ae − λI)ξ = 0

(9.2)

198

Глава 11. Строение линейного оператора

имеет нетривиальное комплексное решение ξ = ζ +. Поясним, что ζ и η — векторы из Rn. Более подробная запись системы (9.2), с учетом того, что Ae — вещественная матрица, дает

Aeζ + iAeη = (α + )(ζ + ) = αζ − βη + i(βζ + αη),

 

откуда, приравнивая вещественные и мнимые части, получаем

 

Aeζ = αζ − βη,

 

Aeη = βζ + αη.

 

Полагая x = Enζ, y = Enη, будем иметь

 

Ax = αx − βy,

(9.3)

Ay = βx + αy.

(9.4)

Образуем подпространство L, натянутое на векторы x, y. Пусть вектор z L. Это означает, что z = γx + δy для некоторых γ, δ R. Тогда Az L. В самом деле,

Az = γAx + δAy = γ(αx − βy) + δ(βx + αy) =

= (αγ + βδ)x + (αδ − βγ)y L.

Таким образом, L — инвариантное подпространство оператора A.

Упражнения.

1)Показать, что векторы x, y, удовлетворяющие соотношениям (9.3), (9.4), линейно независимы, т. е подпространство L двумерно.

2)Пусть Xn — вещественное пространство. Показать, что в любом подпространстве Lm Xn, размерности m > 2, инвариантном относительно оператора A : Xn Xn, оператор A имеет либо одномерное, либо двумерное инвариантное подпространство.

§10. Приведение матрицы оператора к треугольной форме

1. Теорема. Для любого оператора A, действующего в комплексном пространстве Xn, можно указать такой базис, что матрица оператора A в этом базисе треугольна, причем по ее диагонали расположены все собственные числа оператора A.

В основе доказательства этого утверждения лежит

§ 10. Приведение матрицы оператора к треугольной форме

199

2. Теорема Шура1). Пусть A — квадратная матрица порядка n, λ1, λ2, . . . , λn — характеристические числа матрицы A, занумерованные в некотором порядке. Существует унитарная матрица U такая, что

 

 

U AU = T,

 

 

(10.1)

где T — верхняя треугольная матрица вида

 

 

 

 

λ

t12 . . .

t1n

.

 

T =

01

λ2 . . .

t2n

(10.2)

 

 

. . . . . . . . . tn−1,n

 

 

 

 

0

0 . . .

λn

 

 

Доказательство. Пусть u1 — собственный вектор матрицы A, отвечающий собственному числу λ1. Собственные векторы матрицы определяются с точностью до скалярного множителя, поэтому можно

считать, что |u1| = 1 2).

n

ортонормированный базис

k

n

 

Построим в пространстве C

 

{u

}k=1

(см. п. 2, с. 137) и обозначим через U1 матрицу, столбцами которой

служат элементы векторов {uk}kn=1.

 

 

1

 

 

1

 

Вычислим матрицу U1 AU1. Учтем при этом, что

Au

 

= λ1u

,

а (uk, u1) = 0 для k = 2, 3, . . . , n. В результате, получим, что

 

 

 

 

 

λ

A1).

 

 

 

 

 

 

U1 AU1 = ( 01

 

 

 

(10.3)

Справа в этом равенстве — блочная 2 × 2 матрица. Первый диагональный блок состоит из одного элемента, равного λ1. Второй диагональный блок — квадратная матрица размера n − 1. Блок в позиции (2,1) — нулевой столбец длины n − 1. Блок в позиции (1,2) — строка длины n − 1 с ненулевыми, вообще говоря, элементами. Обозначения, аналогичные использованным здесь, будут применяться и в дальнейшем.

Матрица U1 AU1 подобна матрице A, поэтому (см. теорему 2,

с. 185)

σ(U1 AU1) = σ(A).

С другой стороны, из (10.3) вытекает, что σ(U1 AU1) = λ1 σ(A1). Для того, чтобы убедиться в этом, нужно разложить по первому столбцу определитель det(λI − U1 AU1). Таким образом,

σ(A1) = 2, . . . , λn}.

1)Исай Шур (Issai Schur; 1875 — 1941) — немецкий математик.

2)Здесь и далее на протяжение этого параграфа под скалярным произведением понимается стандартное скалярное произведение в пространстве Cn.

200

Глава 11. Строение линейного оператора

Рассуждая точно так же, как при построении матрицы U1, можно построить унитарную матрицу U2 порядка n − 1 такую, что

( )

U2 A1U2 =

λ2

.

(10.4)

 

0

A2

 

Положим

 

 

 

1

0

 

 

V2 = (0

U2).

 

Матрица V2, как нетрудно убедиться, есть унитарная матрица порядка n. Проводя элементарные вычисления, получим

 

 

 

λ

λ2

 

.

V2 U1 AU1V2

=

01

 

 

 

0

0

A2

 

Понятно, что, продолжая этот процесс, можно построить унитарные матрицы V3, . . . , Vn−1 такие, что матрица

Vn−1 · · · V2 U1 AU1V2 · · · Vn−1

есть верхняя треугольная матрица, на главной диагонали которой по-

следовательно стоят числа λ1, λ2, . . . , λn. Положим U = U1V2 · · · Vn−1. Матрица U унитарна как произведение унитарных матриц (см. п. 6,

с. 108), причем U = Vn−1 · · · V2 U1 , поэтому для матрицы T = U AU справедливо равенство (10.2).

3. Совершенно аналогично доказывается, что существует унитарная матрица V такая, что

V AV = L,

где L — нижняя треугольная матрица, по диагонали которой расположены характеристические числа матрицы A.

4. Из доказательства теоремы Шура видно, что если матрица A вещественна и все ее характеристические числа (а, следовательно, и собственные векторы) вещественны, то матрица U в (10.1) может быть выбрана вещественной и унитарной, иными словами, ортогональной.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]