A_G_2014
.pdf192 |
Глава 11. Строение линейного оператора |
как функцию ее столбцов, т. е. det A = ∆(a1, a2, . . . , an). Тогда функцию d(x) можно представить в виде
d(x) = ∆(a1 + xi1, a2 + xi2, . . . , an + xin),
где, как обычно, через i1, i2, . . . , in обозначены единичные векторы пространства Cn. Как мы знаем, определитель линеен по каждому из своих столбцов, поэтому, проводя элементарные вычисления, получим
d(x) = ∆(a1, a2, . . . , an)+
+x(∆(i1, a2, . . . , an)+∆(a1, i2, . . . , an)+· · ·+∆(a1, a2, . . . , an−1, in))+
+x2(∆(i1, i2, a3 . . . , an) + · · · + ∆(a1, a2, . . . , an−2, in−1, in))+
+· · · + xn∆(i1, i2, . . . , in). (7.3)
Поясним, что множителем при xk является сумма Cnk определителей, каждый из которых получается заменой k столбцов определителя ∆(a1, a2, . . . , an) на соответствующие единичные векторы. Для завершения доказательства леммы остается заметить, что ∆(i1, i2, . . . , in) = 1, a заменяя k столбцов в определителе ∆(a1, a2, . . . , an) на единичные векторы с теми же номерами, мы получаем соответствующий диагональный минор порядка n − k матрицы A.
2. Характеристический полином матрицы Ae оператора A с точностью до знака совпадает с det(λI − Ae). Записывая этот определитель в виде разложения по степеням λ, получим
det(λI − Ae) = Pn(λ) = λn − I1λn−1 + I2λn−2 + · · · + (−1)nIn. (7.4)
Как уже отмечалось, коэффициенты полинома Pn являются инвариантами оператора A. Все они выражаются через элементы матрицы оператора, но при этом важно помнить, что никакое преобразование базиса их значений не меняет. В связи этим приняты обозначения Ik = Ik(A), k = 1, 2, . . . , n. Используя формулы (7.1), (7.2), нетрудно получить следующие выражения для инвариантов Ik(A) оператора A через элементы матрицы Ae:
|
|
|
|
|
|
|
|
|
e |
|
e |
|
e |
|
|
|
|
|
|
|
|
|
|
ai1,i1 |
ai1,i2 |
. . . ai1,ik |
|
|
|||||
|
|
|
|
|
|
|
|
e |
|
e |
|
e |
|
|
||
|
( ) = |
|
|
|
|
|
ai2,i1 |
ai2,i2 |
. . . ai2,ik |
, |
(7.5) |
|||||
k |
|
16i1 |
<i2 |
< |
|
<ik6n |
. . . . . . |
. . . . . . |
|
|
||||||
I A |
··· |
|
a |
e |
a |
e |
. . . a |
e |
|
|
|
|||||
|
|
|
∑ |
|
|
ik,i1 |
ik,i2 |
ik,ik |
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
§ 7. Инварианты оператора |
|
193 |
k = 1, 2, . . . , n, в частности, |
|
|
I1(A) = a11e + a22e + · · · + anne , |
In(A) = det Ae, |
(7.6) |
причем вследствие формул Вьета (см. п. 25, с. 25) |
|
|
a11e + a22e + · · · + anne = λ1 + λ2 + · · · + λn, |
det Ae = λ1λ2 · · · λn, (7.7) |
где λ1, λ2, . . . , λn — характеристические числа оператора A. Вообще, Ik(A) есть сумма всевозможных произведений k различных характеристических чисел оператора A.
3. Полезно отметить, что, поскольку всякая квадратная матрица A = {aij}ni,j=1 порождает линейный оператор (умножения на вектор), действующий в пространстве Cn, ей можно отнести величины Ik(A), k = 1, 2, . . . , n, вычисляемые по формулам вида (7.5) с заменой aeij на aij. Понятно, что эти величины не меняются ни при каком подобном преобразовании матрицы A и потому называются
инвариантами матрицы A.
4. Теорема. Пусть A — оператор, действующий в конечномерном пространстве Xn. Тогда существует положительное число ε0 такое, что если |ε| < ε0 и ε ≠ 0, то оператор A + εI обратим.
Доказательство этой теоремы поручается читателю в качестве упражнения.
5. Величину I1(A) = ae11 + ae22 + · · · + aenn = λ1 + λ2 + · · · + λn
называют следом оператора A и обозначают через tr(A). Отметим
следующие полезные формулы: |
|
tr(αA + βB) = α tr(A) + β tr(B), |
(7.8) |
tr(AB) = tr(BA). |
(7.9) |
Здесь A, B — произвольные линейные операторы, действующие в конечномерном линейном пространстве, α, β — произвольные числа.
Равенство (7.8) непосредственно вытекает из определения следа оператора. Равенство (7.9) легко проверяется переходом к матрицам операторов и прямыми вычислениями величин, записанных в его правой и левой частях.
194 |
Глава 11. Строение линейного оператора |
§ 8. Инвариантные функции операторного аргумента
1. Функцию f, ставящую в соответствие каждому оператору
A : Xn → Xn число, назовем инвариантоной скалярной функцией операторного аргумента на операторе A, если
f(QAQ−1) = f(A) |
(8.1) |
для любого невырожденного оператора Q : Xn → Xn.
1.1. Теорема. Для того, чтобы скалярная функция f операторного аргумента была инвариантной на любом операторе простой структуры, необходимо и достаточно, чтобы она зависела только от инвариантов оператора.
Доказательство. Характеристические полиномы операторов QAQ−1 и A при любом невырожденном операторе Q совпадают. Поэтому, если скалярная функция зависит только от инвариантов оператора, то она инвариантна. Обратно, пусть все инварианты операторов простой структуры A и B совпадают. Тогда (см. задачу 3, с. 228) существует невырожденный оператор Q такой, что B = QAQ−1 и, если функция f инвариантна, то f(B) = f(A).
Упражнение. Приведите примеры инвариантных скалярных функций операторного аргумента.
2. Операторную функцию f, т. е. функцию, отображающую линейное пространство операторов в себя, назовем инвариантной на операторе A, если
f(QAQ−1) = Qf(A)Q−1
для любого невырожденного оператора Q : Xn → Xn.
2.1. Теорема. Операторная функция f инвариантна на любом операторе A простой структуры тогда и только тогда, когда для любого оператора A : Xn → Xn простой структуры имеет место представление:
f(A) = φ0I + φ1A + φ2A2 + . . . + φn−1An−1, |
(8.2) |
где φi = φi(A), φi, i = 0, 1, . . . , n−1, есть инвариантные скалярные функции операторного аргумента.
Доказательство. При любом невырожденном операторе Q характеристические полиномы, а значит, и инварианты операторов QAQ−1 и A совпадают. Очевидно также, что (QAQ−1)p = QApQ−1
§ 8. Инвариантные функции операторного аргумента |
195 |
при любом целом неотрицательном p. Поэтому любая функция вида (2.1) инвариантна.
Докажем обратное утверждение. Пусть A — оператор простой структуры, {ek}nk=1 — его собственные векторы, образующие базис
пространства Xn, Aek = λkek, k = 1, 2, . . . , n. Определим оператор Q
равенствами Qe1 = −e1, Qek = ek, k = 2, 3, . . . , n. Нетрудно видеть, что Q−1 = Q. Очевидно также, что QAQ−1ek = Aek, k = 1, 2, . . . , n,
т. е. QAQ−1 = A. Положим D = f(A). Тогда QDQ−1 = Qf(A)Q−1. По условию теоремы Qf(A)Q−1 = f(A), значит, QDQ−1 = D, или QD = DQ. Следовательно,
|
QDe1 = −De1. |
(8.3) |
С другой стороны, если |
|
|
De1 |
= d1e1 + d2e2 + · · · + dnen, |
(8.4) |
то |
= −d1e1 + d2e2 + · · · + dnen. |
(8.5) |
QDe1 |
Из равенств (8.3)–(8.5), очевидно, вытекает, что d2, d3, . . . , dn = 0, а это означает, что De1 = d1e1, т. е. e1 — собственный вектор оператора D. Аналогично доказывается, что и все остальные векторы систе-
мы {ek}nk=1 — собственные векторы оператора D, т. е. f(A)ek = dkek, k = 1, . . . , n.
Заметим теперь, что для любого обратимого оператора Q справедливы равенства Qf(A)Q−1gk = dkgk, где gk = Qek, k = 1, 2, . . . , n, следовательно, f(QAQ−1)gk = dkgk, k = 1, 2, . . . , n. Таким образом,
все собственные числа операторов f(A) и f(QAQ−1) совпадают. Это означают, что все собственные числа оператора f(A) — инвариантные скалярные функции оператора A и потому зависят только от инвариантов оператора A.
Пусть e1, e2 — собственные векторы оператора A, соответствующие одному и тому же собственному числу: Ae1 = λe1, Ae2 = λe2. Тогда и собственные числа оператора D, отвечающие собственным
векторам e1, e2, также совпадают: De1 |
= de1, De2 |
= de2. Для дока- |
|||||||
зательства этого утверждения введем в рассмотрение оператор Q, |
|||||||||
определяемый равенствами Qe1 = e2, Qe2 |
= e1, |
1Qe3 = e3, . . . , |
|||||||
e |
= e |
n. Нетрудно убедиться, что |
оператор |
Q |
− |
существует и |
|||
Q n |
1 |
|
1 |
|
|
|
|||
QAQ− ek |
= Aek, k = 1, 2, . . . , n, т. е. QAQ− |
|
= A, а значит, и |
||||||
|
|
QDQ−1 = D. |
|
|
|
|
|
(8.6) |
196 |
Глава 11. Строение линейного оператора |
Пусть теперь e = β1e1 + β2e2, где β1, β2 — произвольные числа, не равные нулю одновременно. В силу (8.6) имеем QDe = DQe, или
Q(d1β1e1 + d2β2e2) = D(β1e2 + β2e1),
поэтому
d1β1e2 + d2β2e1 = β1d2e2 + β2d1e1,
откуда вытекает, что d1β1 =β1d2, d2β2 =β2d1, следовательно, d1 =d2. Как нетрудно убедиться, это означает, что кратности всех собственных чисел операторов A и D совпадают и, таким образом, установлено, что если
A = λ1P1 + λ2P2 + · · · + λsPs, |
(8.7) |
s 6 n, есть спектральное представление оператора |
A (см. (6.1), |
с. 190), то спектральное представление оператора D имеет вид |
|
D = d1P1 + d2P2 + · · · + dsPs. |
(8.8) |
При этом существенно, что операторы проектирования Pk, k = 1, 2, . . . , s, в равенстве (8.7) те же самые, что и в равенстве (8.8). Как показано в § 6, с. 189, каждый из операторов Pk, k = 1, 2, . . . , s, есть полином степени не выше s − 1 от оператора A с коэффициентами, зависящими лишь от собственных чисел оператора A. Отсюда, очевидно, следует справедливость представления (2.1).
3. Отметим особо случай n = 3 как наиболее интересный для приложений в механике. В этом случае представление инвариантной операторной функции от оператора простой структуры имеет вид
f(A) = φ0E + φ1A + φ2A2,
где φi = φi(I1(A), I2(A), I3(A))), i = 0, 1, 2. По теореме Кэли — Гамильтона любой оператор A удовлетворяет своему характеристиче-
скому уравнению, т. е.
A3 − I1A2 + I2A − I3 = 0,
откуда
A2 = I1A − I2I + I3A−1,
если оператор A−1 существует, и, следовательно, для обратимого оператора A простой структуры справедливо представление:
f(A) = ψ0I + ψ1A + ψ2A−1,
где ψ0, ψ1, ψ2 — некоторые функции инвариантов оператора A.
§9. Инвариантные подпространства оператора в вещественном пространстве 197
4.Теорема. Для того, чтобы функция f была линейной и инвариантной на любом операторе простой структуры, необходимо и достаточно, чтобы она имела вид
f(A) = λ tr(A)I + 2µA, |
(8.9) |
где λ, µ — числа.
Доказательство этой теоремы поручается читателю в качестве упражнения.
§ 9. Инвариантные подпространства оператора в вещественном пространстве
1. Пусть теперь оператор A действует в вещественном пространстве Xn. Матрица Ae оператора A в любом базисе En вещественна. Уравнение (2.3), с. 184, т. е. характеристическое уравнение матрицы Ae, — алгебраическое уравнение с вещественными коэффициентами. Оно, вообще говоря, имеет как вещественные, так и комплексные корни.
Если λ — вещественный корень уравнения (2.3), то система уравнений
(Ae − λI)ξ = 0 |
(9.1) |
имеет нетривиальное вещественное решение ξ, и для вектора x = Enξ выполнено равенство Ax = λx, т. е. x — собственный вектор оператора A. Таким образом, все вещественные характеристические числа матрицы Ae — собственные числа оператора A.
Если число λ не совпадает ни с одним из вещественных корней уравнения (2.3), то система уравнений (9.1) не может иметь нетривиальных вещественных решений, поэтому, если все корни уравнения (2.3) — комплексные числа, то оператор A не имеет собственных векторов.
Таким образом, линейный оператор, действующий в вещественном пространстве, может не иметь одномерных инвариантных подпространств.
2. Каждому комплексному характеристическому числу матрицы Ae соответствует двумерное инвариантное подпространство оператора A.
Действительно, если λ = α + iβ — комплексное характеристическое число матрицы Ae, то det(Ae − λI) = 0, и система уравнений
(Ae − λI)ξ = 0 |
(9.2) |
198 |
Глава 11. Строение линейного оператора |
имеет нетривиальное комплексное решение ξ = ζ +iη. Поясним, что ζ и η — векторы из Rn. Более подробная запись системы (9.2), с учетом того, что Ae — вещественная матрица, дает
Aeζ + iAeη = (α + iβ)(ζ + iη) = αζ − βη + i(βζ + αη), |
|
откуда, приравнивая вещественные и мнимые части, получаем |
|
Aeζ = αζ − βη, |
|
Aeη = βζ + αη. |
|
Полагая x = Enζ, y = Enη, будем иметь |
|
Ax = αx − βy, |
(9.3) |
Ay = βx + αy. |
(9.4) |
Образуем подпространство L, натянутое на векторы x, y. Пусть вектор z L. Это означает, что z = γx + δy для некоторых γ, δ R. Тогда Az L. В самом деле,
Az = γAx + δAy = γ(αx − βy) + δ(βx + αy) =
= (αγ + βδ)x + (αδ − βγ)y L.
Таким образом, L — инвариантное подпространство оператора A.
Упражнения.
1)Показать, что векторы x, y, удовлетворяющие соотношениям (9.3), (9.4), линейно независимы, т. е подпространство L двумерно.
2)Пусть Xn — вещественное пространство. Показать, что в любом подпространстве Lm Xn, размерности m > 2, инвариантном относительно оператора A : Xn → Xn, оператор A имеет либо одномерное, либо двумерное инвариантное подпространство.
§10. Приведение матрицы оператора к треугольной форме
1. Теорема. Для любого оператора A, действующего в комплексном пространстве Xn, можно указать такой базис, что матрица оператора A в этом базисе треугольна, причем по ее диагонали расположены все собственные числа оператора A.
В основе доказательства этого утверждения лежит
§ 10. Приведение матрицы оператора к треугольной форме |
199 |
2. Теорема Шура1). Пусть A — квадратная матрица порядка n, λ1, λ2, . . . , λn — характеристические числа матрицы A, занумерованные в некотором порядке. Существует унитарная матрица U такая, что
|
|
U AU = T, |
|
|
(10.1) |
|
где T — верхняя треугольная матрица вида |
|
|
||||
|
|
λ |
t12 . . . |
t1n |
. |
|
T = |
01 |
λ2 . . . |
t2n |
(10.2) |
||
|
|
. . . . . . . . . tn−1,n |
|
|
||
|
|
0 |
0 . . . |
λn |
|
|
Доказательство. Пусть u1 — собственный вектор матрицы A, отвечающий собственному числу λ1. Собственные векторы матрицы определяются с точностью до скалярного множителя, поэтому можно
считать, что |u1| = 1 2). |
n |
ортонормированный базис |
k |
n |
|
||||
Построим в пространстве C |
|
{u |
}k=1 |
||||||
(см. п. 2, с. 137) и обозначим через U1 матрицу, столбцами которой |
|||||||||
служат элементы векторов {uk}kn=1. |
|
|
1 |
|
|
1 |
|
||
Вычислим матрицу U1 AU1. Учтем при этом, что |
Au |
|
= λ1u |
, |
|||||
а (uk, u1) = 0 для k = 2, 3, . . . , n. В результате, получим, что |
|
|
|
||||||
|
|
λ |
A1). |
|
|
|
|
|
|
U1 AU1 = ( 01 |
|
|
|
(10.3) |
Справа в этом равенстве — блочная 2 × 2 матрица. Первый диагональный блок состоит из одного элемента, равного λ1. Второй диагональный блок — квадратная матрица размера n − 1. Блок в позиции (2,1) — нулевой столбец длины n − 1. Блок в позиции (1,2) — строка длины n − 1 с ненулевыми, вообще говоря, элементами. Обозначения, аналогичные использованным здесь, будут применяться и в дальнейшем.
Матрица U1 AU1 подобна матрице A, поэтому (см. теорему 2,
с. 185)
σ(U1 AU1) = σ(A).
С другой стороны, из (10.3) вытекает, что σ(U1 AU1) = λ1 σ(A1). Для того, чтобы убедиться в этом, нужно разложить по первому столбцу определитель det(λI − U1 AU1). Таким образом,
σ(A1) = {λ2, . . . , λn}.
1)Исай Шур (Issai Schur; 1875 — 1941) — немецкий математик.
2)Здесь и далее на протяжение этого параграфа под скалярным произведением понимается стандартное скалярное произведение в пространстве Cn.
200 |
Глава 11. Строение линейного оператора |
Рассуждая точно так же, как при построении матрицы U1, можно построить унитарную матрицу U2 порядка n − 1 такую, что
( )
U2 A1U2 = |
λ2 |
. |
(10.4) |
|
0 |
A2 |
|
Положим |
|
|
|
1 |
0 |
|
|
V2 = (0 |
U2). |
|
Матрица V2, как нетрудно убедиться, есть унитарная матрица порядка n. Проводя элементарные вычисления, получим
|
|
|
λ |
λ2 |
|
. |
V2 U1 AU1V2 |
= |
01 |
||||
|
|
|
0 |
0 |
A2 |
|
Понятно, что, продолжая этот процесс, можно построить унитарные матрицы V3, . . . , Vn−1 такие, что матрица
Vn−1 · · · V2 U1 AU1V2 · · · Vn−1
есть верхняя треугольная матрица, на главной диагонали которой по-
следовательно стоят числа λ1, λ2, . . . , λn. Положим U = U1V2 · · · Vn−1. Матрица U унитарна как произведение унитарных матриц (см. п. 6,
с. 108), причем U = Vn−1 · · · V2 U1 , поэтому для матрицы T = U AU справедливо равенство (10.2).
3. Совершенно аналогично доказывается, что существует унитарная матрица V такая, что
V AV = L,
где L — нижняя треугольная матрица, по диагонали которой расположены характеристические числа матрицы A.
4. Из доказательства теоремы Шура видно, что если матрица A вещественна и все ее характеристические числа (а, следовательно, и собственные векторы) вещественны, то матрица U в (10.1) может быть выбрана вещественной и унитарной, иными словами, ортогональной.