Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

A_G_2014

.pdf
Скачиваний:
43
Добавлен:
10.02.2015
Размер:
2.75 Mб
Скачать

§ 3. Структура нормального оператора

251

Замечание. Теорема 2.4 часто используется в механике сплошной среды. Множитель два во втором слагаемом правой части равенства (2.2) обусловлен традиционно применяемыми обозначениями в этой области механики.

§3. Структура нормального оператора

Вэтом параграфе все операторы — операторы, действующие в вещественном евклидовом пространстве Xn.

1. Теорема. Для того, чтобы оператор A, действующий в вещественном евклидовом пространстве Xn, был нормальным оператором, необходимо и достаточно существования ортонормированного базиса En пространства Xn, в котором матрица оператора A блочно диагональна:

Ae =

A1

A2

 

 

 

.

(3.1)

 

 

 

...

A

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Диагональные блоки этой матрицы могут иметь размеры либо 1 ×1, либо 2 × 2; блоки размера 1 × 1 — это вещественные числа, блоки размера 2 × 2 есть матрицы вида

()

Ap =

αp

−βp

,

(3.2)

 

βp

αp

 

 

где αp, βp — вещественные числа.

Доказательство. Д о с т а т о ч н о с т ь. Непосредственными вычислениями легко проверяется, что матрица Ae описанной в теореме структуры удовлетворяет условию (1.2), с. 249.

Н е о б х о д и м о с т ь. Пусть Ae — матрица нормального оператора A в произвольно выбранном ортонормированном базисе En. Тогда Ae удовлетворяет условию (1.2). Как было установлено ранее (см. упражнение 1 на с. 228), по матрице Ae можно построить ортонормированный базис Fn = {fk}nk=1 пространства Cn такой, что

Aefk = λkfk, k = 1, 2, . . . , n,

(3.3)

где λ1, λ2, . . . , λn — характеристические числа матрицы Ae, причем если λk — вещественное число, то и вектор fk можно считать вещественным. Будем нумеровать характеристические числа матрицы Ae

252

Глава 13. Операторы в вещественном евклидовом пространстве

так, что λ1

= α1, λ2 = α2, . . . , λm = αm, 0 6 m 6 n, веществен-

ны, а λm+j

¯

= αm+j + m+j, λm+j = αm+j − iβm+j, j = 1, 2, . . . , p,

p = (n − m)/2, — комплексные числа. Тогда собственные векторы fk,

k = 1, 2, . . . , m, будут вещественными, остальные — комплексными, т. е. fk = gk + ihk, где gk, hk Rn, k > m. Отметим также, что,

поскольку Ae — вещественная матрица, то если λk — комплексное ха-

¯ ¯ ¯

рактеристическое число матрицы Ae и Aefk = λkfk, то Aefk = λkfk. По теореме 8, с. 227, собственные векторы, соответствующие различным собственным числам нормального оператора, ортогональны, сле-

довательно, (fk, f¯k) = 0, откуда вытекает, что (gk, gk) = (hk, hk), (gk, hk) = 0. Кроме того, (fk, fk) = 1. Отсюда легко получается,

что (gk, gk) = (hk, hk) =

1/2. Пусть, далее, fk, fl Fn есть ком-

плексные векторы k ̸= l,

¯

¯

fk ̸= fl. Тогда (fk, fl) = 0, и (fk, fl) = 0,

откуда при помощи элементарных выкладок получаем, что (gk, gl),

(hk, hl), (gk, hl), (hk, gl) = 0. Напомним (см. п. 2, с. 197), что если

Aefk = λkfk, λk = αk + k, fk = gk + ihk, то Aegk = αkgk − βkhk,

Aehk = αkgk + βkhk. Поставим теперь в соответствие каждому вещественному характеристическому числу λk матрицы Ae вещественный

вектор fk Fn, а каждой паре комплексно сопряженных характери-

 

 

¯

 

 

стических чисел λk, λk матрицы Ae

вещественные векторы g˜k = 2 gk,

˜

2 hk. В результате, получим систему

 

hk =

 

 

 

 

e

˜

˜

˜

 

 

Fn = {f1, f2, . . . , fm, g˜1, h1

, g˜2, h2

, . . . , g˜p, hp},

состоящую из n векторов пространства Rn и по доказанному выше

ортонормированную. Для векторов системы e выполнены равенства

Fn

Aefk = αkfk,

k = 1, 2, . . . , m,

(3.4)

 

˜

 

Aeg˜j = αjg˜j − βjhj

(3.5)

˜

˜

 

Aehj = βjg˜j + αjhj,

 

j = 1, 2, . . . , p, из которых, очевидно, вытекает, что в ортонормированном базисе En = EFn пространства Xn оператор A будет иметь матрицу вида (3.1). Блоки этой матрицы образованы соответствую-

щим

элементами матрицы A

.

 

e

e

e

 

Остановимся на некоторых важных частных случаях. При этом мы будем опираться на следствие 7, с. 226.

2. Самосопряженный оператор. Матрица самосопряженного оператора A в любом ортонормированном базисе симметрична, следовательно, (см. п. 7, с. 226), все ее характеристические числа вещественны. Поэтому, все числа βj, j = 1, 2, . . . , p, в равенствах (3.5)

§ 4. Структура ортогонального оператора

253

равны нулю. Таким образом, существует ортонормированный базис пространства Xn, в котором матрица оператора A диагональна.

3. Кососимметричный оператор. Матрица кососимметричного оператора A в любом ортонормированном базисе кососимметрична, следовательно, (см. п. 7, с. 226), все ее характеристические числа чисто мнимые. Поэтому, все числа αj, в равенствах (3.4), (3.5) равны нулю, значит, существует ортонормированный базис пространства Xn, в котором матрица оператора A имеет вид (3.1). При этом все диагональные блоки первого порядка нулевые, а блоки второго порядка

кососимметричны:

 

 

0

β

Aj = (βj

0j),

j= 1, 2, . . . , p.

§4. Структура ортогонального оператора

1.Матрица ортогонального оператора в любом ортонормированном базисе ортогональна, следовательно (см. п. 7, с. 226), все ее харак-

теристические числа по модулю равны единице. Поэтому числа αk, k = 1, 2, . . . , m, в соотношениях (3.4) могут быть равны только плюс

единице или минус единице, а числа αj, βj, j = 1, 2, . . . , p, в равенствах (3.5) таковы, что αj2 + βj2 = 1, следовательно, существуют углы

φj [0, 2π) такие, что αj = cos φj, βj = sin φj. Таким образом, существует ортонормированый базис пространства Xn, в котором матрица ортогонального оператора принимает вид (3.1). При этом все диагональные блоки первого порядка — это числа, равные плюс единице или минус единице, а блоки второго порядка имеют вид

()

cos φj

sin φj .

sin φj

cos φj

Благодаря теореме 1, § 3, всякому ортогональному преобразованию вещественного евклидова пространства можно придать отчетливый геометрический смысл.

2. Начнем с двумерного случая. Как следует из вышеизложенного, для любого ортогонального преобразования евклидова пространства X2 существует ортонормированный базис e1, e2, в котором его

матрица будет либо

 

1

0

Ae = (0

1),

254

Глава 13. Операторы в вещественном евклидовом пространстве

либо

cos φ

sin φ

 

 

Ae = (sin φ

cos φ).

В первом случае всякий вектор x = ξ1e1 + ξ2e2 X2 переводится оператором A в вектор Ax = −ξ1e1 + ξ2e2, т. е. оператор A осуществляет зеркальное отражение относительно координатной оси ξ2.

Во втором случае (Ax, x) = |x||Ax| cos φ т. е. оператор A осуществляет поворот каждого вектора x X2 на угол φ. Направление

поворота (при φ > 0) совпадает с направлением кратчайшего поворота от e1 к e2.

3. В трехмерном случае у любого ортогонального оператора A существует хотя бы одно собственное число, поскольку соответствующее характеристическое уравнение есть алгебраическое уравнение третьего порядка с вещественными коэффициентами. Поэтому с точностью до перенумерации векторов ортонормированного базиса e1, e2, e3 X3 матрица Ae может принять одну из следующих форм:

 

1

0

0

 

 

Ae =

0

cos φ

sin φ

,

(4.1)

 

0

sin φ

cos φ

 

 

 

 

1

0

0

 

Ae =

0

cos φ

sin φ .

(4.2)

 

 

0

sin φ

cos φ

 

Поясним, что если оператор A имеет одно собственное число, указанные представления непосредственно следуют из теоремы 1, а если оператор A имеет три собственных числа, то представления (4.1) или (4.2) получаются за счет специального выбора угла φ.

Рассуждая по аналогии с двумерным случаем, нетрудно убедиться, что оператор A с матрицей (4.1) осуществляет поворот пространства X3 вокруг оси ξ1 на угол φ, а оператор A с матрицей (4.1) осуществляет поворот пространства X3 вокруг оси ξ1 на угол φ с последующим отражением относительно плоскости, ортогональной вектору e1. В первом случае определитель оператора A равен единице, во втором — минус единице.

Определитель оператора, как мы знаем, не зависит от выбора базиса пространства. Поэтому все ортогональные преобразования трехмерного пространства можно разбить на два класса: собственные вращения — это преобразования с положительным определителем, они

§ 5. Матрицы вращения и отражения

255

осуществляют поворот пространства вокруг некоторой оси; и несобственные вращения — это преобразования с отрицательным определителем, они осуществляют поворот пространства вокруг некоторой оси с последующим отражением относительно плоскости, ортогональной этой же оси.

4.Евклидово пространство Xn произвольной размерности в соответствии с теоремой 1 можно представить в виде ортогональной суммы некоторого количества одномерных инвариантных подпространств и некоторого количества двумерных инвариантных подпространств ортогонального оператора A. В двумерных инвариантных подпространствах оператор A выполняет поворот, в каждом, вообще говоря, на свой угол, а в одномерных инвариантных подпространствах может изменится лишь направление координатной оси.

5.Упражнения.

1)Опираясь на результаты § 15, с. 243, описать линейные отображения трехмерного вещественного евклидова пространства с положительным определителем и линейные отображения с отрицательным определителем.

2)Показать, что всякая вещественная симметричная матрица A ортогонально подобна диагональной, т. е. QT AQ = Λ, где Λ — диагональная, Q — ортогональная матрицы. Столбцы матрицы Q — собственные векторы матрицы A, по диагонали матрицы Λ расположены все собственные числа матрицы A.

3)Пусть A — симметричная, B — положительно определенная вещественные матрицы одного и того же порядка. Опираясь на теорему 2, с. 238, показать, что существует невырожденная матрица T

такая, что T T AT = Λ, где Λ — диагональная матрица, а T T BT = I.

§ 5. Матрицы вращения и отражения

Остановимся на двух часто используемых в приложениях типах ортогональных матриц.

1. Матрица вращения. Вещественная матрица

Qst(φ) = {qij(φ)}ni,j=1, 1 6 s < t 6 n,

называется матрицей вращения, если qss(φ) = qtt(φ) = cos φ,

qii(φ) = 1 при i ≠ s, t, qst(φ) = sin φ, qts(φ) = sin φ, а все остальные элементы матрицы Qst(φ) — нули.

256

Глава 13. Операторы в вещественном евклидовом пространстве

Нетрудно видеть, что матрица Q = Qst(φ) ортогональна. Порождаемое ей преобразование евклидова пространства Rn со стандартным скалярным произведением есть поворот на угол φ в двумерном подпространстве (плоскости), натянутом на векторы is, it естественного базиса пространства Rn. Матрица QT , обратная к Q, выполняет поворот в той же плоскости в обратном направлении.

Пусть x — произвольный вектор пространства Rn. Ясно, что

(Qx)i = xi при i ≠ s, t,

(Qx)s = xs cos φ − xt sin φ,

(Qx)t = xs sin φ + xt cos φ.

Положим ρ = (x2s + x2t )1/2. Пусть φ = 0, если ρ = 0, и cos φ = xs, sin φ = −xt, если ρ > 0. Тогда (Qx)s = ρ, (Qx)t = 0.

Теперь совершенно ясно, что если x — произвольный ненулевой вектор пространства Rn, то выбирая последовательно углы

φn, φn−1, . . . , φ2, можно построить матрицы вращения Q1,n(φn), Q1,n−1(φn−1), . . . , Q1,2(φ2) такие, что Qx = |x| i1. Здесь

Q = Q1,2(φ2) · · · Q1,n−1(φn−1)Q1,n(φn).

Таким образом, любой ненулевой вектор при помощи ортогональной матрицы можно преобразовать в вектор, совпадающий по направлению с вектором i1 естественного базиса.

Пусть теперь x, y два произвольных ненулевых вектора пространства Rn. Как только что было показано, существуют ортогональные

матрицы Qx и Qy такие, что Qxx = |x|i1, Qyy = |y|i1. Отсюда вытекает, что Qx = (|x|/|y|)y, где Q = QTy Qx, т. е. для любой пары ненулевых

векторов найдется ортогональная матрица, преобразующая первый вектор в вектор, совпадающий по направлению со вторым.

2. Матрица отражения. Пусть w = {wi}ni=1 — произвольно выбранный вектор единичной длины пространства Rn. Матрица

R = I − 2wwT

называется матрицей отражения. Поясним, что w трактуется здесь

как вектор столбец, так что R = ij 2wiwj}ni,j=1.

Матрица R симметрична. Покажем, что она ортогональна. Действительно,

RT R = R2 = I − 4wwT + 4wwT wwT = I,

так как wT w = |w|2 = 1.

§ 5. Матрицы вращения и отражения

257

Заметим, далее, что

 

Rw = w − 2wwT w = −w, Rz = z − 2wwT z = z,

(5.1)

если wT z = (w, z) = 0, т. е. векторы w и z ортогональны1).

Пусть теперь x — произвольный вектор. По теореме 3, с. 153, он однозначно представим в виде x = αw + z, где α некоторое число, z — некоторый вектор, ортогональный w. Из равенств (5.1) вытекает, что Rx = −αw + z.

Можно сказать, таким образом, что матрица R выполняет отражение вектора x относительно (n − 1)-мерной гиперплоскости, ортогональной вектору w. Это свойство матрицы R и позволяет называть

еематрицей отражения.

2.1.Рассмотрим следующую задачу. Даны ненулевой вектор a и вектор единичной длины e. Требуется построить матрицу отражения R, такую, что Ra = µe, где µ — число (ясно, что |µ| = |a|, поскольку матрица R ортогональна).

Нетрудно видеть (сделайте рисунок!), что решение задачи — матрица отражения, определяемая вектором

w = (a − |a|e)/|a − |a|e|

(5.2)

или вектором w = (a + |a|e)/|a + |a|e|. При вычислениях для минимизации погрешностей округления следует выбрать вектор w с б´ольшим знаменателем.

Полезно отметить, что если a — произвольный ненулевой вектор

то матрица отражения R может быть построена так, что для любого вектора x Rn

(a, Rx) = |a|xk,

(5.3)

где k — заданное целое число, лежащее в пределах от 1 до n. Для этого, очевидно, в формуле (5.2) нужно положить e = ik.

1)В смысле стандартного скалярного произведения в пространстве Rn.

Глава 14

Квадратичные формы и квадратичные функции

§1. Канонический вид квадратичной формы

1.Квадратичной формой будем называть вещественную функцию F от n вещественных переменных x1, x2, . . . , xn вида

n

F (x1, x2, . . . , xn) =

aijxixj.

(1.1)

 

i,j=1

 

Заданные вещественные числа aij называют коэффициентами квадратичной формы. Их можно считать удовлетворяющими условиям

симметрии aij = aji, i, j = 1, 2, . . . , n, поскольку слагаемые в квадратичной форме, содержащие коэффициенты aij, aji, можно предста-

вить так:

aijxixj + ajixjxi = aij + aji xixj + aij + aji xjxi.

2

2

Запишем квадратичную форму в более компактном виде. Пусть A — симметричная матрица с элементами aij, i, j = 1, 2, . . . , n. Вектор x = (x1, x2, . . . , xn) будем считать элементом пространства Rn. Тогда F (x) = (Ax, x). Здесь и всюду на протяжении данной главы

скобки обозначают стандартное скалярное произведение в пространстве Rn.

2. Пусть в квадратичной форме выполнена линейная замена переменных, т. е. введены новые переменные y = (y1, y2, . . . , yn), связанные со старыми переменными x = (x1, x2, . . . , xn) соотношением

x = Qy,

(1.2)

где Q — невырожденная матрица, называемая матрицей преобразования переменных. Выполнив замену переменных (1.2), получим

n

F (Qy) = (AQy, Qy) = (QT AQy, y) = (By, y) = bijyiyj,

i,j=1

где через B обозначена матрица QT AQ. Очевидно, матрица B симметрична. Чаще всего, матрицу Q стремятся подобрать так, чтобы

§ 1. Канонический вид квадратичной формы

259

квадратичная форма в новых переменных приобрела наиболее простой вид.

Говорят, что преобразование переменных (1.2) приводит квадратичную форму (1.1) к каноническому виду, если матрица B = QT AQ диагональна, т. е.

n

 

i

(1.3)

F (Qy) = biiyi2.

=1

 

Можно сказать также, что квадратичная форма (1.1) преобразованием переменных (1.2) приведена к сумме квадратов.

3. Всякую квадратичную форму невырожденным преобразованием переменных можно привести к каноническому виду. Действительно, поскольку A — симметричная матрица, то существует ортогональная матрица Q такая, что (см. упражнение 2 на с. 255)

QT AQ = Λ,

где Λ — диагональная матрица, по диагонали которой расположены все собственные числа матрицы A. При указанном выборе матрицы Q преобразование переменных (1.2) приводит квадратичную форму (1.1) к виду

n

 

i

(1.4)

F (Qy) = λiyi2,

=1

 

где λ1, λ2, . . . , λn — собственные числа матрицы A.

4.Известны и другие способы приведения квадратичной формы

кканоническому виду. Опишем, например, метод Лагранжа, или метод выделения полных квадратов, приведения квадратичной формы

кканоническому виду. В ходе описания этого метода, фактически, будет дано еще одно, независимое, доказательство возможности приведения любой квадратичной формы к каноническому виду.

Будем различать два случая: 1) в квадратичной форме (1.1) коэффициент при квадрате какой-либо переменной отличен от нуля, 2) коэффициенты при квадратах всех переменных — нули.

Рассмотрим сначала первый случай, и пусть a11 ≠ 0. Если это не так, придется ввести другую нумерацию неизвестных.

Запишем квадратичную форму (1.1) в виде

F = a111(a11x1 + a12x2 + · · · + a1nxn)2 + G,

(1.5)

где G = F − a111(a11x1 + a12x2 + · · · + a1nxn)2. Нетрудно убедиться, что G не содержит x1, а является квадратичной формой только от

260

Глава 14. Квадратичные формы и квадратичные функции

переменных x2, x3, . . . , xn. Положим

 

 

y1 = a11x1 + a12x2 + · · · + a1nxn, y2 = x2, . . . , yn = xn.

(1.6)

Тогда

 

 

F = a111y12 + G(y2, . . . , yn),

(1.7)

где G(y2, . . . , yn) — квадратичная форма от переменных y2, . . . , yn. Матрица замены переменных (1.6) невырождена, так как ее опре-

делитель равен a11, а по предположению a11 ≠ 0.

Пусть теперь все коэффициенты при квадратах переменных в (1.1) равны нулю. Тогда будем считать, что хотя бы один коэффициент при произведениях переменных отличен от нуля, иначе квадратичная форма тождественно равна нулю, и она имеет тривиальный канонический вид: все коэффициенты при квадратах неизвестных — нули. Итак, примем для определенности, что a12 ≠ 0, и выполним преобразование переменных по формулам

x1 = z1 − z2, x2 = z1 + z2, x3 = z3, . . . , xn = zn.

(1.8)

Заметим, во-первых, что определитель матрицы преобразования (1.8)

равен двум, а во-вторых, что 2a12x1x2 = 2a12z12 2a12z22, следовательно, в квадратичной форме появились слагаемые, содержащие квад-

раты переменных, поэтому, повторяя рассуждения предыдущего случая, при помощи невырожденной замены переменных приведем квадратичную форму к виду

F = αy12 + G(y2, . . . , yn).

(1.9)

Таким образом, выполняя одно или два последовательных невырожденных преобразования переменных, квадратичную форму (1.1) можно привести к виду (1.9).

Аналогичными преобразованиями переменных выделим полный квадрат в квадратичной форме G(y2, . . . , yn). Продолжая преобразования, в конце концов приведем квадратичную форму (1.1) к сумме квадратов.

Пример. Приведем к каноническому виду квадратичную форму

F (x1, x2, x3) = 2x1x2 6x2x3 + 2x3x1.

(1.10)

Поскольку в этой форме отсутствуют квадраты переменных, выполним сначала преобразование переменных

x1 = y1 − y2, x2 = y1 + y2, x3 = y3.

Получим

F = 2y12 4y1y3 2y22 8y2y3.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]