A_G_2014
.pdf§ 3. Структура нормального оператора |
251 |
Замечание. Теорема 2.4 часто используется в механике сплошной среды. Множитель два во втором слагаемом правой части равенства (2.2) обусловлен традиционно применяемыми обозначениями в этой области механики.
§3. Структура нормального оператора
Вэтом параграфе все операторы — операторы, действующие в вещественном евклидовом пространстве Xn.
1. Теорема. Для того, чтобы оператор A, действующий в вещественном евклидовом пространстве Xn, был нормальным оператором, необходимо и достаточно существования ортонормированного базиса En пространства Xn, в котором матрица оператора A блочно диагональна:
Ae = |
A1 |
A2 |
|
|
|
. |
(3.1) |
|
|
|
... |
A |
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Диагональные блоки этой матрицы могут иметь размеры либо 1 ×1, либо 2 × 2; блоки размера 1 × 1 — это вещественные числа, блоки размера 2 × 2 есть матрицы вида
()
Ap = |
αp |
−βp |
, |
(3.2) |
|
βp |
αp |
|
|
где αp, βp — вещественные числа.
Доказательство. Д о с т а т о ч н о с т ь. Непосредственными вычислениями легко проверяется, что матрица Ae описанной в теореме структуры удовлетворяет условию (1.2), с. 249.
Н е о б х о д и м о с т ь. Пусть Ae — матрица нормального оператора A в произвольно выбранном ортонормированном базисе En. Тогда Ae удовлетворяет условию (1.2). Как было установлено ранее (см. упражнение 1 на с. 228), по матрице Ae можно построить ортонормированный базис Fn = {fk}nk=1 пространства Cn такой, что
Aefk = λkfk, k = 1, 2, . . . , n, |
(3.3) |
где λ1, λ2, . . . , λn — характеристические числа матрицы Ae, причем если λk — вещественное число, то и вектор fk можно считать вещественным. Будем нумеровать характеристические числа матрицы Ae
252 |
Глава 13. Операторы в вещественном евклидовом пространстве |
так, что λ1 |
= α1, λ2 = α2, . . . , λm = αm, 0 6 m 6 n, веществен- |
ны, а λm+j |
¯ |
= αm+j + iβm+j, λm+j = αm+j − iβm+j, j = 1, 2, . . . , p, |
p = (n − m)/2, — комплексные числа. Тогда собственные векторы fk,
k = 1, 2, . . . , m, будут вещественными, остальные — комплексными, т. е. fk = gk + ihk, где gk, hk Rn, k > m. Отметим также, что,
поскольку Ae — вещественная матрица, то если λk — комплексное ха-
¯ ¯ ¯
рактеристическое число матрицы Ae и Aefk = λkfk, то Aefk = λkfk. По теореме 8, с. 227, собственные векторы, соответствующие различным собственным числам нормального оператора, ортогональны, сле-
довательно, (fk, f¯k) = 0, откуда вытекает, что (gk, gk) = (hk, hk), (gk, hk) = 0. Кроме того, (fk, fk) = 1. Отсюда легко получается,
что (gk, gk) = (hk, hk) = |
1/2. Пусть, далее, fk, fl Fn есть ком- |
|
плексные векторы k ̸= l, |
¯ |
¯ |
fk ̸= fl. Тогда (fk, fl) = 0, и (fk, fl) = 0, |
откуда при помощи элементарных выкладок получаем, что (gk, gl),
(hk, hl), (gk, hl), (hk, gl) = 0. Напомним (см. п. 2, с. 197), что если
Aefk = λkfk, λk = αk + iβk, fk = gk + ihk, то Aegk = αkgk − βkhk,
Aehk = αkgk + βkhk. Поставим теперь в соответствие каждому вещественному характеристическому числу λk матрицы Ae вещественный
вектор fk Fn, а каждой паре комплексно сопряженных характери- |
|||||
|
|
¯ |
|
|
√ |
стических чисел λk, λk матрицы Ae |
вещественные векторы g˜k = 2 gk, |
||||
˜ |
√ |
2 hk. В результате, получим систему |
|
||
hk = |
|
|
|||
|
|
e |
˜ |
˜ |
˜ |
|
|
Fn = {f1, f2, . . . , fm, g˜1, h1 |
, g˜2, h2 |
, . . . , g˜p, hp}, |
состоящую из n векторов пространства Rn и по доказанному выше
ортонормированную. Для векторов системы e выполнены равенства
Fn
Aefk = αkfk, |
k = 1, 2, . . . , m, |
(3.4) |
|
˜ |
|
Aeg˜j = αjg˜j − βjhj |
(3.5) |
|
˜ |
˜ |
|
Aehj = βjg˜j + αjhj, |
|
j = 1, 2, . . . , p, из которых, очевидно, вытекает, что в ортонормированном базисе En = EFn пространства Xn оператор A будет иметь матрицу вида (3.1). Блоки этой матрицы образованы соответствую-
щим |
элементами матрицы A |
. |
|
||
e |
e |
e |
|
Остановимся на некоторых важных частных случаях. При этом мы будем опираться на следствие 7, с. 226.
2. Самосопряженный оператор. Матрица самосопряженного оператора A в любом ортонормированном базисе симметрична, следовательно, (см. п. 7, с. 226), все ее характеристические числа вещественны. Поэтому, все числа βj, j = 1, 2, . . . , p, в равенствах (3.5)
§ 4. Структура ортогонального оператора |
253 |
равны нулю. Таким образом, существует ортонормированный базис пространства Xn, в котором матрица оператора A диагональна.
3. Кососимметричный оператор. Матрица кососимметричного оператора A в любом ортонормированном базисе кососимметрична, следовательно, (см. п. 7, с. 226), все ее характеристические числа чисто мнимые. Поэтому, все числа αj, в равенствах (3.4), (3.5) равны нулю, значит, существует ортонормированный базис пространства Xn, в котором матрица оператора A имеет вид (3.1). При этом все диагональные блоки первого порядка нулевые, а блоки второго порядка
кососимметричны: |
|
|
0 |
− |
β |
Aj = (βj |
0j), |
j= 1, 2, . . . , p.
§4. Структура ортогонального оператора
1.Матрица ортогонального оператора в любом ортонормированном базисе ортогональна, следовательно (см. п. 7, с. 226), все ее харак-
теристические числа по модулю равны единице. Поэтому числа αk, k = 1, 2, . . . , m, в соотношениях (3.4) могут быть равны только плюс
единице или минус единице, а числа αj, βj, j = 1, 2, . . . , p, в равенствах (3.5) таковы, что αj2 + βj2 = 1, следовательно, существуют углы
φj [0, 2π) такие, что αj = cos φj, βj = sin φj. Таким образом, существует ортонормированый базис пространства Xn, в котором матрица ортогонального оператора принимает вид (3.1). При этом все диагональные блоки первого порядка — это числа, равные плюс единице или минус единице, а блоки второго порядка имеют вид
()
cos φj |
− sin φj . |
sin φj |
cos φj |
Благодаря теореме 1, § 3, всякому ортогональному преобразованию вещественного евклидова пространства можно придать отчетливый геометрический смысл.
2. Начнем с двумерного случая. Как следует из вышеизложенного, для любого ортогонального преобразования евклидова пространства X2 существует ортонормированный базис e1, e2, в котором его
матрица будет либо |
|
1 |
0 |
Ae = (−0 |
1), |
254 |
Глава 13. Операторы в вещественном евклидовом пространстве |
|
либо |
cos φ |
sin φ |
|
||
|
Ae = (sin φ |
−cos φ). |
В первом случае всякий вектор x = ξ1e1 + ξ2e2 X2 переводится оператором A в вектор Ax = −ξ1e1 + ξ2e2, т. е. оператор A осуществляет зеркальное отражение относительно координатной оси ξ2.
Во втором случае (Ax, x) = |x||Ax| cos φ т. е. оператор A осуществляет поворот каждого вектора x X2 на угол φ. Направление
поворота (при φ > 0) совпадает с направлением кратчайшего поворота от e1 к e2.
3. В трехмерном случае у любого ортогонального оператора A существует хотя бы одно собственное число, поскольку соответствующее характеристическое уравнение есть алгебраическое уравнение третьего порядка с вещественными коэффициентами. Поэтому с точностью до перенумерации векторов ортонормированного базиса e1, e2, e3 X3 матрица Ae может принять одну из следующих форм:
|
1 |
0 |
0 |
|
|
Ae = |
0 |
cos φ |
− sin φ |
, |
(4.1) |
|
0 |
sin φ |
cos φ |
|
|
|
|
1 |
0 |
0 |
|
Ae = |
−0 |
cos φ |
− sin φ . |
(4.2) |
|
|
|
0 |
sin φ |
cos φ |
|
Поясним, что если оператор A имеет одно собственное число, указанные представления непосредственно следуют из теоремы 1, а если оператор A имеет три собственных числа, то представления (4.1) или (4.2) получаются за счет специального выбора угла φ.
Рассуждая по аналогии с двумерным случаем, нетрудно убедиться, что оператор A с матрицей (4.1) осуществляет поворот пространства X3 вокруг оси ξ1 на угол φ, а оператор A с матрицей (4.1) осуществляет поворот пространства X3 вокруг оси ξ1 на угол φ с последующим отражением относительно плоскости, ортогональной вектору e1. В первом случае определитель оператора A равен единице, во втором — минус единице.
Определитель оператора, как мы знаем, не зависит от выбора базиса пространства. Поэтому все ортогональные преобразования трехмерного пространства можно разбить на два класса: собственные вращения — это преобразования с положительным определителем, они
§ 5. Матрицы вращения и отражения |
255 |
осуществляют поворот пространства вокруг некоторой оси; и несобственные вращения — это преобразования с отрицательным определителем, они осуществляют поворот пространства вокруг некоторой оси с последующим отражением относительно плоскости, ортогональной этой же оси.
4.Евклидово пространство Xn произвольной размерности в соответствии с теоремой 1 можно представить в виде ортогональной суммы некоторого количества одномерных инвариантных подпространств и некоторого количества двумерных инвариантных подпространств ортогонального оператора A. В двумерных инвариантных подпространствах оператор A выполняет поворот, в каждом, вообще говоря, на свой угол, а в одномерных инвариантных подпространствах может изменится лишь направление координатной оси.
5.Упражнения.
1)Опираясь на результаты § 15, с. 243, описать линейные отображения трехмерного вещественного евклидова пространства с положительным определителем и линейные отображения с отрицательным определителем.
2)Показать, что всякая вещественная симметричная матрица A ортогонально подобна диагональной, т. е. QT AQ = Λ, где Λ — диагональная, Q — ортогональная матрицы. Столбцы матрицы Q — собственные векторы матрицы A, по диагонали матрицы Λ расположены все собственные числа матрицы A.
3)Пусть A — симметричная, B — положительно определенная вещественные матрицы одного и того же порядка. Опираясь на теорему 2, с. 238, показать, что существует невырожденная матрица T
такая, что T T AT = Λ, где Λ — диагональная матрица, а T T BT = I.
§ 5. Матрицы вращения и отражения
Остановимся на двух часто используемых в приложениях типах ортогональных матриц.
1. Матрица вращения. Вещественная матрица
Qst(φ) = {qij(φ)}ni,j=1, 1 6 s < t 6 n,
называется матрицей вращения, если qss(φ) = qtt(φ) = cos φ,
qii(φ) = 1 при i ≠ s, t, qst(φ) = − sin φ, qts(φ) = sin φ, а все остальные элементы матрицы Qst(φ) — нули.
256 |
Глава 13. Операторы в вещественном евклидовом пространстве |
Нетрудно видеть, что матрица Q = Qst(φ) ортогональна. Порождаемое ей преобразование евклидова пространства Rn со стандартным скалярным произведением есть поворот на угол φ в двумерном подпространстве (плоскости), натянутом на векторы is, it естественного базиса пространства Rn. Матрица QT , обратная к Q, выполняет поворот в той же плоскости в обратном направлении.
Пусть x — произвольный вектор пространства Rn. Ясно, что
(Qx)i = xi при i ≠ s, t,
(Qx)s = xs cos φ − xt sin φ,
(Qx)t = xs sin φ + xt cos φ.
Положим ρ = (x2s + x2t )1/2. Пусть φ = 0, если ρ = 0, и cos φ = xs/ρ, sin φ = −xt/ρ, если ρ > 0. Тогда (Qx)s = ρ, (Qx)t = 0.
Теперь совершенно ясно, что если x — произвольный ненулевой вектор пространства Rn, то выбирая последовательно углы
φn, φn−1, . . . , φ2, можно построить матрицы вращения Q1,n(φn), Q1,n−1(φn−1), . . . , Q1,2(φ2) такие, что Qx = |x| i1. Здесь
Q = Q1,2(φ2) · · · Q1,n−1(φn−1)Q1,n(φn).
Таким образом, любой ненулевой вектор при помощи ортогональной матрицы можно преобразовать в вектор, совпадающий по направлению с вектором i1 естественного базиса.
Пусть теперь x, y два произвольных ненулевых вектора пространства Rn. Как только что было показано, существуют ортогональные
матрицы Qx и Qy такие, что Qxx = |x|i1, Qyy = |y|i1. Отсюда вытекает, что Qx = (|x|/|y|)y, где Q = QTy Qx, т. е. для любой пары ненулевых
векторов найдется ортогональная матрица, преобразующая первый вектор в вектор, совпадающий по направлению со вторым.
2. Матрица отражения. Пусть w = {wi}ni=1 — произвольно выбранный вектор единичной длины пространства Rn. Матрица
R = I − 2wwT
называется матрицей отражения. Поясним, что w трактуется здесь
как вектор столбец, так что R = {δij − 2wiwj}ni,j=1.
Матрица R симметрична. Покажем, что она ортогональна. Действительно,
RT R = R2 = I − 4wwT + 4wwT wwT = I,
так как wT w = |w|2 = 1.
Глава 14
Квадратичные формы и квадратичные функции
§1. Канонический вид квадратичной формы
1.Квадратичной формой будем называть вещественную функцию F от n вещественных переменных x1, x2, . . . , xn вида
∑n
F (x1, x2, . . . , xn) = |
aijxixj. |
(1.1) |
|
i,j=1 |
|
Заданные вещественные числа aij называют коэффициентами квадратичной формы. Их можно считать удовлетворяющими условиям
симметрии aij = aji, i, j = 1, 2, . . . , n, поскольку слагаемые в квадратичной форме, содержащие коэффициенты aij, aji, можно предста-
вить так:
aijxixj + ajixjxi = aij + aji xixj + aij + aji xjxi. |
|
2 |
2 |
Запишем квадратичную форму в более компактном виде. Пусть A — симметричная матрица с элементами aij, i, j = 1, 2, . . . , n. Вектор x = (x1, x2, . . . , xn) будем считать элементом пространства Rn. Тогда F (x) = (Ax, x). Здесь и всюду на протяжении данной главы
скобки обозначают стандартное скалярное произведение в пространстве Rn.
2. Пусть в квадратичной форме выполнена линейная замена переменных, т. е. введены новые переменные y = (y1, y2, . . . , yn), связанные со старыми переменными x = (x1, x2, . . . , xn) соотношением
x = Qy, |
(1.2) |
где Q — невырожденная матрица, называемая матрицей преобразования переменных. Выполнив замену переменных (1.2), получим
∑n
F (Qy) = (AQy, Qy) = (QT AQy, y) = (By, y) = bijyiyj,
i,j=1
где через B обозначена матрица QT AQ. Очевидно, матрица B симметрична. Чаще всего, матрицу Q стремятся подобрать так, чтобы
§ 1. Канонический вид квадратичной формы |
259 |
квадратичная форма в новых переменных приобрела наиболее простой вид.
Говорят, что преобразование переменных (1.2) приводит квадратичную форму (1.1) к каноническому виду, если матрица B = QT AQ диагональна, т. е.
n |
|
∑i |
(1.3) |
F (Qy) = biiyi2. |
|
=1 |
|
Можно сказать также, что квадратичная форма (1.1) преобразованием переменных (1.2) приведена к сумме квадратов.
3. Всякую квадратичную форму невырожденным преобразованием переменных можно привести к каноническому виду. Действительно, поскольку A — симметричная матрица, то существует ортогональная матрица Q такая, что (см. упражнение 2 на с. 255)
QT AQ = Λ,
где Λ — диагональная матрица, по диагонали которой расположены все собственные числа матрицы A. При указанном выборе матрицы Q преобразование переменных (1.2) приводит квадратичную форму (1.1) к виду
n |
|
∑i |
(1.4) |
F (Qy) = λiyi2, |
|
=1 |
|
где λ1, λ2, . . . , λn — собственные числа матрицы A.
4.Известны и другие способы приведения квадратичной формы
кканоническому виду. Опишем, например, метод Лагранжа, или метод выделения полных квадратов, приведения квадратичной формы
кканоническому виду. В ходе описания этого метода, фактически, будет дано еще одно, независимое, доказательство возможности приведения любой квадратичной формы к каноническому виду.
Будем различать два случая: 1) в квадратичной форме (1.1) коэффициент при квадрате какой-либо переменной отличен от нуля, 2) коэффициенты при квадратах всех переменных — нули.
Рассмотрим сначала первый случай, и пусть a11 ≠ 0. Если это не так, придется ввести другую нумерацию неизвестных.
Запишем квадратичную форму (1.1) в виде
F = a11−1(a11x1 + a12x2 + · · · + a1nxn)2 + G, |
(1.5) |
где G = F − a−111(a11x1 + a12x2 + · · · + a1nxn)2. Нетрудно убедиться, что G не содержит x1, а является квадратичной формой только от
260 |
Глава 14. Квадратичные формы и квадратичные функции |
|
переменных x2, x3, . . . , xn. Положим |
|
|
|
y1 = a11x1 + a12x2 + · · · + a1nxn, y2 = x2, . . . , yn = xn. |
(1.6) |
Тогда |
|
|
|
F = a11−1y12 + G(y2, . . . , yn), |
(1.7) |
где G(y2, . . . , yn) — квадратичная форма от переменных y2, . . . , yn. Матрица замены переменных (1.6) невырождена, так как ее опре-
делитель равен a11, а по предположению a11 ≠ 0.
Пусть теперь все коэффициенты при квадратах переменных в (1.1) равны нулю. Тогда будем считать, что хотя бы один коэффициент при произведениях переменных отличен от нуля, иначе квадратичная форма тождественно равна нулю, и она имеет тривиальный канонический вид: все коэффициенты при квадратах неизвестных — нули. Итак, примем для определенности, что a12 ≠ 0, и выполним преобразование переменных по формулам
x1 = z1 − z2, x2 = z1 + z2, x3 = z3, . . . , xn = zn. |
(1.8) |
Заметим, во-первых, что определитель матрицы преобразования (1.8)
равен двум, а во-вторых, что 2a12x1x2 = 2a12z12 −2a12z22, следовательно, в квадратичной форме появились слагаемые, содержащие квад-
раты переменных, поэтому, повторяя рассуждения предыдущего случая, при помощи невырожденной замены переменных приведем квадратичную форму к виду
F = αy12 + G(y2, . . . , yn). |
(1.9) |
Таким образом, выполняя одно или два последовательных невырожденных преобразования переменных, квадратичную форму (1.1) можно привести к виду (1.9).
Аналогичными преобразованиями переменных выделим полный квадрат в квадратичной форме G(y2, . . . , yn). Продолжая преобразования, в конце концов приведем квадратичную форму (1.1) к сумме квадратов.
Пример. Приведем к каноническому виду квадратичную форму
F (x1, x2, x3) = 2x1x2 − 6x2x3 + 2x3x1. |
(1.10) |
Поскольку в этой форме отсутствуют квадраты переменных, выполним сначала преобразование переменных
x1 = y1 − y2, x2 = y1 + y2, x3 = y3.
Получим
F = 2y12 − 4y1y3 − 2y22 − 8y2y3.