Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казанский федеральный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

A_G_2014

.pdf

Скачиваний:

Добавлен:

10.02.2015

Размер:

2.75 Mб

Скачать

☆

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3132 / 3632 33 34 35 36 > Следующая >>>

§ 2. Элементы общей теории итерационных методов	311
= (Ax, x) − 2 Re(x, Axˆ) + (Ax,ˆ xˆ) − (Ax,ˆ xˆ) =	(2.15)
= (A(x − xˆ), x − xˆ) − (Ax,ˆ xˆ),	(2.15)

следовательно, функции F (x) и F0(x) = (A(x −xˆ), x −xˆ) отличаются на постоянное слагаемое. Поскольку матрица A положительно определена, то единственной точкой минимума функции F0, а стало быть, и функции F является xˆ. Вследствие (2.15) неравенство (2.12) можно записать в виде

F (xk+1) < F (xk).

(2.16)

Таким образом, можно сказать, что при выполнении условий теоремы 3 итерационный процесс (2.3) является релаксационным2): каждое последующее приближение уменьшает значение функционала F .

6. Используя полученные в предыдущем пункте общие результаты, исследуем сходимость метода релаксации (2.2).

6.1. Теорема. Пусть матрица A положительно определена,

0 < ω < 2.

(2.17)

Тогда итерационный метод (2.2) сходится при любом начальном приближении x0.

Доказательство. Будем опираться на теорему 3. В рассматриваемом случае B = D + ωL, τ = ω, B1 = D + (ω/2)(L + L ), A = D+L+L , и условие (2.9) принимает вид (Dx, x) > (ω/2)(Dx, x) для любого x ≠ 0. Все диагональные элементы положительно определенной матрицы положительны (см. упражнение 3 на с. 224), поэтому матрица D положительно определена, и условие (2.9) выполнено, если выполнено условие (2.17).

6.2. Теорема. Условие (2.17) необходимо для сходимости итерационного процесса (1.9).

Доказательство. Запишем равенство (2.7) в виде

(D + ωL)S = (D + ωL) − ωA = (1 − ω)D − ωR.

(2.18)

Поскольку L и R — строго треугольные матрицы, а D — диагональная матрица, все диагональные элементы которой отличны от нуля, то, вычисляя определители левой и правой частей равенства (2.18), получим, что det(S) = (1 − ω)n, следовательно (см. (7.7), с. 193),

∏n

|λk| = |1 − ω|n,

(2.19)

k=1

2)Релаксация (лат. relaxatio) — уменьшение напряжения, ослабление.

312	Глава 17. Итерационные методы

где λ1, λ2, . . . ,λn — характеристические числа матрицы S. Если условие (2.17) нарушено, то |1 − ω| > 1, и среди собственных чисел λk матрицы S есть хотя бы одно, модуль которого больше единицы, но тогда по теореме 2 найдется начальное приближение x0, при котором итерационный процесс (1.9) не сходится.

7. Пример решения задачи об оптимальном выборе итерационного параметра. Из доказательства теоремы 2 видно, что итерационный процесс (2.3) сходится тем быстрее, чем меньше спектральный радиус матрицы S = I −τB−1A. В связи с этим возникает задача отыскания такого (оптимального) значения итерационного параметра τ, при котором величина ρ(S) принимает минимальное значение.

Наиболее просто эта задача решается в случае, когда матрицы A, B положительно определены. Поскольку в рассматриваемом случае B = B , т. е. в представлении (2.10) матрица B2 равна нулю, то из (2.11) получаем, что для любой собственной пары λ, x матри-

цы S справедливо равенство
			(Ax, x)
			(Ax, x)

\|λ\| =	1	− τ	(Bx, x)	.	(2.20)

Нетрудно видеть, что если x — собственный вектор матрицы S, то x — собственный вектор матрицы B−1A и, следовательно (см. § 13, с. 238), x — собственный вектор обобщенной проблемы собственных значений

Ax = λBx.

(2.21)

Очевидно, справедливо и обратное: любой собственный вектор задачи (2.21) есть собственный вектор оператора S.

Для любой собственной пары x, λ задачи (2.21) справедливо равенство (Ax, x) = λ(Bx, x). Поэтому все собственные числа задачи (2.21) положительны. Пусть m — минимальное, а M максимальное из этих чисел. Тогда для любого собственного вектора x оператора S справедливы неравенства

m 6	(Ax, x)	6 M.	(2.22)
	(Bx, x)

Полученные оценки являются точными, поскольку соответствующие неравенства (2.22) превращаются в равенства, если в качестве x взять собственный вектор, отвечающий m или M.

Нетрудно видеть, что функция g(µ) = |1 − τµ| вещественного переменного µ на любом ограниченном отрезке вещественной оси достигает максимального значения на одном из концов этого отрезка. Поэтому, используя соотношения (2.20), (2.22), получаем, что

§ 3. Метод Якоби решения задач на собственные значения

313

Рис. 1. К выбору оптимального итерационного параметра
ρ(S) = φ(τ) = max{\|1 − τm\|, \|1 − τM\|}.					(2.23)
График функции φ(τ) при τ	> 0 изображен на рис. 1. Нетрудно
убедиться, что			−		(2.24)
τ>0	0	) = (1		ξ)/(1 + ξ),
min φ(τ) = φ(τ

где τ0 = 2/(M + m), ξ = m/M.

Таким образом, итерационный процесс (2.3) при оптимальном значении итерационного параметра τ = τ0 сходится тем быстрее, чем больше m/M, т. е. чем меньше разброс собственных чисел задачи (2.21).

§3. Метод Якоби решения задач на собственные значения

Вэтом параграфе излагается приближенный метод Якоби, который можно применять для приближенного отыскания собственных чисел и собственных векторов эрмитовых матриц. Как и все методы, используемые в настоящее время для приближенного решения задач на собственные значения, метод Якоби является итерационным.

Всамых общих чертах, идея его состоит в следующем. Пусть A — диагональная матрица. Тогда собственные числа матрицы A есть ее

диагональные элементы. Метод Якоби для любой эрмитовой матри-

цы A дает способ построения последовательности матриц A1, A2, . . . , Ak, . . . таких, что каждая из матриц этой последовательности эрмитова, подобна матрице A и с увеличением номера k становится все более близкой к диагональной. В качестве приближенных значений собственных чисел матрицы A берутся диагональные элементы мат-

рицы Ak, как только все ее внедиагональные элементы оказываются достаточно малыми.

1. Итак, пусть A — эрмитова матрица порядка n, Q = {qij}ni,j=1 — матрица, отличающаяся от единичной лишь четырьмя элементами:

qk,k = cos φ, qll = cos φ, qkl = −q sin φ, qlk = q¯sin φ,

(3.1)

314 Глава 17. Итерационные методы

где 1 6 k < l 6 n, φ — вещественное число, q — вообще говоря, комплексное число, |q| = 1. Очевидно, Q — унитарная матрица.

Образуем по матрице A матрицу A = QT AQ и попытаемся вы-

брать параметры матрицы Q, т. е. числа k,							l,		φ, q, так, чтобы мат-
рица	A	была максимально близка к			диагональной.
рица		была максимально близка к			b
					˜		T
Нетрудно убедиться, что матрица A = Q A отличается от мат-
рицы b		лишь элементами строк с номерами					k	,	l	, причем
	A						k		l
		a˜k,j = akj cos φ + aljq¯sin φ,
		a˜l,j = −akjq sin φ + alj cos φ,				j = 1, . . . , n.					(3.2)
		ˆ	˜							˜
Аналогично, матрица A = AQ				отличается от матрицы A лишь эле-
ментами столбцов с номерами k, l, причем
		aˆj,k = a˜jk cos φ + a˜jlq sin φ,
		aˆj,l = −a˜jkq¯sin φ + a˜jl cos φ,				j = 1, . . . , n.					(3.3)
Из (3.2), (3.3) сразу же следует, что
\|a˜k,j\|2 + \|a˜l,j\|2 = \|ak,j\|2 + \|al,j\|2,				\|aˆj,k\|2 + \|aˆj,l\|2 = \|aj,k\|2 + \|aj,l\|2,							(3.4)
										j = 1, . . . , n,	(3.4)
	aˆkl = q¯(all − akk) cos φ sin φ + akl cos2 φ − q¯2alk sin2 φ.										(3.5)

Вычислим сумму квадратов модулей внедиагональных элементов

	ˆ
матрицы A. Используя соотношения (3.2) – (3.4), нетрудно получить,
что	∑		∑	(3.6)
	\|aij\|2	=	\|aij\|2 − 2\|akl\|2 + \|aˆkl\|2.	(3.6)
	b
	i̸=j		i̸=j

Определим теперь числа k, l из условия:

\|	kl\| =	i=j \|	a	ij\|	.	(3.7)
a		max	a		.

Поскольку A — эрмитова матрица, то alk = a¯kl, и из (3.5) с учетом того, что 1/q¯ = q, будем иметь, что

aˆ		= q¯	all − akk	sin 2φ + qa		cos2	φ	−	q¯a¯		sin2 φ .
	kl	(	2		kl			−		kl	)

Будем считать, что akl ≠ 0. В противном случае матрица диагональна, и ее собственные числа определяются тривиальным образом. Положим

q = |akl|/akl.

(3.8)

§ 4. Исследование сходимости метода Якоби										315
Тогда			all − akk
aˆ		= q¯	all − akk			sin 2φ + a			cos 2φ .	(3.9)
	kl	(	2				\| kl\|		)	(3.9)
Выберем затем угол φ так, чтобы
			1
	\|akl\| cos 2φ +				(all − akk) sin 2φ = 0,
или	\|akl\| cos 2φ +			2	(all − akk) sin 2φ = 0,
или							2\|akl\|
			tg 2φ =				2\|akl\|	.		(3.10)
							akk − all

При указанном выборе параметров, определяющих матрицу Q, сумма

квадратов модулей внедиагональных элементов матрицы A принимает наименьшее значение.

Теперь можно описать метод Якоби. Пусть A0 = A. Образуем последовательность матриц A1, A2, . . . при помощи рекуррентной формулы:

Ap+1 = QpT ApQp, p = 0, 1, . . . ,

(3.11)

где параметры матрицы Qp определяются так, чтобы сделать сумму квадратов внедиагональных элементов матрицы Ap+1 минимально возможной, т. е. по формулам вида (3.7), (3.8), (3.10).

Вычисления проводят до тех пор, пока все внедиагональные элементы матрицы Ap не станут достаточно малыми. Тогда в качестве приближений к собственным числам матрицы A принимают диагональные элементы матрицы Ap, а столбцы матрицы Q0Q1 · · · Qp считают приближениями к собственным векторам матрицы A.

§4. Исследование сходимости метода Якоби

1.Лемма. Пусть параметры матрицы Q определяются согласно формулам (3.7), (3.8), (3.10). Тогда

∑	6 ρ	∑	(4.1)
\|aij\|2	6 ρ	\|aij\|2,	(4.1)
b
i̸=j		i̸=j

где

0 < ρ = 1 − n(n − 1) < 1

при n > 2.

Доказательство. Вследствие (3.10) из (3.6) получаем

∑	∑		(4.2)
i̸=j	\|baij\|2 = i̸=j	\|aij\|2 − 2\|akl\|2,	(4.2)

316 Глава 17. Итерационные методы

а на основании (3.7)
∑	6 \|akl\|2n(n − 1).	(4.3)
\|aij\|2	6 \|akl\|2n(n − 1).	(4.3)

i≠j

Здесь учтено, что матрица порядка n имеет n2 − n внедиагональных элементов. Из (4.2), (4.3) очевидным образом следует (4.1).

Докажем сходимость метода Якоби. Пусть Ap = {aij(p)}i,jn			=1. Из
рекуррентной формулы (3.11) и леммы 1 вытекает, что
∑	∑	∑
\|aij(p)\|2 6 ρ	\|aij(p−1)\|2 6 ρp	\|aij\|2 → 0 при p → ∞.
i̸=j	i̸=j	i̸=j

Это означает, что по любому заданному ε > 0 можно указать целое положительное число p такое, что

|aij(p)| 6 ε/n, i ̸= j, i, j = 1, 2, . . . , n.

(4.4)

Обозначим через Λp диагональную матрицу, на диагонали которой расположены диагональные элементы матрицы Ap. В соответствии с оценками (4.4), а также (11.4), с. 233, можем написать:

|λk(Ap) − λ(kp)| 6 ε, k = 1, 2, . . . , n,

где λ(kp), k = 1, . . . , n, — диагональные элементы матрицы Λp, упорядоченные по неубыванию, λk(Ap) — так же упорядоченные собственные числа матрицы Ap. Вследствие (3.11) имеем Ap = TpT ATp, где Tp = Q0Q1 . . . Qp, т. е. матрицы Ap и A подобны, а, значит, их собственные числа совпадают, поэтому

|λk(A) − λk(p)| 6 ε, k = 1, 2, . . . , n.

(4.5)

Таким образом, выполнив определенное количество итераций, мы получим приближенные значения собственных чисел матрицы A с любой наперед заданной точностью.

2. Применяя метод Якоби для приближенного отыскания собственных чисел и собственных векторов симметричной вещественной матрицы, в формулах (3.1) параметр q следует положить равным единице. Соответственно, в формуле (3.10), нужно заменить |akl| на akl. Все выше полученные оценки при этом сохраняются. Матрица Q, определенная на с. 313, при q = 1 есть матрица, осуществляющая поворот на угол φ в двумерной плоскости, натянутой на векторы ik, il естественного базиса пространства Rn. Поэтому метод Якоби часто называют методом вращений.

Глава 18

Нормы векторов и матриц

§1. Основные неравенства

1.Вещественная функция f вещественной переменной называ-

ется выпуклой на интервале (a, b), если для любых точек x1, x2 из этого интервала и для любого t [0, 1] выполнено неравенство

f(tx1 + (1 − t)x2) 6 tf(x1) + (1 − t)f(x2).

(1.1)

Геометрически это означает, что любая точка графика функции f на отрезке [x1, x2] лежит ниже хорды, стягивающей точки (x1, f(x1)), (x2, f(x2)), или на этой же хорде.

2. Теорема. Пусть функция f непрерывна и дважды непрерывно дифференцируема на интервале (a, b), вторая производная f неотрицательна на интервале (a, b). Тогда f — выпуклая функция на интервале (a, b).

Доказательство. В соответствии с определением выпуклой функции нужно установить, что при любых x1, x2 (a, b) функция φ вещественной переменной t, задаваемая равенством

φ(t) = f(tx1 + (1 − t)x2) − tf(x1) − (1 − t)f(x2)

неположительна для всех t из отрезка [0, 1]. Нетрудно видеть, что

φ(0) = 0, φ(1) = 0, φ′′(t) = f′′(tx1 + (1 − t)x2)(x1 − x2)2 > 0

для всех t [0, 1] Пусть t — произвольным образом фиксированная точка из интервала (0, 1). Используя формулу конечных приращений Лагранжа, получим φ(t) = φ(t) − φ(0) = tφ′(t1), где t1 — некоторая точка из интервала (0, t). Аналогично, φ(t) = −(1 − t)φ′(t2), где t2 — точка из интервала (t, 1). Отсюда, очевидно, следует, что φ(t) = −t(1 −t)(φ′(t2) −φ′(t1)). Вновь применяя формулу Лагранжа, получим, что φ(t) = −t(1 − t)(t2 − t1)φ′′(t3), где t3 (t2, t1). Таким образом, φ(t) 6 0.

3. При помощи теоремы 2 легко доказывается, что функция − ln(x) выпукла на интервале (0, ∞). Поэтому для любых положительных чисел a, b и любых p, q > 1 и таких, что 1/p + 1/q = 1,

ln(ap/p + bq/q) > ln(ap)/p + ln(bq)/q = ln(ab),

318	Глава 18. Нормы векторов и матриц

следовательно, ab 6 ap/p+bq/q. Очевидно, что последнее неравенство верно и при ab = 0. Далее, поскольку |ab| 6 |a||b|, то

|ab| 6 |a|p/p + |b|q/q

(1.2)

для любых, вообще говоря, комплексных чисел a, b. Неравенство (1.2) называют неравенством Юнга1).

4. Теорема	(неравенство					Гёльдера2)). Пусть x, y		Cn,
p > 1, 1/p + 1/q = 1. Тогда					\|xk\|p)1/p ( n		\|yk\|q)1/q .
n	xkyk	6	(	n	\|xk\|p)1/p ( n		\|yk\|q)1/q .	(1.3)
∑				∑		∑


k=1				k=1		k=1

Доказательство. Доказываемое неравенство выполнено, если хотя бы один из векторов x, y равен нулю. Для ненулевых x, y, используя неравенство Юнга, получим при l = 1, 2, . . . , n

|xl|

|yl|

|xl|p

|yl|q .

∑

1/q 6

∑

1/p

(k=1 |xk|p) (k=1 |yk|q)

p k=1 |xk|p

q k=1 |yk|q

Суммируя все эти неравенства, будем иметь

|xk||yk| 6

( n

|xk|p)1/p ( n

|yk|q)1/q ,

∑

∑k

∑

k=1

откуда, очевидно, следует (1.3).

При p = 2 неравенство (1.3) называют неравенством Коши.

5. Теорема (неравенство Минковского). Пусть x, y Cn, p > 1. Тогда

( n	\|xk + yk\|p)1/p	6	( n	\|xk\|p)1/p +	( n	\|yk\|p)1/p . (1.4)
∑k			∑		∑
=1			k=1		k=1

Доказательство. Будем считать x, y такими, что левая часть неравенства (1.4) положительна, так как в противном случае неравенство (1.4) выполняется очевидным образом. Ясно, что

1)Уильям Генри Юнг (William Henry Young; 1863 — 1942) — английский математик. 2)Отто Людвиг Гёльдер (Otto Ludwig H¨older; 1859 — 1937) — немецкий математик.

§ 2. Нормы на пространстве Cn

319

∑k

∑

|xk + yk|p = |xk + yk|p−1|xk + yk| 6

k=1

∑k

∑

|xk + yk|p−1|xk| +

|xk + yk|p−1|yk|.

(1.5)

k=1

Оценим суммы в правой части последнего неравенства, используя

неравенство Гёльдера:

|xk + yk|p−1|xk| 6

( n

|xk + yk|(p−1)q)1/q ( n

|xk|p)1/p ,

(1.6)

∑k

∑

k=1

|xk + yk|p−1|xk| 6

( n

|xk + yk|(p−1)q)1/q ( n

|yk|p)1/p ,

(1.7)

∑

∑k

k=1

где 1/p+1/q = 1 и, следовательно, (p−1)q = p. Поэтому из (1.5)–(1.7)

вытекает, что

xk+yk

(

+ yk

)

(

) (

)

p 6

n xk

p 1/q

1/p +

1/p

∑

∑k

k=1

откуда, учитывая равенство 1 − 1/q = 1/p, получим (1.4).

§2. Нормы на пространстве Cn

1.В этом и последующем параграфах мы будем широко ис-

пользовать понятие сходимости последовательности векторов из пространства Cn, введенное в § 1, гл. 17.

Мы будем рассматривать также в дальнейшем вещественные функции, определенные на Cn, иначе говоря, вещественные функ-

ции n комплексных переменных. При этом, аналогично случаю функции, определенной на Rn (см. курс математического анализа), функция f называется непрерывной в точке x Cn, если из сходимости последовательности {xk} к x вытекает сходимость f(xk) к f(x).

Читатель может без труда убедиться, что все используемые в дальнейшем свойства непрерывных вещественных функций многих

комплексных переменных доказываются точно так же, как и для непрерывных функций на пространстве Rn.

320	Глава 18. Нормы векторов и матриц

2. Наряду с введенным выше понятием длины (или модуля) вектора x Cn во многих случаях оказывается удобным использовать более общее понятие, а именно, понятие нормы вектора.

Будем говорить, что на пространстве Cn введена норма, если каждому вектору x Cn однозначно поставлено в соответствие вещественное число x (читается: норма x). При этом должны быть выполнены следующие условия (аксиомы нормы):

1)x > 0 для любого x Cn, равенства x = 0 и x = 0 эквивалентны;

2)αx = |α|x для любых x Cn, α C;

3)x + y 6 x + y для любых x, y Cn.

Условие 3) обычно называют неравенством треугольника.

Отметим неравенство

4)		x − y		6 x − y x, y Cn,
которое вытекает				из аксиомы 3). В самом деле,

x = x − y + y 6 x − y + y .

Аналогично,

y 6 x − y + x .

Неравенство 4) есть просто более краткая запись этих неравенств.

3. Приведем примеры норм на пространстве Cn.

	n
1) Пусть p > 1. Равенство x p = (k=1 \|xk\|p)1/p		определяет нор-
му. Действительно, аксиомы 1), 2)	выполнены очевидным образом, а
	∑

неравенство 3) при p = 1 непосредственно вытекает из свойств модуля, а при p > 1 совпадает с неравенством Минковского (1.4). Отметим, что x 2 = |x| = (x, x), для любого x Cn, здесь и далее в

этой главе (·, ·) — стандартное скалярное произведение на пространстве Cn.

2) Положим x ∞ = max |xk|. Элементарно проверяется, что это

16k6n

равенство определяет норму.

3) Пусть A — эрмитова положительно определенная матрица. Функция x A = (Ax, x)1/2 есть норма на пространстве Cn. Для обоснования этого факта достаточно вспомнить, что соотношение (x, y)A = (Ax, y) определяет скалярное произведение на пространстве Cn (см. упражнение 1, с. 224, а также п. 3, с. 132).

<<< < Предыдущая 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3132 / 3632 33 34 35 36 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
23.03.20161.13 Mб9Arthur Hailey.doc
#
09.12.2018187.9 Кб4article_1.doc
#
10.02.2015422.21 Кб45Avhadiev_ChMA_1.pdf
#
10.02.2015197.75 Кб6Avtoreferat.docx
#
10.02.2015774.14 Кб40Aziya_Afrika_srednie_veka.doc
#
10.02.20152.75 Mб43A_G_2014.pdf
#
24.09.201918.35 Mб26A_V_Bolshov_Menedzhment_teoria_i_praktika.doc
#
21.11.2018112.13 Кб1B5.doc
#
04.12.2018347.65 Кб2B9.doc
#
13.11.20191.16 Mб4Bagrova_E_A_Menedzhment_Lektsii.doc
#
27.08.20191.44 Mб1Baigiamojo darbo aprašas Akbulatov.doc

\|	kl\| =	i=j \|	a	ij\|	.	(3.7)
a		max	a		.