Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Matrices

.pdf
Скачиваний:
10
Добавлен:
09.02.2015
Размер:
344.3 Кб
Скачать

нее равен α, например,

M2(3) =

0

3 .

 

1

0

Наконец, через Pij обозначим матрицу, которая получается из единичной перестановкой i-го и j-го столбцов, например, для третьего порядка

P23

=

0

0

1 .

 

 

1

0

0

 

 

0

1

0

Как следует из леммы 3.2, при умножении произвольной матрицы A на матрицу Mij(α) слева, результат отличается от матрицы A только строкой номер i, которая получается в результате поэлементного сложения строки номер i матрицы A и строки номер j этой матрицы, умноженной на число α. Например, умножение произвольной матрицы A с тремя строчками на матрицу M13(−2) слева равносильно прибавлению к каждому элементу первой строки матрицы A соответствующего элемента третьей строки, умноженного на −2. Так, если матрица

A =

4

0

1

,

 

1

2

−1

 

то

2

1

0

 

M13( 2)A =

0

1

0

4

0

1

=

4

0

1 .

 

1

0

−2

1

2

−1

 

−3

0

−1

0

0

1 2

1

0 2

1

0

Точно так же, при умножении A на матрицу Mij(α) справа, результат отличается от матрицы A только j-м столбцом, который получается из j-го столбца матрицы A прибавлением к нему i-го столбца этой матрицы, умноженного на число α.

Итак, умножение произвольной матрицы A на матрицу Mij(α) равносильно применению к матрице A одного из элементарных преобразований. Аналогичные результаты получаются и при умножении на матрицы Mi(α) и Pij: умножение матрицы A на Mi(α) слева равносильно умножению i-й строки матрицы A на число α, а умножение справа равносильно умножению на это число i-го столбца матрицы A. При умножении на Pij слева меняются местами i-я и j-я строки матрицы A, а при умножении справа

– столбцы.

Матрицы Mij(α), Mi(α) и Pij будем называть матрицами элементарных преобразований. Каждое элементарное преобразование над строчками матрицы A можно заменить умножением на одну из этих матриц

8

слева, а преобразования над столбцами – умножением на одну из этих матриц справа.

5. Приведение матрицы к стандартному виду с помощью элементарных преобразований

Будем называть ненулевой элемент строки матрицы ведущим, если среди всех ненулевых элементов этой строки он имеет наименьший второй индекс. Это значит, что он расположен в этой строке левее всех остальных ненулевых элементов (если таковые имеются).

Назовем матрицу стандартной, если ведущий элемент каждой ее строки (начиная со второй) имеет второй индекс, строго больший, чем ведущие элементы всех верхних строк. Таким образом, в стандартной матрице ведущий элемент каждой строки, начиная со второй, расположен строго правее, чем ведущие элементы всех верхних строк. Например, матрица

0

0

6

0

2

 

 

2

4

0

2

−2

 

0

0

0

0

0

 

0

0

0

3

4

 

 

 

 

 

 

 

 

является стандартной.

Замечание 5.1. Отметим, что из определения стандартной матрицы сразу же следует, что все ее ведущие элементы расположены либо на главной диагонали, либо правее нее.

Замечание 5.2. Если стандартная квадратная матрица имеет хотя бы один нулевой элемент на главной диагонали, то она имеет хотя бы одну нулевую строку. Действительно, в этом случае количество ведущих элементов окажется меньше числа столбцов матрицы, а раз матрица квадратная, то меньше и числа строк. Остается заметить, что у стандартной матрицы число ведущих элементов равно числу ненулевых строк.

Теорема 5.1. С помощью элементарных преобразований над строками любую матрицу можно привести к стандартному виду.

Доказательство.

Докажем эту теорему, используя индукцию по числу строк преобразуемой матрицы.

1.Если матрица состоит из одной строки, утверждение теоремы для нее очевидным образом справедливо.

9

2.Предположим, что утверждение теоремы верно для всех матриц, у которых число строк не превосходит m, и докажем, что тогда это утверждение справедливо и для матриц с m + 1 строками.

Отметим в каждой строке матрицы A с m + 1 строками ведущий элемент и выберем ту строку, в которой этот элемент имеет наименьший второй индекс (если таких строк несколько, можно выбрать любую из них). Для простоты обозначений можно считать, что выбрана первая строка (в противном случае можно поменять

местами выбранную строку с первой). Допустим, что a1j – ведущий элемент этой строки.

Если все элементы остальных строк, расположенные в j-м столбце,

равны 0, то матрица A имеет вид

A =

0

. . .

0

a1j . . .

,

0

. . .

0

0 A1

 

 

где A1 – матрица с m строками, количество столбцов которой на j меньше, чем у матрицы A.

По индукционному предположению матрицу A1 можно привести к стандартному виду с помощью элементарных преобразований над строками. Теперь заметим, что при этих преобразованиях никаких изменений в первых j столбцах произойти не может (преобразования задевают только строки, начиная со второй, но все элементы этих строк, расположенные в первых j столбцах, равны 0). Таким образом, матрица A будет преобразована к стандартному виду с помощью элементарных преобразований над строками.

Покажем, что с помощью преобразований над строками каждую матрицу можно привести к виду

0. . . 0 a1j . . .

0. . . 0 0 A1

(возможно, без первых нулевых столбцов). Предположим, что aij 6= 0, вычтем из i-й строки первую строку, умноженную на число

aij . Очевидно, что в результате такого преобразования элемент,

a1j

стоящий в позиции (i, j) станет равным 0. Выполнив аналогичные преобразования над остальными строками, в которых элемент, стоящий в j-м столбце, отличен от 0, мы получим матрицу уже рассмотренного вида.

3.Из пунктов 1 и 2 следует, что утверждение теоремы справедливо для произвольной матрицы A.

10

Рассмотрим пример преобразования матрицы к стандартному виду:

1

−1 1

5

2

0 0

 

1

3

 

0

 

 

 

 

 

 

 

 

 

1

−1 0

2

2

 

 

 

1

−1 0

2

 

2

 

 

 

 

 

 

 

 

 

2

2

1 2

5

0 0

 

1

2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 1

0

1

 

1

 

 

0 0

 

0

1

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 .

 

 

 

 

 

 

 

 

 

 

 

 

0 0

 

1

3

 

0 0 0

1

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

−1

0

2

 

2

 

 

 

 

1

−1

0

2

2

 

 

 

 

 

 

 

 

 

 

 

 

0 0

 

0

1

 

1

0 0

0

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

 

0

1

 

1

 

 

 

 

0

0

0

1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сначала мы выбрали в качестве ведущей первую строку и вычли ее с кэффициентом 1 из второй, прибавили ее к третьей и с коэффициентом 2 вычли из четвертой (поскольку во всех строках данной матрицы первые элементы отличны от 0, то мы могли выбрать для этого любую другую строку). В результате таких преобразований все элементы первого столбца, кроме верхнего, стали равны 0, это завершает первый шаг преобразований.

В полученной матрице надо выбрать ведущие элементы строк, начиная со второй. Ведущие элементы второй и четвертой строк находятся в третьем столбце, а ведущий элемент третьей строки – в четвертом. Поскольку нам нужен самый левый из них, мы выбрали вторую строку (могли выбрать и четвертую). Прибавив вторую строку к четвертой, мы получили под ведущим элементом второй строки только нулевые элементы, на этом завершился второй шаг преобразований.

На следующем шаге мы должны выбрать ведущие элементы третьей и четвертой строк. Они оба расположены в четвертом столбце, следовательно, в качестве ведущей на этом шаге мы можем выбрать любую из этих строк. Вычитая из четвертой строки третью, мы получили 0 под ведущим элементом третьей строки. А поскольку при этом на месте четвертой строки образовалась строка состоящая из одних нулей, и других ненулевых строк в матрице нет, преобразования завершены: мы получили матрицу стандартного вида с тремя ненулевыми строчками. Ведущие элементы этих строк расположены, соответственно, в первом, третьем и четвертом столбцах.

Замечание 5.3. Допустим, что для преобразования матрицы A к стандартной матрице Ak понадобилось выполнить k элементарных преобразований. Рассмотрим C1, C2, C3, . . . Ck – матрицы этих элементарных преобразований (пронумерованные в порядке выполнения преобразований). Поскольку преобразования над строчками равносильны умножению

11

на матрицы элементарных преобразований слева, справедливо равенство A1 = C1A, где A1– матрица, полученная после первого шага преобразований. Продолжая шаг за шагом дальнейшие преобразования, мы придем к равенству Ak = CkCk−1Ck−2 . . . C1A.

В частности, в только что рассмотренном примере из данной матрицы A мы получили матрицу M43(−1)M42(1)M41(−2)M31(1)M21(−1)A.

6. Линейная зависимость и линейная независимость

Определение 6.1. Набор строк A1, A2, . . . , Ak называется линейно зависимым, если можно так подобрать коэффициенты α1, α2, . . . , αk, что линейная комбинация α1A1 + α2A2 + . . . + αkAk равна 0.

Определение 6.2. Набор строк A1, A2, . . . , Ak называется линейно независимым, если из того, что линейная комбинация α1A1 + α2A2 + . . .

. . . + αkAk равна 0, следует, что все коэффициенты α1, α2, . . . , αk равны 0.

Таким образом, любой набор строк либо линейно зависим, либо линейно независим. Аналогично определяется линейная зависимость и линейная независимость столбцов. Перечислим важнейшие свойства линейной зависимости и линейной независимости.

1.Любой набор строк A1, A2, . . . , Ak, содержащий нулевую строку, линейно зависим.

Действительно, если Ai = 0, положим αi = 1, а все осталь-

ные коэффициенты выберем равными 0, тогда α1A1 + α2A2 + . . .

. . . + αkAk = 0.

2.Если к линейно зависимому набору строк добавить одну или несколько строк, новый набор также будет линейно зависим.

Если исходный набор A1, A2, . . . , Ak линейно зависим, для него существует нулевая линейная комбинация с ненулевыми коэффици-

ентами: α1A1 + α2A2 + . . . + αkAk = 0. Добавим к этой комбинации новые строки с нулевыми коэффициентами. Ясно, что равенство при этом сохранится, следовательно, новый набор линейно зависим.

3.Если из линейно независимого набора строк удалить одну или несколько строк, новый набор также будет линейно независим.

Если бы новый набор оказался линейно зависимым, то из свойства 2 следовало бы, что и исходный набор был линейно зависим.

4.Набор строк линейно зависим тогда и только тогда, когда хотя бы одна из строк является линейной комбинацией остальных.

Если, допустим, первая строка является линейной комбинацией остальных: A1 = α2A2 + α3A3 + . . . + αkAk, то после переноса A1

12

в правую часть равенства мы получим нулевую линейную комбинацию, у которой хотя бы один (а именно, первый) коэффициент не равен 0. Аналогично, если набор линейно зависим, то можно подобрать коэффициенты αi, не все равные 0, для которых верно равенство α1A1 + α2A2 + . . .+ αkAk = 0. Предположим для простоты, что отличен от 0 первый коэффициент, тогда A1 представляется в виде линейной комбинации остальных строк.

Мы сформулировали эти свойства для строк, но ясно, что полностью аналогичные утверждения справедливы и для столбцов.

Замечание 6.1. Свойство 4 проясняет смысл термина „линейная зависимость“: в линейно зависимом наборе какие-то элементы выражаются через остальные и, стало быть, зависят от них. В то же время, в линейно независимом наборе ни один элемент не может быть представлен как линейная комбинация других.

Лемма 6.1. Строки стандартной матрицы линейно независимы.

Доказательство.

Обозначим через A1, A2, . . . , Ak строки стандартной матрицы A. Предположим, что строки A1, A2, . . . , Ak линейно зависимы, тогда найдутся такие коэффициенты α1, α2, . . . , αk, что α1A12A2+. . .+αkAk = 0, то есть линейная комбинация этих строк – нулевая строка.

Пусть aiji – ведущий элемент i-й строки. Заметим, что поскольку матрица A – стандартная, то j1 < j2 < . . . < jk. Следовательно, на месте с номером j1 ненулевой элемент есть только в первой строке. Но это значит, что α1 = 0, то есть первая строка в этой линейной комбинации не участвует. В оставшихся строках элементов, у которых второй индекс меньше чем j2, нет, а на месте с этим номером ненулевой элемент есть только во второй строке, следовательно, и α2 = 0. Рассуждая аналогично, приходим к выводу, что все коэффициенты αi равны 0, то есть строки A1, A2, . . . , Ak линейно независимы.

7. Обратная матрица

Определение 7.1. Матрица A−1 называется обратной для матрицы A, если справедливы равенства A · A−1 = A−1 · A = I, где I – единичная матрица.

Если для матрицы A существует обратная, то матрица A называется обратимой. Например, если

1 2 A = 1 1 ,

13

то

 

 

 

A−1 =

−1

2 .

А вот матрица

1

−1

0

0

B =

 

1

2

обратной не имеет: при умножении этой матрицы на любую матрицу справа вторая строка в произведении обязательно будет нулевой, следовательно, это произведение ни при каких условиях не будет единичной матрицей.

Замечание 7.1. Существуют матрицы, для которых выполняется только одно из равенств, указанных в определении 7.1, например,

1

−1

0

1

1

0

=

1

0 ,

1

 

 

−1 ·

1

1

 

0

1

−1

1

1

0

 

 

 

 

 

1

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в то же время произведение этих матриц в обратном порядке просто не существует. В дальнейшем мы покажем, что для квадратных матриц если верно одно равенство, то верно и второе, но пока для того, чтобы установить что матрицы A и B взаимно обратны, нам придется проверять оба равенства.

Укажем простейшие свойства обратной матрицы.

1.Если для матрицы A обратная матрица существует, то она единственна.

Действительно, пусть матрицы B и C обратны матрице A, рассмотрим произведение BAC. С одной стороны, оно равно B(AC) = = BI = B, с другой стороны получаем (BA)C = IC = C, следовательно, матрицы B и C равны между собой.

2.Если матрицы A и B обратимы, то обратима и матрица AB, причем

(AB)−1 = B−1A−1.

Для проверки этого утверждения надо установить два равенства. Первое проверим умножением: ABB−1A−1 = A(BB−1)A−1 = = AIA−1 = AA−1 = I, второе проверяется полностью аналогично.

Лемма 7.1. Все матрицы элементарных преобразований обратимы.

Доказательство.

Это утверждение легко проверяется непосредственными вычислениями. Например, Mij(α) · Mij(−α) = Mij(−α) · Mij(α) = I (поскольку обе

14

матрицы отличаются от единичной только одним элементом, стоящим в i-й строке, достаточно проверить только i-ю строку произведения, например, произведение i-й строки матрицы Mij(α) на j-й столбец матрицы Mij(−α) равно α · 1 + 1 · (−α) = 0). Но можно обойтись и без вычислений: применим к строчкам единичной матрицы I какое-нибудь элементарное преобразование, а потом применим обратное преобразование (то есть, преобразование, которое восстанавливает матрицу I), тогда, как следует из замечания 5.3, I = ABI = AB, где B – матрица исходного преобразования, A – матрица обратного преобразования. По тем же причинам верно равенство I = BAI = BA, то есть, матрицы A и B обратны друг другу.

Следствие 7.1. Любое произведение матриц элементарных преобразований обратимо.

Предположим, что с помощью элементарных преобразований над строчками удалось преобразовать квадратную матрицу A в единичную. Из замечания 5.3 следует равенство I = CkCk−1Ck−2 . . . C1A, где Ck, Ck−1, Ck−2, . . . , C1 – матрицы использованых элементарных преобразований (пронумерованные в порядке выполнения этих преобразований). Если бы мы знали, что матрица A обратима, это означало бы, что A−1 = CkCk−1Ck−2 . . . C1. Но поскольку все матрицы Ci обратимы, мы имеем право умножить полученное равенство слева на Ck−1, затем на Ck11, и так далее. В результате мы получим представление матрицы A в виде произведения матриц элементарных преобразований: A = C1−1C2−1C3−1 . . . Ck, но тогда из свойства 2 обратной матрицы следует, что матрица A тоже обратима.

Это рассуждение подсказывает способ вычисления обратной матрицы с помощью элементарных преобразований: если удается с помощью элементарных преобразований над строчками пребразовать матрицу A в единичную, то произведение матриц этих преобразований, выписанных справа налево в порядке выполнения преобразований, равно матрице A−1. Чтобы строго описать соответствующую процедуру, докажем вспомогательное утверждение.

Лемма 7.2. Если в результате элементарных преобразований над строками в матрице образовалась нулевая строка, эта матрица не имеет обратной.

Доказательство.

Начнем с частного случая: пусть у матрицы A строка с номером i состоит из нулей, тогда из определения умножения матриц следует, что в

15

произведении AB, где B – произвольная матрица, i-я строка также состоит из нулей. Это означает, что такое произведение ни при каких условиях не может быть единичной матрицей, то есть, матрица A не имеет обратной.

Предположим теперь, что в результате элементарных преобразований над строками матрицы A мы получили матрицу B с нулевой строкой. Из 5.3 следует, что B = CA, где C – произведение матриц соответствующих элементарных преобразований. Если бы матрица A была обратима,

то умножив последнее равенство на A−1C−1 справа, мы получили бы:

BA−1C−1 = CAA−1C−1 = C(AA−1)C−1 = CIC−1 = I. Но матрица B, а значит, и произведение BA−1C−1 содержит нулевую строку, следовательно, последнее равенство невозможно, и матрица A не имеет обратной.

Опишем алгоритм вычисления обратной матрицы с помощью элементарных преобразований.

1.Пусть A – квадратная матрица порядка n, припишем к ней рядом единичную матрицу того же порядка (A|I) и выполним над строками этой (расширенной) матрицы элементарные преобразования, приводящие матрицу A к стандартному виду.

2.Если в результате этих преобразований на месте матрицы A получилась матрица с нулевой строкой, то, как следует из леммы 7.2, матрица A обратной не имеет.

3.Если в преобразованной матрице нет нулевых строк, то, как следует из 5.2, все ее диагональные элементы отличны от 0. Разделив каждую строчку на ее ведущий элемент, получим матрицу, у которй все диагональные элементы равны 1.

4.После этого левая половина матрицы легко преобразуется в единичную с помощью элементарных преобразований над строчками.

5.Остается заметить, что матрица, которая получилась в результате этих преобразований в правой половине, равна произведению матриц всех выполненных элементарных преобразований, а мы уже знаем, что это произведение равно A−1.

Рассмотрим пример вычисления обратной матрицы.

2

−1

1

0

1

0 0

1

−3

−2

1

0

 

1

−1

2

 

1

0

0

1

−1 2

 

1

0

0

1

2 0

0

0

1

0

3

2

1

0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

 

0 1 −3

−2

1

0 0

1 −3

−2

 

 

 

1

 

0

 

 

1

−1 2

 

1

0

0

 

 

1

−1 2

 

 

1

 

 

 

0

 

0

 

 

0

0

7

5

3

1

 

 

0

0

 

1

5/7

 

3/7 1/7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1 0

 

 

3/7 6/7

 

2/7

 

 

1

0

 

0

 

 

 

2/7 4/7

1/7

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

3/7 .

0 1

0

1/7 −2/7

 

3/7

1 0

 

1/7 −2/7

 

0

0

1

 

5/7

 

3/7

 

1/7

 

0

0 1

 

 

5/7

3/7

1/7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

−1

2 −1

 

1

 

−2 4

1

2

−1

1

=

 

 

 

 

1

−2

3 .

7

1

2

0

 

 

 

 

 

5

−3

1

На первом шаге мы вычли первую строку с коэффициентом 2 из второй и с коэффициентом 1 из третьей, на втором – вычли вторую строку с коэффициентом 3 из третьей. В результате мы получили треугольную матрицу, у которой на диагонали нет нулевых элементов, следовательно, исходная матрица обратима.

На третьем шаге мы разделили третью строку на 7. После этого остается избавиться от ненулевых элементов выше главной диагонали: прибавляем третью строку с коэффициентом 3 ко второй и вычитаем ее с коэффициентом 2 из третьей. На последнем шаге прибавляем вторую строку к первой. При этом слева получаем единичную матрицу, справа – матрицу, обратную к исходной.

Упражнение 7.1. Проверьте, что полученная матрица действитель-

но обратна матрице

−1

1 .

2

1

−1

2

1

2

0

С помощью элементарных преобразований можно также решать матричные уравнения вида AX = B, где A – обратимая матрица. Составим матрицу (A|B) и с помощью элементарных преобразований над строчками преобразуем матрицу A в единичную. Как мы только что установили, эти преобразования равносильны умножению слева на матрицу A−1. Но мы применяли эти преобразования к длинной строке, следовательно, на A−1 умножена и матрица B. Таким образом, после преобразований в правой половине расширенной матрицы образуется произведение A−1B, которое и является решением уравнения AX = B.

17

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]