返回

一、逆矩阵的定义、性质和求法

在数的乘法中 , 对不等于零的数a总存在惟一的数b , 使ab=ba=1

此数b即是a的倒数 , 即b=1a\ \frac{1}{a}\ =a-1

利用倒数 , 数的除法可转化为乘积的形式: x÷a= x ·1a\ \frac{1}{a}\ = x ·\ a-1 , 这里a≠0

把这一思想应用到矩阵的运算中

并注意到单位矩阵E在矩阵的乘法中的作用与数1类似

由此我们引入逆矩阵的定义

定义7对于n阶矩阵A , 如果有一个n阶矩阵B , 使AB=BA=E

则说矩阵A是可逆的 , 并把矩阵B称为A的逆矩阵 , 简称逆阵

如果矩阵A是可逆的 , 那么A的逆矩阵是惟一的 ,

这是因为: 若B、C都是A的逆矩阵 , 则有B=BE=B(AC)=(BA)C=EC=C

所以A的逆矩阵是惟一的.

A的逆矩阵记作A-1 , 即若AB=BA=E , 则B=A-1

定理1若矩阵A可逆 , 则|A|≠0

证: A可逆 , 即有A-1 , 使AA-1=E , 故|AA-1|=|A||A-1|=|E|=1 ,

由|A||A-1|=1,得|A|≠0和|A-1|≠0

所以|A|≠0

定理2若|A|≠0 , 则矩阵A可逆 , 且A-1=1|A|\frac{1}{|A|}\ A* , 其中A*为矩阵A的伴随矩阵

证: 由于AA*=A*A=|A|E , 当|A|≠0时 , 两边同时除以|A|,

得A(1|A|\frac{1}{|A|}\ A*)=(1|A|\frac{1}{|A|}\ A*)A=E

所以A可逆,按逆矩阵的定义 , 若AB=BA=E , 则A-1 =B=1|A|\frac{1}{|A|}\ A*

当|A|=0时 , A称为奇异矩阵 , 当|A|≠0时,A称非奇异矩阵

由上面两定理可知:

A是可逆矩阵的充分必要条件是|A|≠0 , 即可逆矩阵就是非奇异矩阵

推论 若AB=E(或BA=E) , 则B=A-1

证: |A|·|B|=|E|=1,故|A|≠0 , 因而A-1存在

于是B=EB=(A-1A)B=A-1(AB)=A-1E=A-1

逆矩阵满足下述运算规律:

(i)若A可逆 , 则A-1亦可逆 , 且(A-1)-1=A

(ii)若A可逆 , 数λ≠0 , 则λA可逆 , 且(λA)-1=1λ\ \frac{1}{\lambda}\ A-1

(iii)若A、B为同阶矩阵且均可逆 , 则AB亦可逆 , 且(AB)-1=B-1A-1

(iv)若A可逆 , 则A的转置AT亦可逆 , 且(AT)-1=(A-1)T

当A可逆时 , 还可定义A0=E , A-k=(A-1)k , 其中k为正整数

这样 , 当A可逆 , λ , μ为整数时 , 有AλAμ=Aλ+μ , (Aλ)μ=Aλμ

例11求二阶矩阵A=[abcd]\begin{bmatrix} a & b \\ c & d \end{bmatrix}的逆矩阵

解: |A|=ad-bc , A*=[dbca]\begin{bmatrix} d & - b \\ - c & a \end{bmatrix}

当|A|≠0时 , 有A-1=1|A|\frac{1}{|A|}\ A*=1adbc[dbcd]\frac{1}{ad - bc}\ \begin{bmatrix} d & - b \\ - c & d \end{bmatrix}

例12: 求方阵A=[123221343]\begin{bmatrix} 1 & 2 & 3 \\ 2 & 2 & 1 \\ 3 & 4 & 3 \end{bmatrix}的逆矩阵

解:

1.计算行列式det(A)det(A)

按第一行展开:

det(A)=1214322133+32234det(A) = 1 \cdot \begin{vmatrix} 2 & 1 \\ 4 & 3 \end{vmatrix} - 2 \cdot \begin{vmatrix} 2 & 1 \\ 3 & 3 \end{vmatrix} + 3 \cdot \begin{vmatrix} 2 & 2 \\ 3 & 4 \end{vmatrix}

=1(2314)2(2313)+3(2423)= 1 \cdot (2 \cdot 3 - 1 \cdot 4) - 2 \cdot (2 \cdot 3 - 1 \cdot 3) + 3 \cdot (2 \cdot 4 - 2 \cdot 3)

=1(64)2(63)+3(86)= 1 \cdot (6 - 4) - 2 \cdot (6 - 3) + 3 \cdot (8 - 6)

=223+32= 2 - 2 \cdot 3 + 3 \cdot 2

=26+6=2= 2 - 6 + 6 = 2

行列不为0,可逆。

2.计算余子式矩阵

先计算每个元素的余子式MijM_{ij}(即去掉第ii行第jj列后的行列式),

然后Cij=(1)i+jMijC_{ij} = ( - 1)^{i + j}M_{ij}

C11=+2143=64=2C_{11} = + \begin{vmatrix} 2 & 1 \\ 4 & 3 \end{vmatrix} = 6 - 4 = 2

C12=2133=(63)=3C_{12} = - \begin{vmatrix} 2 & 1 \\ 3 & 3 \end{vmatrix} = - (6 - 3) = - 3

C13=+2234=86=2C_{13} = + \begin{vmatrix} 2 & 2 \\ 3 & 4 \end{vmatrix} = 8 - 6 = 2

C21=2343=(612)=(6)=6C_{21} = - \begin{vmatrix} 2 & 3 \\ 4 & 3 \end{vmatrix} = - (6 - 12) = - ( - 6) = 6

C22=+1333=39=6C_{22} = + \begin{vmatrix} 1 & 3 \\ 3 & 3 \end{vmatrix} = 3 - 9 = - 6

C23=1234=(46)=(2)=2C_{23} = - \begin{vmatrix} 1 & 2 \\ 3 & 4 \end{vmatrix} = - (4 - 6) = - ( - 2) = 2

C31=+2321=26=4C_{31} = + \begin{vmatrix} 2 & 3 \\ 2 & 1 \end{vmatrix} = 2 - 6 = - 4

C32=1321=(16)=(5)=5C_{32} = - \begin{vmatrix} 1 & 3 \\ 2 & 1 \end{vmatrix} = - (1 - 6) = - ( - 5) = 5

C33=+1222=24=2C_{33} = + \begin{vmatrix} 1 & 2 \\ 2 & 2 \end{vmatrix} = 2 - 4 = - 2

余子式矩阵为:C=[232662452]C = \begin{bmatrix} 2 & - 3 & 2 \\ 6 & - 6 & 2 \\ - 4 & 5 & - 2 \end{bmatrix}

3.伴随矩阵adj(A)=CT=[264365222]\text{adj}(A) = C^{T} = \begin{bmatrix} 2 & 6 & - 4 \\ - 3 & - 6 & 5 \\ 2 & 2 & - 2 \end{bmatrix}

4.逆矩阵A1=1det(A)adj(A)=12[264365222]=[13232352111]A^{- 1} = \frac{1}{det(A)}\text{adj}(A) = \frac{1}{2}\begin{bmatrix} 2 & 6 & - 4 \\ - 3 & - 6 & 5 \\ 2 & 2 & - 2 \end{bmatrix} = \begin{bmatrix} 1 & 3 & - 2 \\ - \frac{3}{2} & - 3 & \frac{5}{2} \\ 1 & 1 & - 1 \end{bmatrix}

二、逆矩阵的初步应用

例13设A=[123221343]\begin{bmatrix} 1 & 2 & 3 \\ 2 & 2 & 1 \\ 3 & 4 & 3 \end{bmatrix} , B=[2153]\begin{bmatrix} 2 & 1 \\ 5 & 3 \end{bmatrix} , C=[132031]\begin{bmatrix} 1 & 3 \\ 2 & 0 \\ 3 & 1 \end{bmatrix},AXB=C,

求矩阵X,

解: 若A-1 , B-1 存在 , 则用A-1 左乘上式 , B-1 右乘上式

有A-1 AXBB-1 =A-1 CB-1 , 即X=A-1 CB-1

由于|A|=2≠0 , 而|B|=1≠0 , 故知A、B都可逆 , 且

A-1=[264365222]\begin{bmatrix} 2 & 6 & - 4 \\ - 3 & - 6 & 5 \\ 2 & 2 & - 2 \end{bmatrix} , B-1=[3152]\begin{bmatrix} 3 & - 1 \\ - 5 & 2 \end{bmatrix}

于是X=A-1CB-1=[264365222][132031][3152]\begin{bmatrix} 2 & 6 & - 4 \\ - 3 & - 6 & 5 \\ 2 & 2 & - 2 \end{bmatrix}\begin{bmatrix} 1 & 3 \\ 2 & 0 \\ 3 & 1 \end{bmatrix}\begin{bmatrix} 3 & - 1 \\ - 5 & 2 \end{bmatrix}

=[110202][3152]\begin{bmatrix} 1 & 1 \\ 0 & - 2 \\ 0 & 2 \end{bmatrix}\begin{bmatrix} 3 & - 1 \\ - 5 & 2 \end{bmatrix}=[21104104]\begin{bmatrix} - 2 & 1 \\ 10 & - 4 \\ - 10 & 4 \end{bmatrix}

例14 设P=[1214]\begin{bmatrix} 1 & 2 \\ 1 & 4 \end{bmatrix} , Λ=[1002]\begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix} , AP=PΛ , 求An

解: 因为|P|=2 , P-1=12[4211]\frac{1}{2}\begin{bmatrix} 4 & - 2 \\ - 1 & 1 \end{bmatrix}

A=APP-1=PΛP-1 , A2=PΛP-1PΛP-1=PΛ2P-1 , ⋯ , An=PΛnP-1

Λ=[1002]\begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix} , Λ2=[1002][1002]\begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix}\begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix}=[10022]\begin{bmatrix} 1 & 0 \\ 0 & 2^{2} \end{bmatrix} , ⋯ , Λn=[1002n]\begin{bmatrix} 1 & 0 \\ 0 & 2^{n} \end{bmatrix}

所以An=PΛnP-1=[1214][1002n]12[4211]\begin{bmatrix} 1 & 2 \\ 1 & 4 \end{bmatrix}\begin{bmatrix} 1 & 0 \\ 0 & 2^{n} \end{bmatrix}\frac{1}{2}\begin{bmatrix} 4 & - 2 \\ - 1 & 1 \end{bmatrix}=12[12n+112n+2][4211]\frac{1}{2}\begin{bmatrix} 1 & 2^{n + 1} \\ 1 & 2^{n + 2} \end{bmatrix}\begin{bmatrix} 4 & - 2 \\ - 1 & 1 \end{bmatrix}

=12[42n+12n+1242n+22n+22]\frac{1}{2}\begin{bmatrix} 4 - 2^{n + 1} & 2^{n + 1} - 2 \\ 4 - 2^{n + 2} & 2^{n + 2} - 2 \end{bmatrix}=[22n2n122n+12n+11]\begin{bmatrix} 2 - 2^{n} & 2^{n} - 1 \\ 2 - 2^{n + 1} & 2^{n + 1} - 1 \end{bmatrix}

矩阵多项式的定义:

φ(x)=a0+a1x++amxm\varphi(x) = a_{0} + a_{1}x + \cdots + a_{m}x^{m}是变量xx的一个mm次多项式,AA是一个nn阶方阵。

我们定义矩阵AA的多项式φ(A)\varphi(A)为:φ(A)=a0E+a1A++amAm\varphi(A) = a_{0}E + a_{1}A + \cdots + a_{m}A^{m}

其中EEnn阶单位矩阵。

矩阵多项式的运算性质:

由于矩阵的幂AkA^{k}AlA^{l}以及单位矩阵EE之间都是可以交换的(即满足AB=BAAB = BA),

因此矩阵AA的任意两个多项式φ(A)\varphi(A)f(A)f(A)也必然是可交换的:

φ(A)f(A)=f(A)φ(A)\varphi(A)f(A) = f(A)\varphi(A)

基于这一特性,矩阵多项式的运算规则与普通数值多项式基本相同,

可以直接进行乘法运算或因式化。

例如:

(E+A)(2EA)=2E+AA2(E + A)(2E - A) = 2E + A - A^{2}

(EA)3=E3A+3A2A3(E - A)^{3} = E - 3A + 3A^{2} - A^{3}

矩阵多项式的计算方法:

计算矩阵多项式φ(A)\varphi(A)的一个高效方法是利用矩阵的相似对角化。

1.利用对角化计算

如果矩阵AA可对角化,

即存在可逆矩阵PP和对角矩阵Λ=diag(λ1,λ2,,λn)\Lambda = \text{diag}(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}),使得A=PΛP1A = P\Lambda P^{- 1}

那么对于任意正整数kk,有Ak=PΛkP1A^{k} = P\Lambda^{k}P^{- 1}

因此,矩阵多项式可以简化为:φ(A)=Pφ(Λ)P1\varphi(A) = P\varphi(\Lambda)P^{- 1}

其中φ(Λ)=a0E+a1Λ++amΛm\varphi(\Lambda) = a_{0}E + a_{1}\Lambda + \cdots + a_{m}\Lambda^{m}

2.计算对角矩阵的多项式

Λ=diag(λ1,λ2,,λn)\Lambda = \text{diag}(\lambda_{1},\lambda_{2},\cdots,\lambda_{n}),则Λk=diag(λ1k,λ2k,,λnk)\Lambda^{k} = \text{diag}(\lambda_{1}^{k},\lambda_{2}^{k},\cdots,\lambda_{n}^{k})。于是,

φ(Λ)=a0[111]+a1[λ1λ2λn]++am[λ1mλ2mλnm]\begin{aligned} \varphi(\Lambda) & = a_{0}\begin{bmatrix} 1 & & & \\ & 1 & & \\ & & \ddots & \\ & & & 1 \end{bmatrix} + a_{1}\begin{bmatrix} \lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n} \end{bmatrix} + \cdots + a_{m}\begin{bmatrix} \lambda_{1}^{m} & & & \\ & \lambda_{2}^{m} & & \\ & & \ddots & \\ & & & \lambda_{n}^{m} \end{bmatrix} \\ & \end{aligned}

=[φ(λ1)φ(λ2)φ(λn)]= \begin{bmatrix} \varphi(\lambda_{1}) & & & \\ & \varphi(\lambda_{2}) & & \\ & & \ddots & \\ & & & \varphi(\lambda_{n}) \end{bmatrix}

上述结果表明,φ(Λ)\varphi(\Lambda)也是一个对角矩阵,

其第ii个对角元正是多项式函数φ\varphi在特征值λi\lambda_{i}上的值φ(λi)\varphi(\lambda_{i})i=1,2,,ni = 1,2,\cdots,n)。

方法总结

综上所述,当矩阵AA可对角化时,计算其多项式φ(A)\varphi(A)的步骤如下:

1.将对角矩阵Λ\Lambda代入多项式φ\varphi,得到φ(Λ)\varphi(\Lambda),这归结为简单的数值计算。

2.利用公式φ(A)=Pφ(Λ)P1\varphi(A) = P\varphi(\Lambda)P^{- 1}得到最终结果。

这一方法将对高维矩阵的复杂计算,转化为对特征值的标量函数计算,

极大地简化了运算过程。

例15设P=[111102111]\begin{bmatrix} - 1 & 1 & 1 \\ 1 & 0 & 2 \\ 1 & 1 & - 1 \end{bmatrix} , Λ=[123]\begin{bmatrix} 1 & & \\ & 2 & \\ & & - 3 \end{bmatrix} , AP=PΛ

求φ(A)=A3+2A2-3A

解:

AP=PΛAP = P\LambdaA=PΛP1A = P\Lambda P^{- 1}

由矩阵多项式性质有:φ(A)=A3+2A23A=Pφ(Λ)P1\varphi(A) = A^{3} + 2A^{2} - 3A = P\,\varphi(\Lambda)\, P^{- 1}

其中φ(Λ)=Λ3+2Λ23Λ\varphi(\Lambda) = \Lambda^{3} + 2\Lambda^{2} - 3\Lambda 是对角矩阵,对角元为 φ(λi)\varphi(\lambda_{i})

φ(1)=1+23=0\varphi(1) = 1 + 2 - 3 = 0

φ(2)=8+86=10\varphi(2) = 8 + 8 - 6 = 10

φ(3)=27+18+9=0\varphi( - 3) = - 27 + 18 + 9 = 0

φ(Λ)=[0000100000]\varphi(\Lambda) = \begin{bmatrix} 0 & 0 & 0 \\ 0 & 10 & 0 \\ 0 & 0 & 0 \end{bmatrix}

由P=[111102111]P1=16[222303121]\begin{bmatrix} - 1 & 1 & 1 \\ 1 & 0 & 2 \\ 1 & 1 & - 1 \end{bmatrix}得:P^{- 1} = \frac{1}{6}\begin{bmatrix} - 2 & 2 & 2 \\ 3 & 0 & 3 \\ 1 & 2 & - 1 \end{bmatrix}

所以 φ(A)=A3+2A23A=Pφ(Λ)P1\varphi(A) = A^{3} + 2A^{2} - 3A = P\varphi(\Lambda)P^{- 1}

=[111102111][0000100000]16[222303121]= \begin{bmatrix} - 1 & 1 & 1 \\ 1 & 0 & 2 \\ 1 & 1 & - 1 \end{bmatrix}\begin{bmatrix} 0 & 0 & 0 \\ 0 & 10 & 0 \\ 0 & 0 & 0 \end{bmatrix} \cdot \frac{1}{6}\begin{bmatrix} - 2 & 2 & 2 \\ 3 & 0 & 3 \\ 1 & 2 & - 1 \end{bmatrix}

=[111102111][000505000]= \begin{bmatrix} - 1 & 1 & 1 \\ 1 & 0 & 2 \\ 1 & 1 & - 1 \end{bmatrix} \cdot \begin{bmatrix} 0 & 0 & 0 \\ 5 & 0 & 5 \\ 0 & 0 & 0 \end{bmatrix}

=[505000505]= \begin{bmatrix} 5 & 0 & 5 \\ 0 & 0 & 0 \\ 5 & 0 & 5 \end{bmatrix}