返回

一、线性方程组

设有n个未知数m个方程的线性方程组

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\left\{ \begin{array}{r} \begin{matrix} a_{11}x_{1} + a_{12}x_{2} + \cdots + a_{1n}x_{n} = b_{1} \\ a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} = b_{2} \end{matrix} \\ \begin{matrix} \cdots\cdots\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots \\ a_{m1}x_{1} + a_{m2}x_{2} + \cdots + a_{mn}x_{n} = b_{m} \end{matrix} \end{array} \right.\

其中aij是第i个方程的第j个未知数的系数 , bi是第i个方程的常数项

i=1 , 2 , ⋯ , m ; j=1 , 2 , ⋯ , n

当常数项b1 , b2 , ⋯ , bm不全为零时 , 它叫做n元非齐次线性方程组

当常数项b1 , b2 , ⋯ , bm全为零时 , 它叫做n元齐次线性方程组

n元线性方程组往往简称为线性方程组或方程组.

对于n元齐次线性方程组 , 当x1=x2=⋯=xn=0时

这个解叫做齐次线性方程组的零解

如果一组不全为零的数是齐次线性方程组的解

则它叫做齐次线性方程组的非零解

齐次线性方程组一定有零解 , 但不一定有非零解

例如

{xy=0x+y=2①\left\{ \begin{array}{r} x - y = 0 \\ x + y = 2 \end{array} \right.\ {xy=0x+y=1x+y=2\left\{ \begin{array}{r} x - y = 0 \\ x + y = 1 \\ x + y = 2 \end{array} \right.\ {x1x2=02x12x2=03x13x2=0\left\{ \begin{array}{r} x_{1} - x_{2} = 0 \\ 2x_{1} - 2x_{2} = 0 \\ 3x_{1} - 3x_{2} = 0 \end{array} \right.\

是三个二元线性方程组 , 并且③是齐次方程组

下面讨论这三个方程组的解

方程组①: 因其系数行列式D=|1111|0\left| \begin{matrix} 1 & - 1 \\ 1 & 1 \end{matrix} \right| \neq 0 , 知其有惟一解x=y=1

方程组②: 不存在数x和y使x+y=1和x+y=2同时成立 , 故方程组②无解

方程组③: 设s为任一数 , 那么x1=x2=s是③的解 , 故方程组③有无限多个解

这样看来,对于线性方程组需要讨论以下问题:

(1)它是否有解?

(2)在有解时它的解是否惟一?

(3)如果有多个解 , 如何求出它的所有解?

对于非齐次线性方程组 ,

上述诸问题的答案完全取决于它的m×n个系数aij(i=1 , 2 , ⋯ , m ; j=1 , 2 , ⋯ , n)

和右端的常数项b1 , b2 , ⋯ , bm所构成的m行n+1列的矩形数表:

a11a21am1a12a22am2a1na2namnb1b2bm\begin{array}{r} \begin{matrix} a_{11} \\ a_{21} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m1} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{12} \\ a_{22} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m2} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{1n} \\ a_{2n} \end{matrix} \\ \begin{matrix} \vdots \\ a_{mn} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} b_{1} \\ b_{2} \end{matrix} \\ \begin{matrix} \vdots \\ b_{m} \end{matrix} \end{array}

这里横排称为行 , 竖排称为列

而对于齐次线性方程组

相应问题的答案也完全取决于它的m×n个系数aij(i=1 , 2 , ⋯ , m ; j=1 , 2 , ⋯ , n)

所构成的m行n列的矩形数表:

a11a21am1a12a22am2a1na2namn\begin{array}{r} \begin{matrix} a_{11} \\ a_{21} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m1} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{12} \\ a_{22} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m2} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{1n} \\ a_{2n} \end{matrix} \\ \begin{matrix} \vdots \\ a_{mn} \end{matrix} \end{array}

二、矩阵的定义

定义1 由m×n个数aij(i=1 , 2 , ⋯ , m ; j=1 , 2 , ⋯ , n)排成的m行n列的数表

a11a21am1a12a22am2a1na2namn\begin{array}{r} \begin{matrix} a_{11} \\ a_{21} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m1} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{12} \\ a_{22} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m2} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{1n} \\ a_{2n} \end{matrix} \\ \begin{matrix} \vdots \\ a_{mn} \end{matrix} \end{array} 称为m行n列矩阵 , 简称m×n矩阵

为了表示它是一个整体 , 总是加一个括弧 , 并用大写字母表示它

记作A=[a11a21am1a12a22am2a1na2namn]\left\lbrack \begin{array}{r} \begin{matrix} a_{11} \\ a_{21} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m1} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{12} \\ a_{22} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m2} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{1n} \\ a_{2n} \end{matrix} \\ \begin{matrix} \vdots \\ a_{mn} \end{matrix} \end{array} \right\rbrack

这m×n个数称为矩阵A的元素 , 简称为元,

数aij位于矩阵A的第i行第j列 , 称为矩阵A的(i , j)元

以数aij为(i , j)元的矩阵可简记作(aij)或(aij)m×n , m×n矩阵A也记作Am×n

元素是实数的矩阵称为实矩阵 , 元素是复数的矩阵称为复矩阵

除特别说明外 , 一般指实矩阵

行数与列数都等于n的矩阵称为n阶矩阵或n阶方阵 , n阶矩阵A也记作An

只有一行的矩阵称为行矩阵 , 又称行向量 , 记作A=(a1 , a2 , ⋯ , an)

只有一列的矩阵称为列矩阵 , 又称列向量 , 记作A=[b1b2bm]\left\lbrack \begin{array}{r} \begin{matrix} b_{1} \\ b_{2} \end{matrix} \\ \begin{matrix} \vdots \\ b_{m} \end{matrix} \end{array} \right\rbrack

两个矩阵的行数相等、列数也相等时 , 就称它们是同型矩阵

如果A=(aij)与B=(bij)是同型矩阵 , 并且它们的对应元素相等

即aij=bij(i=1 , 2 , ⋯ , m ; j=1 , 2 , ⋯ , n)

那么就称矩阵A与矩阵B相等 , 记作A=B

元素都是零的矩阵称为零矩阵 , 记作O ,

例1对于非齐次线性方程组

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\left\{ \begin{array}{r} \begin{matrix} a_{11}x_{1} + a_{12}x_{2} + \cdots + a_{1n}x_{n} = b_{1} \\ a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} = b_{2} \end{matrix} \\ \begin{matrix} \cdots\cdots\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots \\ a_{m1}x_{1} + a_{m2}x_{2} + \cdots + a_{mn}x_{n} = b_{m} \end{matrix} \end{array} \right.\

有如下几个特殊矩阵:

A=(aij)=[a11a21am1a12a22am2a1na2namn]\left\lbrack \begin{array}{r} \begin{matrix} a_{11} \\ a_{21} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m1} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{12} \\ a_{22} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m2} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{1n} \\ a_{2n} \end{matrix} \\ \begin{matrix} \vdots \\ a_{mn} \end{matrix} \end{array} \right\rbrack , B=[a11a21am1a12a22am2a1na2namnb1b2bm]\left\lbrack \begin{array}{r} \begin{matrix} a_{11} \\ a_{21} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m1} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{12} \\ a_{22} \end{matrix} \\ \begin{matrix} \vdots \\ a_{m2} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{1n} \\ a_{2n} \end{matrix} \\ \begin{matrix} \vdots \\ a_{mn} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} b_{1} \\ b_{2} \end{matrix} \\ \begin{matrix} \vdots \\ b_{m} \end{matrix} \end{array} \right\rbrack

x=[x1x2xm]\left\lbrack \begin{array}{r} \begin{matrix} x_{1} \\ x_{2} \end{matrix} \\ \begin{matrix} \vdots \\ x_{m} \end{matrix} \end{array} \right\rbrack , b=[b1b2bm]\left\lbrack \begin{array}{r} \begin{matrix} b_{1} \\ b_{2} \end{matrix} \\ \begin{matrix} \vdots \\ b_{m} \end{matrix} \end{array} \right\rbrack

其中A称为系数矩阵 , B称为增广矩阵

x称为未知数矩阵 , b称为常数项矩阵

例2某厂向三个商店(编号1 , 2 , 3)发送四种产品(编号I , Ⅱ , Ⅲ , IV)的数量

可列成矩阵

A=123[a11a21a31a12a22a32a13a23a33a14a24a34]A = \begin{matrix} 1 \\ 2 \\ 3 \end{matrix}\ \ \ \left\lbrack \begin{matrix} a_{11} \\ a_{21} \\ a_{31} \end{matrix}\ \ \ \begin{matrix} a_{12} \\ a_{22} \\ a_{32} \end{matrix}\ \ \ \begin{matrix} a_{13} \\ a_{23} \\ a_{33} \end{matrix}\ \ \ \ \begin{matrix} a_{14} \\ a_{24} \\ a_{34} \end{matrix}\ \right\rbrack

其中aij为工厂向第i家商店发送第j种产品的数量

这四种产品的单价及单件质量也可列成矩阵

产品 单价 单件质量

B=IIV[b11b21b31b41b12b22b32b42]B = \begin{array}{r} \begin{matrix} I \\ Ⅱ \end{matrix} \\ \begin{matrix} Ⅲ \\ IV \end{matrix} \end{array}\ \ \ \ \ \left\lbrack \begin{array}{r} \begin{matrix} b_{11} \\ b_{21} \end{matrix} \\ \begin{matrix} b_{31} \\ b_{41} \end{matrix} \end{array}\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \begin{array}{r} \begin{matrix} b_{12} \\ b_{22} \end{matrix} \\ \begin{matrix} b_{32} \\ b_{42} \end{matrix} \end{array} \right\rbrack

其中bi1为第i种产品的单价 , bi2为第i种产品的单件质量

例3 四个城市间的单向航线如图2.1所示

当从i市到j市有1条单向航线 , aij=1

当从i市到j市没有单向航线 , aij=0

则图2.1可用矩阵表示为A=(aij)=[a11a21a31a41a12a22a32a42a13a23a33a43a14a24a34a44]\left\lbrack \begin{array}{r} \begin{matrix} a_{11} \\ a_{21} \end{matrix} \\ \begin{matrix} a_{31} \\ a_{41} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{12} \\ a_{22} \end{matrix} \\ \begin{matrix} a_{32} \\ a_{42} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{13} \\ a_{23} \end{matrix} \\ \begin{matrix} a_{33} \\ a_{43} \end{matrix} \end{array}\ \ \ \ \begin{array}{r} \begin{matrix} a_{14} \\ a_{24} \end{matrix} \\ \begin{matrix} a_{34} \\ a_{44} \end{matrix} \end{array} \right\rbrack=[0101101010011000]\left\lbrack \begin{array}{r} \begin{matrix} 0 \\ 1 \end{matrix} \\ \begin{matrix} 0 \\ 1 \end{matrix} \end{array}\ \ \ \begin{array}{r} \begin{matrix} 1 \\ 0 \end{matrix} \\ \begin{matrix} 1 \\ 0 \end{matrix} \end{array}\ \ \ \begin{array}{r} \begin{matrix} 1 \\ 0 \end{matrix} \\ \begin{matrix} 0 \\ 1 \end{matrix} \end{array}\ \ \ \begin{array}{r} \begin{matrix} 1 \\ 0 \end{matrix} \\ \begin{matrix} 0 \\ 0 \end{matrix} \end{array} \right\rbrack

一般地 , 若干个点之间的单向通道都可用这样的矩阵表示

例4 n个变量x1 , x2 , ⋯ , xn与m个变量y1 , y2 , ⋯ , ym之间的关系式

{y1=a11x1+a12x2++a1nxny2=a21x1+a22x2++a2nxnym=am1x1+am2x2++amnxn\left\{ \begin{array}{r} \begin{matrix} y_{1} = a_{11}x_{1} + a_{12}x_{2} + \cdots + a_{1n}x_{n} \\ y_{2} = a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} \end{matrix} \\ \begin{matrix} \cdots\cdots\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots\cdots \\ y_{m} = a_{m1}x_{1} + a_{m2}x_{2} + \cdots + a_{mn}x_{n} \end{matrix} \end{array} \right.\

表示一个从变量x1 , x2 , ⋯ , xn到变量y1 , y2 , ⋯ , ym的线性变换 , 其中aij为常数

线性变换的系数aij构成矩阵A=(aij)m×n

给定了线性变换 , 它的系数所构成的矩阵(称为系数矩阵)也就确定

反之 , 如果给出一个矩阵作为线性变换的系数矩阵 , 则线性变换也就确定

在这个意义上 , 线性变换和矩阵之间存在着一一对应的关系

例如线性变换{y1=λ1x1y2=λ2x2yn=λnxn\left\{ \begin{array}{r} \begin{matrix} y_{1} = \lambda_{1}x_{1} \\ y_{2} = \lambda_{2}x_{2} \end{matrix} \\ \begin{matrix} \cdots\cdots \\ y_{n} = \lambda_{n}x_{n} \end{matrix} \end{array} \right.\ 对应n阶方阵Λ=[λ1000λ2000λn]\Lambda = \left\lbrack \begin{array}{r} \begin{matrix} \lambda_{1} \\ 0 \end{matrix} \\ \begin{matrix} \vdots \\ 0 \end{matrix} \end{array}\ \ \ \begin{array}{r} \begin{matrix} 0 \\ \lambda_{2} \end{matrix} \\ \begin{matrix} \vdots \\ 0 \end{matrix} \end{array}\ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \begin{array}{r} \begin{matrix} 0 \\ 0 \end{matrix} \\ \begin{matrix} \vdots \\ \lambda_{n} \end{matrix} \end{array} \right\rbrack

这个方阵的特点是: 从左上角到右下角的直线(叫做对角线)以外的元素都是0

这种方阵称为对角矩阵 , 简称对角阵 , 对角阵也记作Λ=diag(λ1 , λ2 , ⋯ , λn)

特别当λ1 = λ2 =⋯ = λn=1时的线性变换叫做恒等变换

它对应的n阶方阵E=[100010001]= \left\lbrack \begin{array}{r} \begin{matrix} 1 \\ 0 \end{matrix} \\ \begin{matrix} \vdots \\ 0 \end{matrix} \end{array}\ \ \ \ \ \begin{array}{r} \begin{matrix} 0 \\ 1 \end{matrix} \\ \begin{matrix} \vdots \\ 0 \end{matrix} \end{array}\ \ \ \ \ \begin{array}{r} \begin{matrix} \cdots \\ \cdots \end{matrix} \\ \begin{matrix} \\ \cdots \end{matrix} \end{array}\ \ \ \ \ \begin{array}{r} \begin{matrix} 0 \\ 0 \end{matrix} \\ \begin{matrix} \vdots \\ 1 \end{matrix} \end{array} \right\rbrack叫做n阶单位矩阵 , 简称单位阵

这个方阵的特点是: 对角线上的元素都是1 , 其他元素都是0

即当i=j时 , 单位阵E的(i , j)元eij为1 , 当i≠j时 , 单位阵E的(i , j)元eij为0

其中i , j=1 , 2 , ⋯ , n

由于矩阵和线性变换之间存在一一对应的关系,

因此可以利用矩阵来研究线性变换 , 也可以利用线性变换来解释矩阵的含义

例如矩阵[1000]\begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix}所对应的线性变换是[1000][xy]=[1x+0y0x+0y]\begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix}\begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} 1 \bullet x + 0 \bullet y\ \\ 0 \bullet x + 0 \bullet y \end{bmatrix}

是xOy平面上把向量OP\overset{⃑}{OP}=[xy]\begin{bmatrix} x \\ y \end{bmatrix}变换为向量OP1\overset{⃑}{OP_{1}}=[x1y1]\begin{bmatrix} x_{1} \\ y_{1} \end{bmatrix}=[x0]\begin{bmatrix} x \\ 0 \end{bmatrix}的变换

(或看作把点P变换为点P1的变换 , 参看图2.2)

由于向量OP1\overset{⃑}{OP_{1}}是向量OP\overset{⃑}{OP}在x轴上的投影向量(即点P1是点P在x轴上的投影)

因此这是一个投影变换

又如矩阵[cosφsinφsinφcosφ]\begin{bmatrix} cos\ \varphi & - sin\varphi \\ sin\ \varphi & cos\ \varphi \end{bmatrix}

对应的线性变换是[cosφsinφsinφcosφ][xy]=[xcosφysinφxsinφ+ycosφ]\begin{bmatrix} cos\ \varphi & - sin\varphi \\ sin\ \varphi & cos\ \varphi \end{bmatrix}\begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} x\ cos\ \varphi - y\ sin\ \varphi \\ x\ sin\ \varphi + y\ cos\varphi \end{bmatrix}

{x1=xcosφysinφy1=xsinφ+ycosφ\Longrightarrow \left\{ \begin{matrix} x_{1} = x\ cos\ \varphi - y\ sin\ \varphi \\ y_{1} = x\ sin\ \varphi + y\ cos\varphi \end{matrix} \right.\

把xOy平面上的向量OP\overset{⃑}{OP}=[xy]\begin{bmatrix} x \\ y \end{bmatrix}变换为向量OP1\overset{⃑}{OP_{1}}=[x1y1]\begin{bmatrix} x_{1} \\ y_{1} \end{bmatrix}

OP\overset{⃑}{OP}的长度为r , 辐角为θ , 即设x=r cos θ , y=r sin θ

那么x1=r(cos φ cos θ - sin φ sin θ)= r cos(θ+φ)

y1=r(sin φ cos θ+cos φ sin θ)=r sin(θ+φ)

表明OP1\overset{⃑}{OP_{1}}的长度为r而辐角为θ+φ

因此 , 这是把向量OP\overset{⃑}{OP}(依逆时针方向)旋转φ角

(即把点P以原点为中心逆时针旋转φ角)的旋转变换(参看图2,3)