做网站设计是什么专业/sem分析是什么意思
向量空间
向量空间的定义
向量空间就是解析几何中的平面向量和空间向量的进一步抽象。回顾解析几何的知识,平面中两个线性无关的向量可以线性表示整个平面上所有的向量,也就是说,对于任意的平面向量vvv及两个线性无关的向量e1,e2e_1,e_2e1,e2,都存在实数x1,x2x_1,x_2x1,x2
v=x1e1+x2e2v=x_1e_1+x_2e_2v=x1e1+x2e2(x1,x2)(x_1,x_2)(x1,x2)称为vvv在e1,e2e_1,e_2e1,e2下的坐标。有了两个线性无关的平面向量,所有平面都和一个实数对一一对应,同样地,所有空间向量都和一个三维实数对具有一一对应的关系。同时,向量的加法(按平行四边形法则)就是实数对各变元相加,向量的数乘就是实数对各变元乘以该实数。我们将这一规则从二、三维推广到n维,就得到n维向量空间。
定义2.1 KKK是一个数域,(x1,x2,⋯,xn)(x_1,x_2,\cdots,x_n)(x1,x2,⋯,xn)的各变元都是KKK中的数,全体这样的nnn元数对构成的集合称为nnn维向量空间
nnn维向量空间实际上就是nnn维空间的一个"点",只不过在二维和三维,我们有明确的几何直观,二维的点就是平面上的一个点或平面上的一个向量,三维的点就是空间上的一个点或空间的一个向量。在超过四维的情况下,我们就无法想象几何上的nnn维向量到底“长成什么样”,不过形式是nnn维实数对。我们规定:nnn维向量空间上的加法为各变元分别相加,数乘为各变元分别乘以该常数。我们就在nnn维向量空间上,建立了两个运算。并且,按照数域的运算性质,容易验证nnn维向量空间有如下的运算性质:
(1)(加法交换律)x1+x2=x2+x1x_1+x_2=x_2+x_1x1+x2=x2+x1
(2)(加法结合律)x1+x2+x3=x1+(x2+x3)x_1+x_2+x_3=x_1+(x_2+x_3)x1+x2+x3=x1+(x2+x3)
(3)(零元)0+x=x0+x=x0+x=x
(4)(存在相反元)x+(−x)=0x+(-x)=0x+(−x)=0
(5)(数乘交换律)(ab)x=a(bx)(ab)x=a(bx)(ab)x=a(bx)
(6)(数乘结合律)(a+b)x=ax+bx(a+b)x=ax+bx(a+b)x=ax+bx
(7)(数乘结合律)a(x1+x2)=ax1+ax2a(x_1+x_2)=ax_1+ax_2a(x1+x2)=ax1+ax2
(8)(单位元)1.x=x1.x=x1.x=x
这样,向量就好像“数”一样与数域中的数一起参与运算,这就启发我们:能运算的,不仅仅只有数,即是是抽象的集合中的元素,也是可以通过定义某种运算,具有某种运算规律,就可以如同数一样进行运算,这样,我们对代数的认识,就从具体,走向抽象,可以认为:抽象,就是现阶段代数的核心!
当然,我们不是为了抽象而进行抽象,向量空间有其明确的几何背景,那就是解析几何中的二维平面向量空间和三维立体几何向量空间,所以,接下来的任务,我们要将平面解析几何和立体解析几何的若干观念,推广到nnn维向量空间当中。
向量空间的结构
接下来,我们将解析几何中的若干观念,推广到nnn维向量空间中去。我们知道,平面解析几何中,两个向量平行,就等价于存在实数kkk,x1=kx2x_1=kx_2x1=kx2,此时
x1−kx2=0x_1-kx_2=0x1−kx2=0两个向量不平行,那么就不存在实数kkk,使得x1=kx2x_1=kx_2x1=kx2,如果假设
k1x1+k2x2=0k_1x_1+k_2x_2=0k1x1+k2x2=0那么,就一定有k1=k2=0k_1=k_2=0k1=k2=0,否则,假设k1≠0k_1\neq 0k1=0,那么
x1=−k2k1x2x_1=-\frac{k_2}{k_1}x_2x1=−k1k2x2如果两个向量不平行,那么,平面上任意向量,都可以表为这两个向量的线性组合。
x=k1x1+k2x2x=k_1x_1+k_2x_2x=k1x1+k2x2对于nnn维向量,同样有线性相关,线性无关,线性组合的概念。
定义2.2 x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm是数域KKK上的nnn维向量空间的一个向量组,k1,⋯,km∈Kk_1,\cdots,k_m\in Kk1,⋯,km∈K,称向量k1x1+k2x2+⋯+kmxmk_1x_1+k_2x_2+\cdots+k_mx_mk1x1+k2x2+⋯+kmxm是x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm的一个线性组合。
定义2.3 x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm是KKK上的nnn维向量空间的一个向量组,如果存在KKK上的一组不全为000的数k1,⋯,km∈Kk_1,\cdots,k_m\in Kk1,⋯,km∈K,使得线性组合
k1x1+k2x2+⋯+kmxm=0k_1x_1+k_2x_2+\cdots+k_mx_m=0k1x1+k2x2+⋯+kmxm=0则称x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm线性相关,否则称x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm线性无关
下面我们给出线性相关和线性无关的一个等价定义
定理2.1 x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm是KKK上的nnn维向量空间的一个向量组,x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm线性相关的充要条件是存在某个向量能被其他向量线性表示
证:
x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm线性相关,则存在不全为000的KKK中的数k1,⋯,kmk_1,\cdots,k_mk1,⋯,km,满足
k1x1+k2x2+⋯+kmxm=0k_1x_1+k_2x_2+\cdots+k_mx_m=0k1x1+k2x2+⋯+kmxm=0不失一般性,不妨设k1≠0k_1\neq 0k1=0,则x1=−1k1[k2x2+⋯+kmxm]x_1=-\frac{1}{k_1}[k_2x_2+\cdots+k_mx_m]x1=−k11[k2x2+⋯+kmxm]
这就说明了,向量组线性相关,就等价于某个向量是"多余"的,体现在该向量能表示成其他向量的线性组合,去掉该向量和保留该向量,前后的向量组是等价的。那么何谓向量组的等价呢?
定义2.4 x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs,y1,⋯,yty_1,\cdots,y_ty1,⋯,yt是KKK上的nnn维向量空间的两个向量组,如果每个xix_ixi都能被y1,⋯,yty_1,\cdots,y_ty1,⋯,yt线性表出,则称x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs能被y1,⋯,yty_1,\cdots,y_ty1,⋯,yt线性表示;如果两个向量组可以相互线性表示,则称两个向量组等价。
容易验证,向量组之间的等价是一个等价关系,即满足自反性,对称性和传递性。容易证明,如果向量组线性相关,去掉能被其他向量线性表示的向量后,两个向量组是等价的,这就足以说明线性相关的原因是因为存在某些多余的向量,剔除掉多余的向量,前后向量组等价。
那么,我们自然联想到,对于线性相关的向量组,我们逐个找到能被其他向量线性表示的向量,予以剔除,直到向量组线性无关,就得到完全没有多余向量的向量组,并且,新的向量组可以线性表出原来线性相关的向量组,就像新的线性无关的向量组就像原来的向量组的一个“不平行的平面向量”一般,通过线性组合就能得到原来的所有向量,这是“基”这个概念的雏形,只不过,在向量组这里,我们称为“极大线性无关组”。
以上过程得到的“极大线性无关组”可能会受到剔除顺序的影响的,不同的剔除顺序得到的极大线性无关组都不同,但是,同一个线性相关向量组通过以上过程得到的极大线性无关组,在向量的数量上是相等的,这就是空间的维度。下面,我们对这里观点进行严格的论证。
为了论述这个结论,我们先讨论齐次方程有非零解的一种特殊情况。
引理2.1 对数域KKK上的齐次线性方程组
{a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
如果n>mn>mn>m,则齐次方程必有非零解
证:
用数学归纳法对mmm进行归纳:
m=1m=1m=1时,如果n≥2n\ge 2n≥2,则方程组等价于1个方程
a11x1+a12x2+⋯+a1nxn=0a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0a11x1+a12x2+⋯+a1nxn=0
如果a11=0a_{11}=0a11=0,那么(1,0,⋯,0)(1,0,\cdots,0)(1,0,⋯,0)即是一组非零解。否则,(a12,−a11,0,⋯,0)(a_{12},-a_{11},0,\cdots,0)(a12,−a11,0,⋯,0)即是一组非零解。
假设m=km=km=k时结论都成立,对k+1k+1k+1个方程,如果n>k+1n>k+1n>k+1,不妨设a11,⋯,am1a_{11},\cdots,a_{m1}a11,⋯,am1不全为0,否则(1,0,⋯,0)(1,0,\cdots,0)(1,0,⋯,0)即是一组非零解。可以通过初等变换,方程等价于
{x1+b12x2+⋯+b1nxn=00x1+b22x2+⋯+b2nxn=0⋯0x1+b(k+1)2x2+⋯+b(k+1)nxn=0\begin{cases} x_1+b_{12}x_2+\cdots+b_{1n}x_n=0\\ 0x_1+b_{22}x_2+\cdots+b_{2n}x_n=0\\ \cdots\\ 0x_1+b_{(k+1)2}x_2+\cdots+b_{(k+1)n}x_n=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧x1+b12x2+⋯+b1nxn=00x1+b22x2+⋯+b2nxn=0⋯0x1+b(k+1)2x2+⋯+b(k+1)nxn=0由归纳假设,方程组
{b22x2+⋯+b2nxn=0⋯b(k+1)2x2+⋯+b(k+1)nxn=0\begin{cases} b_{22}x_2+\cdots+b_{2n}x_n=0\\ \cdots\\ b_{(k+1)2}x_2+\cdots+b_{(k+1)n}x_n=0 \end{cases} ⎩⎪⎨⎪⎧b22x2+⋯+b2nxn=0⋯b(k+1)2x2+⋯+b(k+1)nxn=0存在一组非零解(x20,⋯,xn0)(x_2^0,\cdots,x_n^0)(x20,⋯,xn0),再令x10=−b12x20+⋯−b1nxn0x_1^0=-b_{12}x_2^0+\cdots-b_{1n}x_n^0x10=−b12x20+⋯−b1nxn0 ,这样,(x10,x20,⋯,xn0)(x_1^0,x_2^0,\cdots,x_n^0)(x10,x20,⋯,xn0)就是方程组的一组非零解。
定理2.2 x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs和y1,⋯,yty_1,\cdots,y_ty1,⋯,yt是数域KKK上nnn维向量空间的两个向量组,x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs能被y1,⋯,yty_1,\cdots,y_ty1,⋯,yt线性表出,y1,⋯,yty_1,\cdots,y_ty1,⋯,yt线性无关,s>ts > ts>t,则x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs线性相关
证:
由x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs能被y1,⋯,yty_1,\cdots,y_ty1,⋯,yt线性表出,则存在mnmnmn个KKK中的数kijk_{ij}kij,使得
{x1=k11y1+⋯+k1tytx2=k21y1+⋯+k2tyt⋯xs=ks1y1+⋯+kstyt\begin{cases} x_1=k_{11}y_1+\cdots+k_{1t}y_t\\ x_2=k_{21}y_1+\cdots+k_{2t}y_t\\ \cdots\\ x_s=k_{s1}y_1+\cdots+k_{st}y_t \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧x1=k11y1+⋯+k1tytx2=k21y1+⋯+k2tyt⋯xs=ks1y1+⋯+kstyt令z1,⋯,zs∈Sz_1,\cdots,z_s\in Sz1,⋯,zs∈S,并且
z1x1+z2x2+⋯+zsxs=0z_1x_1+z_2x_2+\cdots+z_sx_s=0z1x1+z2x2+⋯+zsxs=0由y1,⋯,yty_1,\cdots,y_ty1,⋯,yt线性无关,就得到线性方程组
{k11z1+k21z2+⋯+ks1zs=0k12z1+k22z2+⋯+ks2zs=0⋯k1tz1+k2tz2+⋯+kstzs=0\begin{cases} k_{11}z_1+k_{21}z_2+\cdots+k_{s1}z_s=0\\ k_{12}z_1+k_{22}z_2+\cdots+k_{s2}z_s=0\\ \cdots\\ k_{1t}z_1+k_{2t}z_2+\cdots+k_{st}z_s=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧k11z1+k21z2+⋯+ks1zs=0k12z1+k22z2+⋯+ks2zs=0⋯k1tz1+k2tz2+⋯+kstzs=0由于s>ts>ts>t,方程的未知量个数大于方程的个数,那么,方程必有非零解,这就说明了x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs线性相关
推论2.1 x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs和y1,⋯,yty_1,\cdots,y_ty1,⋯,yt是数域KKK上nnn维向量空间的两个线性无关的向量组,并且等价,那么s=ts=ts=t
定义2.5 x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm是数域KKK上nnn维向量空间的一个的向量组,y1,⋯,ysy_1,\cdots,y_sy1,⋯,ys是x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm的一个子向量组,如果满足:
(1)y1,⋯,ysy_1,\cdots,y_sy1,⋯,ys线性无关
(2) x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm可由y1,⋯,ysy_1,\cdots,y_sy1,⋯,ys线性表出
则称y1,⋯,ysy_1,\cdots,y_sy1,⋯,ys是x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm的极大线性无关组
任何向量组的极大线性无关组一定存在,但不唯一,但按照推论\ref{cor1},极大线性无关组的向量个数一定是确定的,称极大线性无关组的向量个数是向量组的秩。
向量组的秩,就如图向量组的维数,规定向量组最少可以由其中多少个向量线性表出。
最后,我们来给出向量组和线性方程组之间的联系。对线性方程组
{a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0
实际上,我们可以表成
x1a1+x2a2+⋯+anxn=0x_1a_1+x_2a_2+\cdots+a_nx_n=0x1a1+x2a2+⋯+anxn=0其中ai=(a1i,⋯,ami)a_i=(a_{1i},\cdots,a_{mi})ai=(a1i,⋯,ami),这样,线性相关就相当以上齐次线性方程组由非零解,线性无关就相当于以上其次线性方程只有零解。
向量组的秩和矩阵的秩
接下来,我们搭起向量组和矩阵之间的桥梁。向量组我们可以写成矩阵的形式,将向量组元素按列排列就是列向量,按行排列就是行向量,那么,任何矩阵都可以视为一个行向量组和列向量组。下面,我们来给出行向量组和列向量组的联系。行向量组的秩称为矩阵的行秩,列向量组的秩为矩阵的列秩
定理2.3 初等行变换不改变矩阵的行秩
证:
设矩阵AAA的行向量组为x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn
交换第iii和jjj行不改变行向量组的构成,交换第iii行和第jjj行后行向量组等价。
将第iii行乘以一个非零常数kkk,则行向量组变为
x1′=x1,⋯,xi−1′=xi−1,xi′=kxi,xi+1′=xi+1,⋯,xn′=xnx_1^\prime=x_1,\cdots,x_{i-1}^\prime=x_{i-1}, x_i^\prime=kx_i,x_{i+1}^\prime=x_{i+1},\cdots,x_n^\prime=x_nx1′=x1,⋯,xi−1′=xi−1,xi′=kxi,xi+1′=xi+1,⋯,xn′=xn{x1=x1′⋯xi−1=xi−1′xi=1kxi′xi+1=xi+1′⋯xn=xn′\begin{cases} x_1 = x_1^\prime \\ \cdots\\ x_{i-1} =x_{i-1}^\prime \\ x_i = \frac{1}{k}x_i^\prime\\ x_{i+1} = x_{i+1}^\prime\\ \cdots\\ x_n= x_n^\prime \end{cases} ⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧x1=x1′⋯xi−1=xi−1′xi=k1xi′xi+1=xi+1′⋯xn=xn′
因此,前后的行向量组等价。
类似地,可以验证将iii行加上第jjj行的kkk倍后,前后的行向量组等价。
因此,初等行变换后矩阵的行向量组都等价,初等行变换不改变矩阵的行秩
当然,初等行变换也不改变矩阵的列秩。
定理2.4 初等行变换不改变矩阵的列秩
证:
设y1,⋯,ymy_1,\cdots,y_my1,⋯,ym是矩阵的列向量组,其极大线性无关组为z1,⋯,zsz_1,\cdots,z_sz1,⋯,zs。
再设zi=(zi1,⋯,zin)z_i=(z_{i1},\cdots,z_{in})zi=(zi1,⋯,zin),那么方程组
{z11x1+z21x2+⋯+zs1xs=0z12x1+z22x2+⋯+zs2xs=0⋯z1nx1+z2nx2+⋯+zsnxs=0\begin{cases} z_{11}x_1+z_{21}x_2+\cdots+z_{s1}x_s = 0\\ z_{12}x_1+z_{22}x_2+\cdots+z_{s2}x_s=0\\ \cdots\\ z_{1n}x_1+z_{2n}x_2+\cdots+z_{sn}x_s=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧z11x1+z21x2+⋯+zs1xs=0z12x1+z22x2+⋯+zs2xs=0⋯z1nx1+z2nx2+⋯+zsnxs=0只有零解,交换两行相当于交换ziz_izi的两个变元,相当于交换方程组的两个方程,某行乘以kkk倍相当于ziz_izi对应变元乘以kkk倍,相当于线性方程组对应行乘以kkk倍,将第jjj行的kkk倍加到第iii行相当于将第jjj个分量的kkk加到第iii个分量,相当于将第jjj个方程的kkk倍加到第iii个方程。
因而初等行变换后不改变极大线性无关组的线性无关性。只要证明变换后得到的z1′,⋯,zs′z_1^\prime,\cdots,z_s^\primez1′,⋯,zs′是y1′,⋯,yn′y_1^\prime,\cdots,y_n^\primey1′,⋯,yn′的极大线性无关组即可。实际上,由于z1,⋯,zsz_1,\cdots,z_sz1,⋯,zs是y1,⋯,yny_1,\cdots,y_ny1,⋯,yn的极大线性无关组,对任意的i=1,⋯,ni=1,\cdots,ni=1,⋯,n,存在KKK中的常数x1,⋯,xsx_1,\cdots,x_sx1,⋯,xs,使得:
yi=x1z1+⋯+xszsy_i=x_1z_1+\cdots+x_sz_syi=x1z1+⋯+xszs设yi=(yi1,⋯,yin)y_i=(y_{i1},\cdots,y_{in})yi=(yi1,⋯,yin),写成线性方程组形式为
{yi1=z11x1+z21x2+⋯+zs1xsyi2=z12x1+z22x2+⋯+zs2xs⋯yin=z1nx1+z2nx2+⋯+zsnxs\begin{cases} y_{i1}=z_{11}x_1+z_{21}x_2+\cdots+z_{s1}x_s\\ y_{i2}=z_{12}x_1+z_{22}x_2+\cdots+z_{s2}x_s\\ \cdots\\ y_{in}=z_{1n}x_1+z_{2n}x_2+\cdots+z_{sn}x_s \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧yi1=z11x1+z21x2+⋯+zs1xsyi2=z12x1+z22x2+⋯+zs2xs⋯yin=z1nx1+z2nx2+⋯+zsnxs初等行变换相当于交换两个方程,某个方程乘以kkk倍,将某个方程的kkk倍加到另一个方程,初等行变换前后方程组都成立,因此,z1′,⋯,zs′z_1^\prime,\cdots,z_s^\primez1′,⋯,zs′是y1′,⋯,yn′y_1^\prime,\cdots,y_n^\primey1′,⋯,yn′的极大线性无关组
推论2.2 初等列变换不改变矩阵的行秩和列秩
我们知道,任何矩阵都可以通过初等行变换化为行阶梯状矩阵。即i≤ri\le ri≤r,第iii行第sis_isi列为111,前面的列为000,后n−rn-rn−r行全为0,并且1≤s1<⋯<sr≤n1\le s_1<\cdots<s_r\le n1≤s1<⋯<sr≤n。再通过初等列变换,可以将矩阵化成如下的形式:
[1⋯0100]\left[ \begin{matrix} 1& & & & & \\ &\cdots& & &0& \\ & & 1 & & & \\ & 0 & & &0& \end{matrix} \right] ⎣⎢⎢⎡1⋯0100⎦⎥⎥⎤以上矩阵称为矩阵的标准型,通过标准型,我们就不难得到
定理2.5 矩阵的行秩和列秩相等
我们就称矩阵的行秩或列秩为矩阵的秩,矩阵AAA的秩记为r(A)r(A)r(A)。以上过程也提供了求解矩阵的秩的方法,就是利用矩阵的初等变换,化为阶梯阵或者标准型。
线性方程组解的结构
对于线性方程组,我们最感兴趣的问题方程组有无解?如果有,有多少解,也就是解的个数。关于这个问题,我们不妨将所有解视为一个空间,考察解空间的结构。
我们先来考察齐次线性方程组的解的结构。对齐次线性方程组
{a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0我们关心的问题是齐次线性方程组是否有非零解。我们将所有的解记成nnn维向量的形式,全体解的集合记为VVV,容易验证:
(1)x1,x2∈Vx_1,x_2\in Vx1,x2∈V,则x1+x2∈Vx_1+x_2\in Vx1+x2∈V
(2)x∈V,k∈Kx\in V,k\in Kx∈V,k∈K,则kx∈Vkx\in Vkx∈V
也就是说,VVV对向量的加法和数乘是封闭的。我们把VVV称为齐次线性方程组的解空间。正如平面上所有向量可由两个不共线的向量线性表出,空间上所有向量可由三个不共面的向量线性表出。解空间也有这么一组基,所有解都可以表为这组基的线性组合。
类似地,我们就猜想VVV是KKK上齐次线性方程组
{a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0的解空间,存在有限个线性无关的解向量τ1,⋯,τs\tau_1,\cdots,\tau_sτ1,⋯,τs,方程组任意解可表为该向量组的唯一的线性组合。
定理2.6 对KKK上齐次线性方程组
{a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+a12x2+⋯+a1nxn=0a21x1+a22x2+⋯+a2nxn=0⋯am1x1+am2x2+⋯+amnxn=0VVV是其解空间,AAA是其系数矩阵,r=r(A)r=r(A)r=r(A),则存在n−rn-rn−r个线性无关的解向量τ1,⋯,τn−r\tau_1,\cdots,\tau_{n-r}τ1,⋯,τn−r,VVV中任意向量可表为τ1,⋯,τn−r\tau_1,\cdots,\tau_{n-r}τ1,⋯,τn−r的线性组合
证:
设a1,⋯,ana_1,\cdots,a_na1,⋯,an是AAA的列向量组。
如果r(A)=nr(A)=nr(A)=n,方程组等价于
x1a1+x2a2+⋯+xnan=0x_1a_1+x_2a_2+\cdots+x_na_n=0x1a1+x2a2+⋯+xnan=0由a1,⋯,ana_1,\cdots,a_na1,⋯,an线性无关,方程组仅有零解。
如果r<nr<nr<n,不妨设a1,⋯,ara_1,\cdots,a_ra1,⋯,ar是a1,⋯,ana_1,\cdots,a_na1,⋯,an的极大线性无关组,那么ar+1,⋯,ana_{r+1},\cdots,a_nar+1,⋯,an能被a1,⋯,ara_1,\cdots,a_ra1,⋯,ar线性表出,设
{ar+1=k11a1+⋯+kr1arar+2=k12a1+⋯+kr2ar⋯an=k1(n−r)a1+⋯+kr(n−r)ar\begin{cases} a_{r+1}=k_{11}a_1+\cdots+k_{r1}a_r\\ a_{r+2}=k_{12}a_1+\cdots+k_{r2}a_r\\ \cdots\\ a_n = k_{1(n-r)}a_1+\cdots+k_{r(n-r)}a_r \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧ar+1=k11a1+⋯+kr1arar+2=k12a1+⋯+kr2ar⋯an=k1(n−r)a1+⋯+kr(n−r)ar代入,就有
∑i=1r(xi+xr+1ki1+⋯+xnki(n−r))ai=0\sum_{i=1}^r{(x_i+x_{r+1}k_{i1}+\cdots+x_nk_{i(n-r)})a_i} =0 i=1∑r(xi+xr+1ki1+⋯+xnki(n−r))ai=0再由a1,⋯,ara_1,\cdots,a_ra1,⋯,ar线性无关,就可以得到方程组{x1+xr+1k11+⋯+xnk1(n−r)=0x2+xr+1k21+⋯+xnk2(n−r)=0⋯xr+xr+1kr1+⋯+xnkr(n−r)=0(1)\tag{1} \begin{cases} x_1+x_{r+1}k_{11}+\cdots+x_nk_{1(n-r)}=0\\ x_2+x_{r+1}k_{21}+\cdots+x_nk_{2(n-r)}=0\\ \cdots\\ x_r+x_{r+1}k_{r1}+\cdots+x_nk_{r(n-r)}=0 \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧x1+xr+1k11+⋯+xnk1(n−r)=0x2+xr+1k21+⋯+xnk2(n−r)=0⋯xr+xr+1kr1+⋯+xnkr(n−r)=0(1)对i=1,⋯,n−ri=1,\cdots,n-ri=1,⋯,n−r,令
τi=(−k1i,⋯,−kri,0,⋯,0,1,0,⋯,0)\tau_i = (-k_{1i},\cdots,-k_{ri},0,\cdots,0,1,0,\cdots,0) τi=(−k1i,⋯,−kri,0,⋯,0,1,0,⋯,0)即第r+ir+ir+i个变元取1,前rrr个变元取(−k1i,⋯,−kri)(-k_{1i},\cdots,-k_{ri})(−k1i,⋯,−kri),其余变元取0。容易验证τ1,⋯,τn−r\tau_1,\cdots,\tau_{n-r}τ1,⋯,τn−r是方程组的解向量,并且线性无关。
任意线性方程组的解必然满足方程组(1)。这样,设(x1,⋯,xr,xr+1,⋯,xn)(x_1,\cdots,x_r,x_{r+1},\cdots,x_n)(x1,⋯,xr,xr+1,⋯,xn)是方程组的解,就有
(x1x2⋯xr)=∑i=1n−rxr+i(−k1i−k2i⋯−kri)\left( \begin{matrix} x_1\\ x_2\\ \cdots\\ x_r \end{matrix} \right)= \sum_{i=1}^{n-r}x_{r+i} \left( \begin{matrix} -k_{1i}\\ -k_{2i}\\ \cdots\\ -k_{ri} \end{matrix} \right) ⎝⎜⎜⎛x1x2⋯xr⎠⎟⎟⎞=i=1∑n−rxr+i⎝⎜⎜⎛−k1i−k2i⋯−kri⎠⎟⎟⎞于是
(x1x2⋯xrxr+1⋯xn)=∑i=1n−rxr+iτi\left( \begin{matrix} x_1\\ x_2\\ \cdots\\ x_r\\ x_{r+1}\\ \cdots\\ x_{n} \end{matrix} \right) = \sum_{i=1}^{n-r}x_{r+i} \tau_i ⎝⎜⎜⎜⎜⎜⎜⎜⎜⎛x1x2⋯xrxr+1⋯xn⎠⎟⎟⎟⎟⎟⎟⎟⎟⎞=i=1∑n−rxr+iτi即任意解向量都可以表为τ1,⋯,τr\tau_1,\cdots,\tau_rτ1,⋯,τr的线性组合
这就证明了基础解系的存在性,并且由基础解系的构造,任意齐次线性方程组任意两个基础解系的向量个数是一致的。并且,由上面的证明过程,我们知道xr+1,⋯,xnx_{r+1},\cdots,x_nxr+1,⋯,xn是可以任取的,取定一组值,x1,⋯,xrx_1,\cdots,x_rx1,⋯,xr随之确定,就得到齐次方程组的一组解,这n−rn-rn−r个元就称为自由变元。总结上面的论述,就有:
定理2.7 齐次线性方程组的系数矩阵为AAA,nnn为未知数个数,r=r(A)r=r(A)r=r(A),则方程组有非零解的充要条件是r<nr<nr<n,并且解空间的维数是n−rn-rn−r
至此,我们完美地解决了齐次线性方程组的求解问题。现在,我们转入到非齐次方程组的求解问题。对非齐次线性方程组
{a11x1+⋯+a1nxn=b1a21x1+⋯+a2nxn=b2⋯am1x1+⋯+amnxn=bm\begin{cases} a_{11}x_1+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1+\cdots+a_{2n}x_n=b_2\\ \cdots\\ a_{m1}x_1+\cdots+a_{mn}x_n=b_m \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a11x1+⋯+a1nxn=b1a21x1+⋯+a2nxn=b2⋯am1x1+⋯+amnxn=bm我们记系数矩阵为AAA,增广矩阵为A‾\overline{A}A。系数矩阵的列向量组为a1,⋯,ana_1,\cdots,a_na1,⋯,an,常数项向量为β\betaβ,方程组就等价于
a1x1+⋯+anxn=βa_1x_1+\cdots+a_nx_n=\betaa1x1+⋯+anxn=β也就是β\betaβ能否被a1,⋯,ana_1,\cdots,a_na1,⋯,an线性表出。
引理2.3 x1,⋯,xm∈Knx_1,\cdots,x_m\in K^nx1,⋯,xm∈Kn是KnK^nKn上线性无关的向量组,βinKn\beta in K^nβinKn,如果x1,⋯,xm,βx_1,\cdots,x_m,\betax1,⋯,xm,β线性相关,则存在唯一的一组k1,⋯,km∈Kk_1,\cdots,k_m\in Kk1,⋯,km∈K,使得
β=k1x1+⋯+kmxm\beta = k_1x_1+\cdots+k_mx_mβ=k1x1+⋯+kmxm
证:
由于x1,⋯,xm,βx_1,\cdots,x_m,\betax1,⋯,xm,β,存在不全为0的一组数k1,⋯,km,km+1k_1,\cdots,k_m,k_{m+1}k1,⋯,km,km+1,使得
k1x1+⋯+kmxm+km+1β=0k_1x_1+\cdots+k_mx_m+k_{m+1}\beta=0k1x1+⋯+kmxm+km+1β=0如果km+1≠0k_{m+1}\neq 0km+1=0,那么k1,⋯,kmk_1,\cdots,k_mk1,⋯,km不全为0,并且
k1x1+⋯+kmxm=0k_1x_1+\cdots+k_mx_m=0k1x1+⋯+kmxm=0与x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm线性无关矛盾,因此km+1≠0k_{m+1}\neq 0km+1=0,即
β=−1km+1k1x1+⋯+kmxm\beta = -\frac{1}{k_{m+1}}{k_1x_1+\cdots+k_mx_m}β=−km+11k1x1+⋯+kmxm这就证明了存在性,再证唯一性,假设
β=k1x1+⋯+kmxm\beta = k_{1}x_1+\cdots+k_mx_mβ=k1x1+⋯+kmxm
β=l1x1+⋯+lmxm\beta = l_1x_1+\cdots+l_mx_mβ=l1x1+⋯+lmxm那么
(k1−l1)x1+⋯+(km−lm)xm=0(k_1-l_1)x_1+\cdots+(k_m-l_m)x_m=0 (k1−l1)x1+⋯+(km−lm)xm=0由x1,⋯,xmx_1,\cdots,x_mx1,⋯,xm线性无关,就有
ki=lii=1,⋯,mk_i=l_i\quad i=1,\cdots,mki=lii=1,⋯,m
定理2.8 非齐次线性方程组的系数矩阵为AAA,增广矩阵为A‾\overline{A}A,则方程组有解的充要条件是r(A)=r(A‾)r(A)=r(\overline{A})r(A)=r(A)
证:
设AAA的列向量组为a1,⋯,ana_1,\cdots,a_na1,⋯,an,常数项向量为β\betaβ
必要性,假设方程组有解,那么β\betaβ能被a1,⋯,ana_1,\cdots,a_na1,⋯,an线性表出,因此,a1,⋯,an,βa_1,\cdots,a_n,\betaa1,⋯,an,β\和a1,⋯,ana_1,\cdots,a_na1,⋯,an等价,从而秩相等,因此r(A)=r(A‾)r(A)=r(\overline{A})r(A)=r(A)
充分性,假设r(A)=r(A‾)r(A)=r(\overline{A})r(A)=r(A),反证法,假设β\betaβ不能被a1,⋯,ana_1,\cdots,a_na1,⋯,an线性表出,设a1′,⋯,as′a_1^\prime,\cdots,a_s^\primea1′,⋯,as′是a1,⋯,ana_1,\cdots,a_na1,⋯,an的极大线性无关组,那么a1′,⋯,as′,βa_1^\prime,\cdots,a_s^\prime,\betaa1′,⋯,as′,β一定线性无关,否则β\betaβ能被a1′,⋯,as′a_1^\prime,\cdots,a_s^\primea1′,⋯,as′线性表出,与假设矛盾,这样
r(A‾)≥r(A)+1>r(A)r(\overline{A})\ge r(A)+1>r(A)r(A)≥r(A)+1>r(A)又与r(A)=r(A‾)r(A)=r(\overline{A})r(A)=r(A)矛盾,矛盾的根源在假设了β\betaβ不能被a1,⋯,ana_1,\cdots,a_na1,⋯,an线性表出,故β\betaβ能被a1,⋯,ana_1,\cdots,a_na1,⋯,an线性表出,齐次线性方程组有解
假设非齐次方程组有解,那么解空间又是何种结构呢?设非齐次线性方程组的解空间是VVV,如果x1∈Vx_1\in Vx1∈V,对任意的x∈Vx\in Vx∈V,x−x1x-x_1x−x1就是齐次方程的解。也就是说,假设τ1,⋯,τn−r\tau_1,\cdots,\tau_{n-r}τ1,⋯,τn−r是齐次方程的基础解系,那么存在c1,⋯,cn−rc_1,\cdots,c_{n-r}c1,⋯,cn−r,使得
x=x1+c1τ1+⋯+cn−rτn−rx=x_1+c_1\tau_1+\cdots+c_{n-r}\tau_{n-r}x=x1+c1τ1+⋯+cn−rτn−r反过来,对任意的常数c1,⋯,cn−rc_1,\cdots,c_{n-r}c1,⋯,cn−r,向量
x1+c1τ1+⋯+cn−rτn−rx_1+c_1\tau_1+\cdots+c_{n-r}\tau_{n-r}x1+c1τ1+⋯+cn−rτn−r必定是非齐次方程的解,也就是说,任何非齐次方程的解等于某个特解+齐次方程的通解。至此,我们已经明晰了非齐次方程和齐次方程解的结构,我们对上面的论述,总结到如下定理:
定理2.9 非齐次线性方程的系数矩阵为AAA,增广矩阵为A‾\overline{A}A,未知数个数为nnn,则
(1)r(A)≠r(A‾)r(A)\neq r(\overline{A})r(A)=r(A)时方程组无解
(2)r(A)=r(A‾)=nr(A)=r(\overline{A})=nr(A)=r(A)=n时,方程组有唯一解
(3)r(A)=r(A‾)<nr(A)=r(\overline{A})<nr(A)=r(A)<n时,方程组有无穷多组解
至此,我们彻底回答了如何求解线性方程组,线性方程组有无解,有多少解的问题。而我们回答这些问题的过程,是借助向量空间而非直接对数的运算进行讨论的,我们也可以看到,方程组有界还是无解的问题,齐次方程有无非零解的问题,本质上是向量空间的向量组线性相关还是线性无关,向量组的秩,以及某个向量能否被系数矩阵向量组线性表示的问题。可见,要解决一个代数方程的问题,我们不一定要直接对数的运算进行讨论。更多的是认清代数方程背后的抽象代数系统的代数结构,这就是代数学的核心与精髓。
矩阵论初步
矩阵的加法和数乘
上一章,我们将矩阵视为向量的组合,这一章,我们把矩阵视为单独的元素,赋予矩阵一些运算,使矩阵也成为一个代数系统。我们将会看到,能"算"的,不仅仅只有数和向量,甚至矩阵也能"算"。
我们记全体KKK上的mmm行nnn列矩阵为Mm,nM_{m,n}Mm,n,定义Mm,nM_{m,n}Mm,n上的加法是对应位置的数相加,即[a11a12⋯a1n⋯⋯⋯⋯am1am2⋯amn]+[b11b12⋯b1n⋯⋯⋯⋯bm1bm2⋯bmn]=[a11+b11a12+b12⋯a1n+b1n⋯⋯⋯⋯am1+bm1am2+bm2⋯amn+bmn]\left[ \begin{matrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{matrix} \right] + \left[ \begin{matrix} b_{11}&b_{12}&\cdots&b_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ b_{m1}&b_{m2}&\cdots&b_{mn} \end{matrix} \right] =\\ \left[ \begin{matrix} a_{11}+b_{11}&a_{12}+b_{12}&\cdots&a_{1n}+b_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{m1}+b_{m1}&a_{m2}+b_{m2}&\cdots&a_{mn}+b_{mn} \end{matrix} \right] ⎣⎡a11⋯am1a12⋯am2⋯⋯⋯a1n⋯amn⎦⎤+⎣⎡b11⋯bm1b12⋯bm2⋯⋯⋯b1n⋯bmn⎦⎤=⎣⎡a11+b11⋯am1+bm1a12+b12⋯am2+bm2⋯⋯⋯a1n+b1n⋯amn+bmn⎦⎤矩阵的数乘定义为k[a11a12⋯a1n⋯⋯⋯⋯am1am2⋯amn]=[ka11ka12⋯ka1n⋯⋯⋯⋯kam1kam2⋯kamn]k\left[ \begin{matrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{matrix} \right] =\left[ \begin{matrix} ka_{11}&ka_{12}&\cdots&ka_{1n}\\ \cdots&\cdots&\cdots&\cdots\\ ka_{m1}&ka_{m2}&\cdots&ka_{mn} \end{matrix} \right] k⎣⎡a11⋯am1a12⋯am2⋯⋯⋯a1n⋯amn⎦⎤=⎣⎡ka11⋯kam1ka12⋯kam2⋯⋯⋯ka1n⋯kamn⎦⎤由数域的运算规律,容易验证,矩阵空间Mm,nM_{m,n}Mm,n也有如下的八条运算规律:
(1)A∈Mm,n,B∈Mm,nA\in M_{m,n},B\in M_{m,n}A∈Mm,n,B∈Mm,n,A+B=B+AA+B=B+AA+B=B+A
(2)A,B,C∈Mm,n,A+B+C=A+(B+C)A,B,C\in M_{m,n},A+B+C=A+(B+C)A,B,C∈Mm,n,A+B+C=A+(B+C)
(3)0+A=A∀A∈Mm,n0+A=A\quad \forall A \in M_{m,n}0+A=A∀A∈Mm,n
(4)−A+A=0∀A∈Mm,n-A+A=0\quad \forall A\in M_{m,n}−A+A=0∀A∈Mm,n
(5)1.A=A∀A∈Mm,n1.A=A\quad \forall A\in M_{m,n}1.A=A∀A∈Mm,n
(6)kl.A=k(lA)∀A∈Mm,n,k,l∈Kkl.A=k(lA) \quad \forall A \in M_{m,n},k,l\in Kkl.A=k(lA)∀A∈Mm,n,k,l∈K
(7)k(A+B)=kA+kB∀k∈K,A,B∈Mm,nk(A+B)=kA+kB\quad \forall k \in K,A,B\in M_{m,n}k(A+B)=kA+kB∀k∈K,A,B∈Mm,n
(8)(k+l)A=kA+lA∀k,l∈K,A∈Mm,n(k+l)A=kA+lA\quad \forall k,l\in K,A\in M_{m,n}(k+l)A=kA+lA∀k,l∈K,A∈Mm,n
矩阵在这个层面上运算性质和向量相类似。
矩阵的乘法
接下来我们引入矩阵的乘法。我们先引入线性变换的概念,只不过在这里我们是狭义的线性变换,对nnn维向量(x1,⋯,xn)(x_1,\cdots,x_n)(x1,⋯,xn),我们可以通过变换
{y1=a11x1+⋯+a1nxn⋯ym=am1x1+⋯+amnxn\begin{cases} y_1 = a_{11}x_1+\cdots+a_{1n}x_n\\ \cdots\\ y_m = a_{m1}x_1+\cdots+a_{mn}x_n \end{cases} ⎩⎪⎨⎪⎧y1=a11x1+⋯+a1nxn⋯ym=am1x1+⋯+amnxn将其变换为mmm维向量,我们姑且称为线性变换。矩阵
A=[a11⋯a1n⋯⋯⋯am1⋯amn]A=\left[ \begin{matrix} a_{11}&\cdots&a_{1n}\\ \cdots&\cdots&\cdots\\ a_{m1}&\cdots&a_{mn} \end{matrix} \right] A=⎣⎡a11⋯am1⋯⋯⋯a1n⋯amn⎦⎤就称为线性变换的矩阵,我们再将(y1,⋯,ym)(y_1,\cdots,y_m)(y1,⋯,ym)通过线性变换,变换为(z1,⋯,zk)(z_1,\cdots,z_k)(z1,⋯,zk),线性变换矩阵为
B=[b11⋯b1m⋯⋯⋯bk1⋯bkm]B=\left[ \begin{matrix} b_{11}&\cdots&b_{1m}\\ \cdots&\cdots&\cdots\\ b_{k1}&\cdots&b_{km} \end{matrix} \right] B=⎣⎡b11⋯bk1⋯⋯⋯b1m⋯bkm⎦⎤两个线性变换的复合,也是线性变换,我们代入验证就可以说明这点:zi=bi1y1+⋯+bimym=bi1(a11x1+⋯+a1nxn)+⋯+bim(am1x1+⋯+amnxn)=(∑s=1mbisas1)x1+⋯+(∑s=1mbisasn)xnz_i = b_{i1}y_1+\cdots+b_{im}y_m\\ =b_{i1}(a_{11}x_1+\cdots+a_{1n}x_n)+ \cdots+ b_{im}(a_{m1}x_1+\cdots+a_{mn}x_n)\\ =(\sum_{s=1}^m{b_{is}a_{s1}})x_1+\cdots+ (\sum_{s=1}^m{b_{is}a_{sn}})x_n zi=bi1y1+⋯+bimym=bi1(a11x1+⋯+a1nxn)+⋯+bim(am1x1+⋯+amnxn)=(s=1∑mbisas1)x1+⋯+(s=1∑mbisasn)xn其中:1≤i≤k1\le i \le k1≤i≤k,两个线性变换的复合还是线性变换,矩阵为
[∑s=1mb1sas1⋯∑s=1mb1sasn⋯⋯⋯∑s=1mbksas1⋯∑s=1mbksasn]\left[ \begin{matrix} \sum_{s=1}^m{b_{1s}a_{s1}}&\cdots&\sum_{s=1}^m{b_{1s}a_{sn}}\\ \cdots&\cdots&\cdots\\ \sum_{s=1}^m{b_{ks}a_{s1}}&\cdots&\sum_{s=1}^m{b_{ks}a_{sn}} \end{matrix} \right] ⎣⎡∑s=1mb1sas1⋯∑s=1mbksas1⋯⋯⋯∑s=1mb1sasn⋯∑s=1mbksasn⎦⎤
我们就定义这个矩阵是AAA和BBB的乘积,下面我们给出一个正式的定义:
定义2.6 A=(aij)A=(a_{ij})A=(aij)是KKK上的n×mn\times mn×m矩阵,B=(bij)B=(b_{ij})B=(bij)是KKK上的m×km\times km×k矩阵,定义AAA和BBB的乘积为
AB=[∑s=1mb1sas1⋯∑s=1mb1sasn⋯⋯⋯∑s=1mbksas1⋯∑s=1mbksasn]AB=\left[ \begin{matrix} \sum_{s=1}^m{b_{1s}a_{s1}}&\cdots&\sum_{s=1}^m{b_{1s}a_{sn}}\\ \cdots&\cdots&\cdots\\ \sum_{s=1}^m{b_{ks}a_{s1}}&\cdots&\sum_{s=1}^m{b_{ks}a_{sn}} \end{matrix} \right]AB=⎣⎡∑s=1mb1sas1⋯∑s=1mbksas1⋯⋯⋯∑s=1mb1sasn⋯∑s=1mbksasn⎦⎤
与数域乘法不同的是,矩阵的乘法,没有交换律,这是很明显的一个事实,因为ABABAB有意义,BABABA不一定有意义,即使两者都有意义,也不一定相等。下面我们来验证矩阵乘法的一些运算规律。
(1)A∈Mn,m,B,C∈Mm,s,A(B+C)=AB+ACA\in M_{n,m},B,C\in M_{m,s},A(B+C)=AB+ACA∈Mn,m,B,C∈Mm,s,A(B+C)=AB+AC
(2)A,B∈Mn,m,C∈Mm,s,(A+B)C=AC+BCA,B\in M_{n,m},C\in M_{m,s},(A+B)C=AC+BCA,B∈Mn,m,C∈Mm,s,(A+B)C=AC+BC
(3)A∈Mn,m,B∈Mm,s,k∈K,kAB=(kA)B=A(kB)A\in M_{n,m},B\in M_{m,s},k\in K,kAB = (kA)B=A(kB)A∈Mn,m,B∈Mm,s,k∈K,kAB=(kA)B=A(kB)
(4)A∈Mn,t,B∈Mt,k,C∈Mk,m,ABC=A(BC)A\in M_{n,t},B\in M_{t,k},C\in M_{k,m} ,ABC=A(BC)A∈Mn,t,B∈Mt,k,C∈Mk,m,ABC=A(BC)
我们仅验证(1)(4),(2)(3)的验证和(1)类似,这里省略
设A=(aij)A=(a_{ij})A=(aij),B=(bij),C=(cij)B=(b_{ij}),C=(c_{ij})B=(bij),C=(cij),则
B+C=(bij+cij)B+C=(b_{ij}+c_{ij})B+C=(bij+cij)因此,设
A(B+C)=(dij)A(B+C)=(d_{ij})A(B+C)=(dij)则
dij=∑s=1mais(bsj+csj)=∑s=1maisbsj+∑s=1maiscsjd_{ij}=\sum_{s=1}^m{a_{is}(b_{sj}+c_{sj})}= \sum_{s=1}^m{a_{is}b_{sj}}+\sum_{s=1}^m{a_{is}c_{sj}}dij=s=1∑mais(bsj+csj)=s=1∑maisbsj+s=1∑maiscsj
因此,A(B+C)=AB+ACA(B+C)=AB+ACA(B+C)=AB+AC
(4)设A=(aij),B=(bij),C=(cij)A=(a_{ij}),B=(b_{ij}),C=(c_{ij})A=(aij),B=(bij),C=(cij)
AB=(∑s1=1tais1bs1j)AB=(\sum_{s_1=1}^t{a_{is_1}b_{s_1j}})AB=(s1=1∑tais1bs1j)于是(AB)C=(∑s2=1k(∑s1=1tais1bs1s2)cs2j)=(∑s2=1k∑s1=1t(ais1bs1s2cs2j))=(∑s1=1t∑s2=1k(ais1bs1s2cs2j))=(∑s1=1t[ais1∑s2=1kbs1s2cs2j])(AB)C = (\sum_{s_2=1}^k(\sum_{s_1=1}^t{a_{is_1}b_{s_1s_2}})c_{s_2j}) =(\sum_{s_2=1}^k\sum_{s_1=1}^t(a_{is_1}b_{s_1s_2}c_{s_2j}))\\ =(\sum_{s_1=1}^t\sum_{s_2=1}^k(a_{is_1}b_{s_1s_2}c_{s_2j})) =(\sum_{s_1=1}^t[a_{is_1}\sum_{s_2=1}^kb_{s_1s_2}c_{s_2j}]) (AB)C=(s2=1∑k(s1=1∑tais1bs1s2)cs2j)=(s2=1∑ks1=1∑t(ais1bs1s2cs2j))=(s1=1∑ts2=1∑k(ais1bs1s2cs2j))=(s1=1∑t[ais1s2=1∑kbs1s2cs2j])而
BC=(∑s2=1kbs1s2cs2j)BC = (\sum_{s_2=1}^kb_{s_1s_2}c_{s_2j}) BC=(s2=1∑kbs1s2cs2j)故
(AB)C=A(BC)(AB)C=A(BC)(AB)C=A(BC)这说明了矩阵乘法有结合律。
有了矩阵的乘法,我们就可以用矩阵乘法的形式,表示线性方程组,对于线性方程组
{a11x1+⋯+a1nxn=b1⋯am1x1+⋯+amnxn=bm\begin{cases} a_{11}x_1+\cdots+a_{1n}x_n=b_1\\ \cdots\\ a_{m1}x_1+\cdots+a_{mn}x_n=b_m \end{cases} ⎩⎪⎨⎪⎧a11x1+⋯+a1nxn=b1⋯am1x1+⋯+amnxn=bm系数矩阵的为AAA,未知量矩阵是x1,⋯,xnx_1,\cdots,x_nx1,⋯,xn组成的列向量,记为xxx,常数项矩阵是b1,⋯,bmb_1,\cdots,b_mb1,⋯,bm组成的列向量,记为bbb,则方程组就可以用组成表示为
Ax=bAx=bAx=b线性变换又可以表示为
y=Axy=Axy=Ax这也就不难理解为什么线性变换的复合的矩阵是矩阵的乘法了。这是因为,对于另一个线性变换
z=Byz=Byz=By就有
z=By=B(Ax)=(BA)xz=By=B(Ax)=(BA)xz=By=B(Ax)=(BA)x
接下来,我们要给出矩阵乘法和初等变换之间的关系。对角元全为1,其他全为0的nnn阶方阵称为nnn阶单位矩阵,记为InI_nIn,交换InI_nIn的i,ji,ji,j两列或i,ji,ji,j两列得到的矩阵记为En(i,j)E_n(i,j)En(i,j),设En(i,j)=(ekt)E_n(i,j)=(e_{kt})En(i,j)=(ekt),则
ekt={1k=t≠i,j1k=i,t=j1k=j,t=i0otherwisee_{kt}=\begin{cases} 1 & k=t\neq i,j\\ 1 & k=i,t=j\\ 1 & k=j,t=i\\ 0 & otherwise \end{cases}ekt=⎩⎪⎪⎪⎨⎪⎪⎪⎧1110k=t=i,jk=i,t=jk=j,t=iotherwise对m×nm\times nm×n矩阵AAA,就有
Em(i,j)A=(∑s=1neksast)E_m(i,j)A=(\sum_{s=1}^n{e_{ks}a_{st}})Em(i,j)A=(s=1∑neksast)注意到k≠i,jk\neq i,jk=i,j时
∑s=1neksast=akt\sum_{s=1}^n{e_{ks}a_{st}}=a_{kt}s=1∑neksast=akt∑s=1neisast=ajt\sum_{s=1}^n{e_{is}a_{st}}=a_{jt}s=1∑neisast=ajt∑s=1nejsast=ait\sum_{s=1}^n{e_{js}a_{st}}=a_{it}s=1∑nejsast=ait可见:Em(i,j)AE_m(i,j)AEm(i,j)A相当于交换AAA的i,ji,ji,j两行,同理可以验证AEn(i,j)AE_n(i,j)AEn(i,j)相当于交换AAA的i,ji,ji,j两列。
令En(i:k)E_n(i:k)En(i:k)是InI_nIn的第iii行(或第i列)乘以kkk倍,其中k≠0k\neq 0k=0,AAA左乘Em(i:k)E_m(i:k)Em(i:k)相当于AAA的第iii行乘以kkk倍,右乘En(i:k)E_n(i:k)En(i:k)相当于AAA的第iii列乘以kkk倍
令En(i,j:k)E_n(i,j:k)En(i,j:k)为InI_nIn的第iii行的kkk倍加到第jjj行,左乘Em(i,j:k)E_m(i,j:k)Em(i,j:k),相当于将AAA的第iii行的kkk倍加到第jjj行,右乘En(i,j:k)E_n(i,j:k)En(i,j:k)相当于把AAA的第iii列加到第jjj列。
我们称以上三种类型的矩阵为初等矩阵,就有:
(1)初等行变换相当于左乘相应的初等矩阵
(2)初等列变换相当于右乘相应的初等矩阵
这样,我们就把初等变换和矩阵乘法联系起来了。
矩阵的转置
m×nm\times nm×n矩阵A=(aij)A=(a_{ij})A=(aij)的转置定义为n×mn\times mn×m矩阵(aji)(a_{ji})(aji),记为ATA^TAT。显然,矩阵的转置只是改变矩阵的形状,原来的行向量组变为转置矩阵的列向量组,原来的列向量组变为转置矩阵的行向量组,因而,矩阵的转置不改变矩阵的秩。即r(A)=r(AT)r(A)=r(A^T)r(A)=r(AT)下面,我们来验证转置矩阵的相关性质:
(1)A,B∈Mm,n,(A+B)T=AT+BTA,B\in M_{m,n}, (A+B)^T=A^T+B^TA,B∈Mm,n,(A+B)T=AT+BT
(2)A∈Mm,n,(kA)T=kATA\in M_{m,n},(kA)^T=kA^TA∈Mm,n,(kA)T=kAT
(3)A∈Mm,t,B∈Mt,n,(AB)T=BTATA\in M_{m,t},B\in M_{t,n}, (AB)^T=B^TA^TA∈Mm,t,B∈Mt,n,(AB)T=BTAT
(1)(2)是显然的,我们仅验证(3):
设A=(aij),B=(bij)A=(a_{ij}),B=(b_{ij})A=(aij),B=(bij),则
AB=(∑s=1taisbsj)AB=(\sum_{s=1}^t{a_{is}b_{sj}})AB=(s=1∑taisbsj)设
AT=(aji)=(cij),BT=(bji)=(dij)A^T=(a_{ji})=(c_{ij}),B^T=(b_{ji})=(d_{ij})AT=(aji)=(cij),BT=(bji)=(dij)因此
(AB)T=(∑s=1tajsbsi)=(∑s=1tcsjdis)=BTAT(AB)^T=(\sum_{s=1}^t{a_{js}b_{si}})= (\sum_{s=1}^t{c_{sj}d_{is}})=B^TA^T(AB)T=(s=1∑tajsbsi)=(s=1∑tcsjdis)=BTAT
方阵的逆矩阵
方阵的逆矩阵和"数"的逆元是类似的。在数域上有"1"这个数,我们把全体nnn阶方阵记为MnM_nMn,则InI_nIn在MnM_nMn中充当的作用就相当于"1"在数域中充当的作用,即对任意的A∈MnA\in M_nA∈Mn,都有AIn=InA=AAI_n=I_nA=AAIn=InA=A。在数域上有倒数的概念,在MnM_nMn中的倒数就是所谓的逆矩阵。
定义2.7 A∈MnA\in M_nA∈Mn,如果存在B∈MnB\in M_nB∈Mn,使得
AB=InAB=I_nAB=In则称AAA为可逆矩阵,或非奇异矩阵,BBB称为AAA的逆矩阵,记为A−1A^{-1}A−1,否则称AAA为不可逆矩阵,或奇异矩阵
满足什么条件nnn阶方阵可逆呢?我们假设逆矩阵A−1A^{-1}A−1存在,记其列向量组为b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn,记eie_iei为第iii个变元为1,其他变元为0的列向量,就有以下nnn个方程组:
Abi=ei(i=1,⋯,n)Ab_i=e_i(i=1,\cdots,n)Abi=ei(i=1,⋯,n)存在矩阵BBB使得AB=InAB=I_nAB=In的充要条件是以上nnn个方程组都有解。满足什么条件就会有以上nnn个方程组都有解呢?如果r(A)=nr(A)=nr(A)=n,那么以上nnn个方程组增广矩阵的秩一定等于nnn,nnn个方程组都有解,如果r=r(A)<nr=r(A)<nr=r(A)<n,设AAA的行向量组为β1,⋯,βn\beta_1,\cdots,\beta_nβ1,⋯,βn,不妨设β1,⋯,βr\beta_1,\cdots,\beta_rβ1,⋯,βr是行向量组的极大线性无关组。则第nnn个方程的增广矩阵可表为
[β10β20⋯βn−10βn1]\left[ \begin{matrix} \beta_1&0\\ \beta_2&0\\ \cdots\\ \beta_{n-1}&0\\ \beta_n&1 \end{matrix} \right] ⎣⎢⎢⎢⎢⎡β1β2⋯βn−1βn0001⎦⎥⎥⎥⎥⎤由于β1,⋯,βr\beta_1,\cdots,\beta_rβ1,⋯,βr是极大线性无关组,则βr+1,⋯,βn\beta_{r+1},\cdots,\beta_nβr+1,⋯,βn可由β1,⋯,βr\beta_1,\cdots,\beta_rβ1,⋯,βr线性表出,那么,就可以通过初等行变换,将增广矩阵化为
[β10⋯βr000⋯0001]\left[ \begin{matrix} \beta_1&0\\ \cdots\\ \beta_r&0\\ 0&0\\ \cdots\\ 0&0\\ 0&1 \end{matrix} \right] ⎣⎢⎢⎢⎢⎢⎢⎢⎢⎡β1⋯βr0⋯0000001⎦⎥⎥⎥⎥⎥⎥⎥⎥⎤这说明r(A‾)=r(A)r(\overline{A})=r(A)r(A)=r(A),也就是说存在某个方程组无解,AAA一定不可逆。这样,我们就得到了AAA可逆的一个充要条件r(A)=nr(A)=nr(A)=n。同时由上面的论述,逆矩阵的每个列向量都是某个方程的解,并且,每个方程都只有唯一解,因此,逆矩阵也是唯一的
定理2.10 nnn阶方阵AAA可逆的充要条件是r(A)=nr(A)=nr(A)=n,并且逆矩阵若存在,必唯一
定理2.11 nnn阶方阵AAA可逆,则A=(A−1)−1A=(A^{-1})^{-1}A=(A−1)−1
也就是AAA和A−1A^{-1}A−1互为逆矩阵。为了证明这个定理,我们首先给出一个引理:
引理2.2 初等矩阵的都是可逆矩阵,并且
En−1(i,j)=En(i,j)E_n^{-1}(i,j)=E_n(i,j)En−1(i,j)=En(i,j)En−1(i:k)=En(i:1k)(k≠0)E_n^{-1}(i:k)=E_n(i:\frac{1}{k})(k\neq 0)En−1(i:k)=En(i:k1)(k=0)En−1(i,j:k)=En(i,j:−k)E_n^{-1}(i,j:k)=E_n(i,j:-k)En−1(i,j:k)=En(i,j:−k)
同时
En−1(i,j)En(i,j)=InE_n^{-1}(i,j)E_n(i,j)=I_nEn−1(i,j)En(i,j)=InEn(i:1k)En−1(i:k)=InE_n(i:\frac{1}{k})E_n^{-1}(i:k)=I_nEn(i:k1)En−1(i:k)=InEn(i,j:−k)En−1(i,j:k)=InE_n(i,j:-k)E_n^{-1}(i,j:k)=I_nEn(i,j:−k)En−1(i,j:k)=In
这个引理直接验证即可
引理2.3 可逆矩阵可经过有限步初等列变换化为单位矩阵
证:
用数学归纳法证明:
对一阶方阵A=(a11)A=(a_{11})A=(a11),AAA可逆的充要条件是a11≠0a_{11}\neq 0a11=0,故只要除以a11a_{11}a11,就能化为单位矩阵。
假设kkk阶可逆方阵都可以经过有限步初等列变换化为单位矩阵,考虑k+1k+1k+1阶可逆方阵
A=[a11a12⋯a1ka1(k+1)a21a22⋯a2ka2(k+1)⋯a(k+1)1a(k+1)2⋯a(k+1)ka(k+1)(k+1)]A= \left[ \begin{matrix} a_{11}&a_{12}&\cdots&a_{1k}&a_{1(k+1)}\\ a_{21}&a_{22}&\cdots&a_{2k}&a_{2(k+1)}\\ \cdots\\ a_{(k+1)1}&a_{(k+1)2}&\cdots&a_{(k+1)k}&a_{(k+1)(k+1)} \end{matrix} \right] A=⎣⎢⎢⎡a11a21⋯a(k+1)1a12a22a(k+1)2⋯⋯⋯a1ka2ka(k+1)ka1(k+1)a2(k+1)a(k+1)(k+1)⎦⎥⎥⎤
那么a11,⋯,a1(k+1)a_{11},\cdots,a_{1(k+1)}a11,⋯,a1(k+1)必定不全为0,否则r(A)≠k+1r(A)\neq k+1r(A)=k+1。第一列除以a11a_{11}a11,再第iii列加上第1列的−a1i-a_{1i}−a1i倍,将矩阵化为
A2[10⋯0b21b22⋯b2(k+1)⋯b(k+1)1b(k+1)2⋯b(k+1)(k+1)]A_2 \left[ \begin{matrix} 1&0&\cdots&0\\ b_{21}&b_{22}&\cdots&b_{2(k+1)}\\ \cdots\\ b_{(k+1)1}&b_{(k+1)2}&\cdots&b_{(k+1)(k+1)} \end{matrix} \right] A2⎣⎢⎢⎡1b21⋯b(k+1)10b22b(k+1)2⋯⋯⋯0b2(k+1)b(k+1)(k+1)⎦⎥⎥⎤再令
B=[b22⋯b2(k+1)⋯b(k+1)2⋯b(k+1)(k+1)]B=\left[ \begin{matrix} b_{22}&\cdots&b_{2(k+1)}\\ \cdots\\ b_{(k+1)2}&\cdots&b_{(k+1)(k+1)} \end{matrix} \right] B=⎣⎡b22⋯b(k+1)2⋯⋯b2(k+1)b(k+1)(k+1)⎦⎤则BBB一定可逆,否则r(A)<k+1r(A)<k+1r(A)<k+1,则由归纳假设,可以仅仅通过对A2A_2A2后kkk列进行初等列变换,将A2A_2A2化为
A3=[10⋯0b211b311⋯b(k+1)11]A_3=\left[ \begin{matrix} 1&0&\cdots&&0\\ b_{21}&1&&&\\ b_{31}&&1&&\\ \cdots\\ b_{(k+1)1}&&&&1 \end{matrix} \right] A3=⎣⎢⎢⎢⎢⎡1b21b31⋯b(k+1)101⋯101⎦⎥⎥⎥⎥⎤
A3A_3A3的第111列加上第iii列的−bi1-b_{i1}−bi1倍即可将A3A_3A3化为单位矩阵(i=2,⋯,k+1)(i=2,\cdots,k+1)(i=2,⋯,k+1)
由数学归纳法,结论成立
引理2.4 任何可逆矩阵都可表为有限个初等矩阵的乘积
证:
设AAA可逆,则r(A)=nr(A)=nr(A)=n,则AAA可以经过有限步初等列变换化为InI_nIn,也就是说,存在初等矩阵E1,⋯,EmE_1,\cdots,E_mE1,⋯,Em,使得
AE1⋯Em=InAE_1\cdots E_m=I_nAE1⋯Em=In于是
A=Em−1⋯E1−1A=E_m^{-1}\cdots E_1^{-1}A=Em−1⋯E1−1E1−1,⋯,Em−1E_1^{-1},\cdots,E_m^{-1}E1−1,⋯,Em−1都是初等矩阵
下面证明定理2.11:
证:
由AAA可逆,存在有限个初等矩阵E1,⋯,EmE_1,\cdots,E_mE1,⋯,Em,使得A=E1⋯EmA=E_1\cdots E_mA=E1⋯Em因此
E1⋯EmA−1=InE_1\cdots E_mA^{-1} = I_nE1⋯EmA−1=In于是,就有
A−1=Em−1⋯E1−1A^{-1}=E_m^{-1}\cdots E_1^{-1}A−1=Em−1⋯E1−1因此
A−1A=Em−1⋯E1−1E1⋯Em=InA^{-1}A=E_m^{-1}\cdots E_1^{-1} E_1 \cdots E_m=I_nA−1A=Em−1⋯E1−1E1⋯Em=In第二个等号是通过重复使用矩阵乘法的结合律得到的
这样,逆矩阵实际上就是MnM_nMn上的一种运算,下面,我们给出逆运算和矩阵乘法
定理2.12 A,BA,BA,B都是nnn阶可逆方阵,则ABABAB也可逆,并且
(AB)−1=B−1A−1(AB)^{-1}=B^{-1}A^{-1}(AB)−1=B−1A−1
证:
要证明ABABAB可逆,只需要证明齐次方程组ABx=0ABx=0ABx=0只有零解,实际上,由AAA可逆,故方程组
Ay=0Ay=0Ay=0只有零解,于是
Bx=0Bx=0Bx=0而BBB可逆,故x=0x=0x=0,因此ABABAB可逆,同时
ABB−1A−1=A(BB−1)A−1=AA−1=InABB^{-1}A^{-1}=A(BB^{-1})A^{-1}=AA^{-1}=I_nABB−1A−1=A(BB−1)A−1=AA−1=In因此
(AB)−1=B−1A−1(AB)^{-1}=B^{-1}A^{-1}(AB)−1=B−1A−1
定理2.13 AAA是nnn阶可逆方阵,则ATA^TAT也可逆,并且
(AT)−1=(A−1)T(A^T)^{-1}=(A^{-1})^T(AT)−1=(A−1)T
证:
由于转置不改变矩阵的秩,因此ATA^TAT也可逆。同时
AT(A−1)T=(A−1A)T=InT=InA^T(A^{-1})^T=(A^{-1}A)^T=I_n^T=I_nAT(A−1)T=(A−1A)T=InT=In
我们再回到线性方程组求解的问题上,AAA是nnn阶方阵,如果AAA可逆,那么对于任意的b∈Knb\in K^nb∈Kn,方程组
Ax=bAx=bAx=b两边左乘A−1A^{-1}A−1,就可以求得方程组的解
x=A−1bx=A^{-1}bx=A−1b这是方程组解的矩阵表示。
矩阵的运算与矩阵的秩
本节,我们来讨论矩阵的加法、数乘、乘法和矩阵的秩的关系。在这之前,我们先给出一个简单的命题。
命题2.1 x1,⋯,xn,y1,⋯,ym∈Knx_1,\cdots,x_n,y_1,\cdots,y_m\in K^nx1,⋯,xn,y1,⋯,ym∈Kn,如果
x1,⋯,xnx_1,\cdots,x_nx1,⋯,xn能被y1,⋯,ymy_1,\cdots,y_my1,⋯,ym线性表示,那么x=(x1,⋯,xn)x=(x_1,\cdots,x_n)x=(x1,⋯,xn)的秩不超过y=(y1,⋯,ym)y=(y_1,\cdots,y_m)y=(y1,⋯,ym)的秩
证:
设x1,⋯,xrx_1,\cdots,x_rx1,⋯,xr为xxx的极大线性无关组,y1,⋯,ysy_1,\cdots,y_sy1,⋯,ys是yyy的极大线性无关组。则x1,⋯,xrx_1,\cdots,x_rx1,⋯,xr能被y1,⋯,ysy_1,\cdots,y_sy1,⋯,ys线性表示,r≤sr\le sr≤s
定理2.14 A,B∈Mm,nA,B\in M_{m,n}A,B∈Mm,n,则
r(A+B)≤r(A)+r(B)r(A+B)\le r(A)+r(B)r(A+B)≤r(A)+r(B)
证:
设a1,⋯,ana_1,\cdots,a_na1,⋯,an是AAA的列向量组,b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn是BBB的列向量组,则
a1+b1,⋯,an+bna_1+b_1,\cdots,a_n+b_na1+b1,⋯,an+bn是A+BA+BA+B的列向量组,则该向量组能被
a1,⋯,an,b1,⋯,bna_1,\cdots,a_n,b_1,\cdots,b_na1,⋯,an,b1,⋯,bn线性表示,而设a1,⋯,ara_1,\cdots,a_ra1,⋯,ar是AAA的列极大线性无关组,b1,⋯,bsb_1,\cdots,b_sb1,⋯,bs是BBB的列极大线性无关组,因此
r(A+B)≤r(a1,⋯,an,b1,⋯,bn)r(A+B)\le r(a_1,\cdots,a_n,b_1,\cdots,b_n)r(A+B)≤r(a1,⋯,an,b1,⋯,bn)
r(a1,⋯,an,b1,⋯,bn)≤r(a1,⋯,ar,b1,⋯,bs)≤r+sr(a_1,\cdots,a_n,b_1,\cdots,b_n)\le r(a_1,\cdots,a_r,b_1,\cdots,b_s)\le r+sr(a1,⋯,an,b1,⋯,bn)≤r(a1,⋯,ar,b1,⋯,bs)≤r+s
定理2.15 A∈Mm,k,B∈Mk,nA\in M_{m,k},B\in M_{k,n}A∈Mm,k,B∈Mk,n,则
r(AB)≤min(r(A),r(B))r(AB)\le \min(r(A),r(B))r(AB)≤min(r(A),r(B))
证:
设BBB的列向量组为b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn,极大线性无关组为b1′,⋯,br′b_1^\prime,\cdots,b_r^\primeb1′,⋯,br′,则ABABAB的列向量组为Ab1,⋯,AbnAb_1,\cdots,Ab_nAb1,⋯,Abn,那么
Ab1,⋯,AbnAb_1,\cdots,Ab_nAb1,⋯,Abn能被
Ab1′,⋯,Abr′Ab_1^\prime,\cdots,Ab_r^\primeAb1′,⋯,Abr′线性表示,因此
r(AB)≤r(B)r(AB)\le r(B)r(AB)≤r(B)设AAA的行向量组为a1,⋯,ama_1,\cdots,a_ma1,⋯,am,极大线性无关组为a1′,⋯,as′a_1^\prime,\cdots,a_s^\primea1′,⋯,as′,则ABABAB的行向量组为a1B,⋯,amBa_1B,\cdots,a_mBa1B,⋯,amB,那么
a1B,⋯,amBa_1B,\cdots,a_mBa1B,⋯,amB能被
a1′B,⋯,as′Ba_1^\prime B,\cdots,a_s^\prime Ba1′B,⋯,as′B线性表示,因此
r(AB)≤r(A)r(AB)\le r(A)r(AB)≤r(A)
定理2.16 A∈Mm,n,B∈Mn,tA\in M_{m,n},B\in M_{n,t}A∈Mm,n,B∈Mn,t,则
r(AB)≥r(A)+r(B)−nr(AB)\ge r(A)+r(B)-nr(AB)≥r(A)+r(B)−n
证:
设BBB的列向量组为b1,⋯,btb_1,\cdots,b_tb1,⋯,bt,r1=r(B)r_1=r(B)r1=r(B),那么Ab1,⋯,AbtAb_1,\cdots,Ab_tAb1,⋯,Abt是ABABAB的列向量组,再设Ab1′,⋯,Abr1′Ab_1^\prime,\cdots,Ab_{r_1}^\primeAb1′,⋯,Abr1′是Ab1,⋯,AbtAb_1,\cdots,Ab_tAb1,⋯,Abt的极大线性无关组,于是,AbiAb_iAbi能被Ab1′,⋯,Abr1′Ab_1^\prime,\cdots,Ab_{r_1}^\primeAb1′,⋯,Abr1′线性表示。设
Abi=ki1Ab1′+⋯+kir1Abr1′Ab_i = k_{i1}Ab_1^\prime+\cdots+k_{ir_1}Ab_{r_1}^\primeAbi=ki1Ab1′+⋯+kir1Abr1′则bi−ki1b1′+⋯−kir1br1′b_i-k_{i1}b_1^\prime+\cdots-k_{ir_1}b_{r_1}^\primebi−ki1b1′+⋯−kir1br1′是齐次方程组Ay=0Ay=0Ay=0的解,设P1,⋯,Pr2P_1,\cdots,P_{r_2}P1,⋯,Pr2是其基础解系,则
bi=ki1b1′+kir1br1′+ki1′P1+⋯+kir2′Pr2b_i=k_{i1}b_1^\prime+k_{ir_1}b_{r_1}^\prime+k_{i1}^\prime P_1+\cdots+k_{ir_2}^\prime P_{r_2}bi=ki1b1′+kir1br1′+ki1′P1+⋯+kir2′Pr2因此
r(B)≤r(AB)+n−r(A)r(B)\le r(AB)+n-r(A)r(B)≤r(AB)+n−r(A)
向量空间的基与基变换
本节的最后,我们来补充向量空间上的基和基变换的相关理论。我们知道在平面上任意两个线性无关的向量可以线性表示平面上所有向量,空间上任意三个线性无关的向量可以线性表示空间上所有的向量,当然,这对于nnn维向量空间也是成立的。
定理2.17 KnK^nKn上任意nnn个线性无关的向量可以唯一线性表示KnK^nKn的所有向量
证:
对任意的β∈Kn\beta\in K^nβ∈Kn,a1,⋯,ana_1,\cdots,a_na1,⋯,an是KnK^nKn中nnn个线性无关的向量,β\betaβ能被\a1,⋯,ana_1,\cdots,a_na1,⋯,an,等价于方程组
a1x1+⋯+anxn=βa_1x_1+\cdots+a_nx_n=\betaa1x1+⋯+anxn=β有解,并且表示的系数是方程组的解,令A=(a1,⋯,an)A=(a_1,\cdots,a_n)A=(a1,⋯,an),方程组等价于
Ax=βAx=\betaAx=β则由于r(A)=nr(A)=nr(A)=n,因此,AAA可逆,并且
x=A−1βx=A^{-1}\betax=A−1β方程组有解并且解是唯一的
现在我们有两组基a1,⋯,ana_1,\cdots,a_na1,⋯,an和b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn,由于b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn是KnK^nKn的一组基,那么a1,⋯,ana_1,\cdots,a_na1,⋯,an能被b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn唯一线性表示,令
{a1=k11b1+⋯+k1nbn⋯an=kn1b1+⋯+knnbn\begin{cases} a_1 = k_{11}b_1+\cdots+k_{1n}b_n\\ \cdots\\ a_n=k_{n1}b_1+\cdots+k_{nn}b_n \end{cases} ⎩⎪⎨⎪⎧a1=k11b1+⋯+k1nbn⋯an=kn1b1+⋯+knnbn则
(a1,⋯,an)=(b1,⋯,bn)[k11⋯kn1⋯⋯⋯k1n⋯knn](a_1,\cdots,a_n)=(b_1,\cdots,b_n)\left[ \begin{matrix} k_{11}&\cdots&k_{n1}\\ \cdots&\cdots&\cdots\\ k_{1n}&\cdots&k_{nn} \end{matrix} \right] (a1,⋯,an)=(b1,⋯,bn)⎣⎡k11⋯k1n⋯⋯⋯kn1⋯knn⎦⎤令K=[k11⋯kn1⋯⋯⋯k1n⋯knn]K=\left[ \begin{matrix} k_{11}&\cdots&k_{n1}\\ \cdots&\cdots&\cdots\\ k_{1n}&\cdots&k_{nn} \end{matrix} \right]K=⎣⎡k11⋯k1n⋯⋯⋯kn1⋯knn⎦⎤KKK称为基变换矩阵,给定一组基b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn,对任意x∈Knx\in K^nx∈Kn,都存在x1,⋯,xnx_1,\cdots,x_nx1,⋯,xn,x=x1b1+⋯+xnbnx=x_1b_1+\cdots+x_nb_nx=x1b1+⋯+xnbn。(x1,⋯,xn)(x_1,\cdots,x_n)(x1,⋯,xn)称为xxx在基b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn下的坐标。假设KKK是b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn到a1,⋯,ana_1,\cdots,a_na1,⋯,an的基变换矩阵,x∈Knx\in K^nx∈Kn,在b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn下坐标向量为yyy,在a1,⋯,ana_1,\cdots,a_na1,⋯,an下坐标向量为zzz,则令B=(b1,⋯,bn),A=(a1,⋯,an)B=(b_1,\cdots,b_n),A=(a_1,\cdots,a_n)B=(b1,⋯,bn),A=(a1,⋯,an),就有
B=AKB=AKB=AKx=By=AKy=Azx=By=AKy=Azx=By=AKy=Az由坐标的唯一性Ky=zKy=zKy=z因此,左乘KKK就能将b1,⋯,bnb_1,\cdots,b_nb1,⋯,bn下的坐标转换为a1,⋯,ana_1,\cdots,a_na1,⋯,an下的坐标,这就是KnK^nKn下的坐标变换公式
分块矩阵的乘法及求逆
分块矩阵是常用的计算矩阵的手法。所谓分块就是将矩阵划分为若干块,每一块都是一个子矩阵,即
A=[A11A12⋯A1nA21A22⋯A2n⋯⋯⋯⋯Am1Am2⋯Amn]A=\left[ \begin{matrix} A_{11}&A_{12}&\cdots&A_{1n}\\ A_{21}&A_{22}&\cdots&A_{2n}\\ \cdots&\cdots&\cdots&\cdots\\ A_{m1}&A_{m2}&\cdots&A_{mn} \end{matrix} \right] A=⎣⎢⎢⎡A11A21⋯Am1A12A22⋯Am2⋯⋯⋯⋯A1nA2n⋯Amn⎦⎥⎥⎤其中AijA_{ij}Aij是mi×njm_i\times n_jmi×nj矩阵,那么AAA就是M=∑i=1mmiM=\sum_{i=1}^m{m_i}M=∑i=1mmi行N=∑j=1nniN=\sum_{j=1}^n{n_i}N=∑j=1nni列矩阵,对矩阵进行分块之后,求矩阵的乘法,我们就可以利用各个击破的方法,再设
B=[B11B12⋯B1t⋯⋯⋯⋯Bn1Bn2⋯Bnt]B=\left[ \begin{matrix} B_{11}&B_{12}&\cdots&B_{1t}\\ \cdots&\cdots&\cdots&\cdots\\ B_{n1}&B_{n2}&\cdots&B_{nt} \end{matrix} \right] B=⎣⎡B11⋯Bn1B12⋯Bn2⋯⋯⋯B1t⋯Bnt⎦⎤其中BijB_{ij}Bij是ni×tjn_i\times t_jni×tj矩阵,那么,就有
AB=[∑s=1nA1sBs1∑s=1nA1sBs2⋯∑s=1nA1sBst⋯⋯⋯⋯∑s=1nAmsBs1∑s=1nAmsBs2⋯∑s=1nAmsBst]AB=\left[\begin{matrix} \sum_{s=1}^n{A_{1s}B_{s1}}&\sum_{s=1}^n{A_{1s}B_{s2}}&\cdots&\sum_{s=1}^n{A_{1s}B_{st}}\\ \cdots&\cdots&\cdots&\cdots\\ \sum_{s=1}^n{A_{ms}B_{s1}}&\sum_{s=1}^n{A_{ms}B_{s2}}&\cdots&\sum_{s=1}^n{A_{ms}B_{st}} \end{matrix}\right]AB=⎣⎡∑s=1nA1sBs1⋯∑s=1nAmsBs1∑s=1nA1sBs2⋯∑s=1nAmsBs2⋯⋯⋯∑s=1nA1sBst⋯∑s=1nAmsBst⎦⎤这是因为,设AB=(cij)AB=(c_{ij})AB=(cij),cijc_{ij}cij只与AAA中iii行所在行有交集的块以及BBB中jjj列有交集的块有关,再经过形式复杂但比较初等的验证之后就有以上的结论。对角矩阵即形如
[a1a2⋯an]\left[\begin{matrix} a_1\\ &a_2\\ &&\cdots\\ &&&a_n \end{matrix}\right] ⎣⎢⎢⎡a1a2⋯an⎦⎥⎥⎤的矩阵,记为diag(a1,⋯,an)diag(a_1,\cdots,a_n)diag(a1,⋯,an),单位矩阵就是一种特殊的对角矩阵,如果a1,⋯,an≠0a_1,\cdots,a_n\neq 0a1,⋯,an=0,那么其逆矩阵就是
diag(a1−1,⋯,an−1)diag(a_1^{-1},\cdots,a_n^{-1})diag(a1−1,⋯,an−1)类似地,我们可以将对角矩阵推广成准对角矩阵
[A1A2⋯An]\left[\begin{matrix} A_1\\ &A_2\\ &&\cdots\\ &&&A_n \end{matrix}\right] ⎣⎢⎢⎡A1A2⋯An⎦⎥⎥⎤只不过这里AiA_iAi是nin_ini阶的可逆方阵,同样地,其逆矩阵为
[A1−1A2−1⋯An−1]\left[ \begin{matrix} A_1^{-1}\\ &A_2^{-1}\\ &&\cdots\\ &&&A_n^{-1} \end{matrix} \right] ⎣⎢⎢⎡A1−1A2−1⋯An−1⎦⎥⎥⎤对于准对角矩阵
[A1A2⋯An]\left[\begin{matrix} A_1\\ &A_2\\ &&\cdots\\ &&&A_n \end{matrix}\right] ⎣⎢⎢⎡A1A2⋯An⎦⎥⎥⎤其秩就等于∑i=1nr(Ai)\sum_{i=1}^n{r(A_i)}∑i=1nr(Ai)这样,分块之后,求秩和求逆矩阵就可以逐个击破,分别求解。
定理2.18 给定数域KKK上的分块矩阵
M=[AC0B]M= \left[ \begin{matrix} A&C\\ 0&B \end{matrix} \right] M=[A0CB]有r(A)+r(B)≤r(M)r(A)+r(B) \le r(M)r(A)+r(B)≤r(M)
证:
设AAA的列向量组为a1,⋯,asa_1,\cdots,a_sa1,⋯,as,CCC的列向量组为c1,⋯,ctc_1,\cdots,c_tc1,⋯,ct,BBB的列向量组为b1,⋯,btb_1,\cdots,b_tb1,⋯,bt,则MMM的列向量组为
d1,⋯,ds,ds+1,⋯,ds+td_1,\cdots,d_s,d_{s+1},\cdots,d_{s+t}d1,⋯,ds,ds+1,⋯,ds+t其中
di=[ai0](i=1,⋯,s)d_i = \left[ \begin{matrix} a_i\\ 0 \end{matrix} \right](i=1,\cdots,s) di=[ai0](i=1,⋯,s)ds+i=[cibi](i=1,⋯,t)d_{s+i}=\left[ \begin{matrix} c_{i}\\ b_{i} \end{matrix} \right](i=1,\cdots,t) ds+i=[cibi](i=1,⋯,t)设a1,⋯,asa_1,\cdots,a_sa1,⋯,as的极大线性无关组为an1,⋯,anr1a_{n_1},\cdots,a_{n_{r_1}}an1,⋯,anr1
,b1,⋯,btb_1,\cdots,b_tb1,⋯,bt的极大线性无关组为bm1,⋯,bmr2b_{m_1},\cdots,b_{m_{r_2}}bm1,⋯,bmr2。\
则dn1,⋯,dnr1,ds+m1,⋯,ds+mr2d_{n_1},\cdots,d_{n_{r_1}},d_{s+m_1},\cdots,d_{s+m_{r_2}}dn1,⋯,dnr1,ds+m1,⋯,ds+mr2也是线性无关的,
并且能被d1,⋯,ds+td_1,\cdots,d_{s+t}d1,⋯,ds+t线性表示,因此
r(M)≥r1+r2=r(A)+r(B)r(M)\ge r_1+r_2=r(A)+r(B)r(M)≥r1+r2=r(A)+r(B)