矩阵
定义
由m×n个数aij(i=1,2,…,m;j=1,2,…n)排成的m行n列的数表
A=a11a21⋮am1a12a22⋮am2……⋱…a1na2n⋮amn
称为m×n矩阵,通常用大写字母A,B,C等表示,记作:A或Am×n
aij:矩阵A的第i行第j列元素,简称为(i,j)元
矩阵也可以简记为A=(aij)m×n或A=(aij)
实矩阵:元素全为实数的矩阵
复矩阵:元素不全为实数的矩阵
eg:
(1206425−9):2×4的实矩阵2371−52ii69:3×3的复矩阵301:3×1的实矩阵(269):1×3的实矩阵(4):1×1的实矩阵,就是这个数本身
特殊矩阵
-
行矩阵(行向量):只有一行的矩阵
A=(a11a12…a1n)
-
列矩阵(列向量):只有一列的矩阵
A=a11a21⋮an1
-
零矩阵:所有元素全为零的m×n矩阵,记作Om×n或O
-
方针:行数与列数相等,即m=n的矩阵
An×n=a11a21⋮an1a12a22⋮an2……⋱…a1na2n⋮ann
An×n称为n阶矩阵或者n阶方阵,也记作An或A
a11,a22…ann:A的主对角元
注意:方阵A=(aij)是一个数表,行列式D=aij是一个算式
-
三角矩阵:
- 上三角矩阵 :主对角线以下全为零的方阵
An=a110⋮0a12a22⋮0……⋱…a1na2n⋮ann
- 下三角矩阵 :主对角线以上全为零的方阵
An=a11a21⋮an10a22⋮an2……⋱…00⋮ann
- 对角矩阵:主对角线以外全为零的方阵
An=a110⋮00a22⋮0……⋱…00⋮ann
又记作A=diag(a11,a22…ann)
对角线:diagonal
-
数量矩阵:主对角线上的元素都相同的对角矩阵
A=a0⋮00a⋮0……⋱…00⋮a
特别地:a=1时称为n阶单位矩阵(或n阶单位阵),记为En或In即En=10⋮001⋮0……⋱…00⋮1
-
行阶梯形矩阵:若存在零行,零行都在非零行的下边;各非零行的首非零元只出现在上一行的首非零元的右边
300540310763和0000000060005300−5700
-
行最简形矩阵:各非零行的首非零元为1(首1)且每个首1所在列的其余元素都是0的行阶梯形矩阵
100010310760和0000000010000100−5700
-
标准形矩阵:左上角为一个单位阵且其余元素都是零的行最简形矩阵
100010000000
同型矩阵与矩阵的相等
- 两个矩阵的行数、列数分别对应时,称它们为同型矩阵
eg:
395563和258074为同型矩阵
- 若两个矩阵A=(aij)和B=(bij)为同型矩阵,并且对应元素相等,即aij=bij(i=1,2,..,m;j=1,2,…,n)则称矩阵A与B相等记作A=B
运算
加法
定义
设矩阵A=(aij)m×n和B=(bij)m×n为同型矩阵,那么有A与B的和记作A+B,规定如下:
A+B=(aij+bij)=a11+b11a21+b21⋮am1+bm1a12+b12a22+b22⋮am2+bm2……⋱…a1n+b1na2n+b2n⋮amn+bmn
运算规律
- 交换律:A+B=B+A
- 结合律:(A+B)+C=A+(B+C)
- 矩阵加法运算的实质是数的加法,故上述运算规律显然成立
称−A=(−aij)=−a11−a21⋮−am1−a12−a22⋮−am2……⋱…−a1n−a2n⋮−amn为A的负矩阵
利用负矩阵可定义矩阵的差:A−BdefA+(−B)
显然有A+(−A)=O
乘法
数乘
定义
数k与矩阵A=(aij)m×n的乘积记作kA或Ak,简称数乘,规定为:kA=Ak=ka11ka21⋮kam1ka12ka22⋮kam2……⋱…ka1nka2n⋮kamn
设A、B为同型矩阵,k、t为数则
- k(tA)=(kt)A
- (k+t)A=kA+tA
- k(A+B)=kA+kB
- 1A=A,0A=O
数乘矩阵与数乘行列式的区别,如:
2(1225)=(24410)21225=2245
矩阵加减法与数乘运算统称为矩阵的线性运算
矩阵乘法
定义
矩阵A=(aij)m×l ,B=(bij)l×n ,规定A和B的乘积为C=AB=(cij)m×n ,其中cij=ai1b1j+ai2b2j+⋯+ailblj=∑k=1laikbkj(i=1,2,…,m;j=1,2,…n)
- C的cij项即A的第i行向量与B的第j列向量相乘得到
- 乘法AB有意义的条件:A的列数=B的行数
- C的行数=A的行数,C的列数=B的列数
- 矩阵乘法不满足交换律,即一般情况下AB=BA
- 矩阵乘法不满足消去律,即AB=O⇏A=O或B=O,AB=AC⇏B=C
eg:
矩阵A=(a11a21a12a22a13a23)矩阵B=b11b21b31b12b22b32则乘积为AB=(a11b11+a12b21+a13b31a21b11+a22b21+a23b31a11b12+a12b22+a13b32a21b12+a22b22+a23b32)
来源
设有两个线性变换(1){y1=a11x1+a12x2+a13x3y2=a21x1+a22x2+a23x3(2)⎩⎨⎧x1=b11t1+b12t2x2=b21t1+b22t2x3=b31t1+b32t2要求从t1,t2到y1,y2的线性变换,将(2)带入(1):{y1=a11(b11t1+b12t2)+a12(b21t1+b22t2)+a13(b31t1+b32t2)y2=a21(b11t1+b12t2)+a22(b21t1+b22t2)+a23(b31t1+b32t2)这个线性变换称为变换(1)和变换(2)的乘积
矩阵乘法满足的运算律:
- 结合律:(AB)C=A(BC)
- 分配律:A(B+C)=AB+AC,λ(AB)=(λA)B=A(λB)其中λ为数
简单结论
- AE=EA=A,即E在矩阵乘法中的作用相当于1在数的乘法中的作用
- λ1λ2⋱λna11a21⋮an1a12a22⋮an2………a1ma2m⋮anm=λ1a11λ2a21⋮λnan1λ1a12λ2a22⋮λnan2………λ1a1mλ2a2m⋮λnanm
a11a21⋮am1a12a22⋮am2………a1na2n⋮amnλ1λ2⋱λn=λ1a11λ1a21⋮λ1am1λ2a12λ2a22⋮λ2am2………λna1nλna2n⋮λnamn
即一个对角线左(右)乘一个矩阵等于这一个矩阵每一行(列)乘以相应的对角元
- λ1λ2⋱λnμ1μ2⋱μn=μ1μ2⋱μnλ1λ2⋱λn
=λ1μ1λ2μ2⋱λnμn
- λn⋰λ2λ1μn⋰μ2μ1=λnμ1⋰λ2μn−1λ1μn
应用
记A=a11a21⋮am1a12a22⋮am2………a1na2n⋮amn,x=x1x2⋮xn,b=b1b2⋮bn,y=y1y2⋮yn则线性方程组⎩⎨⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋮am1x1+am2x2+⋯+amnxn=bn可以表达为Ax=b线性变换⎩⎨⎧y1=a11x1+a12x2+⋯+a1nxny2=a21x1+a22x2+⋯+a2nxn⋮ym=am1x1+am2x2+⋯+amnxn可以表达为Ax=y其中A称为线性方程组或线性变换的系数矩阵
可交换矩阵
当AB=BA时称A,B可交换
- 若A,B可交换,则A,B一定为同阶方阵
- 单位矩阵E与任何同阶方阵可交换,即AE=EA=A
- 任何两个同阶对角阵可交换
- 矩阵A与任何同阶矩阵B可交换⇔A为数量矩阵(kE)
一方面,若A=kE则(kE)B=B(kE)=kB
另一方面,若AB=BA对任何B成立,对某个固定的i,分别取B=Bij:(ij)元为1,其余元素全为0(j=1,2,…,n),带入ABij=BijA计算可得出A=kE
方阵的幂
设A为n阶方阵,k为正整数,定义A1=A,Ak+1=AkA1
一般的称An=AAA…A为方阵A次幂
当m、k为正整数时,有
AmAk=Am+k,(Am)k=Amk
一般(A+B)2=A2+2AB+B2,(A+B)(A−B)=A2−B2,若要“=”成立则需AB=BA
方阵的多项式
方阵A的m次多项式为f(A)=amAm+am−1Am−1+⋯+a1A+a0E
-
若f(x)g(x)为多项式,A为n阶方阵,因为Ak,Al,E都是可交换的,所以f(A)g(A)=g(A)f(A)
-
方阵A的多项式可以类似一般多项式一样相乘或分解因式
eg:
(E+A)(2E−A)=2E+A−A2(E−A)3=E−3A+3A2−A3A2−E=(A−E)(A+E)(A+kE)n=An+Cn1kAn−1+⋯+Cnn−1kn−1A+knE
矩阵的转置
定义
将矩阵A=(aij)m×n的行列互换,得到新的n×m矩阵,称为A的转置矩阵,记作AT
eg:
A=(142536),AT=123456B=(12),BT=(12)
运算性质
- (AT)T=A
- (A+B)T=AT+BT
- (λA)T=λAT
- (AB)T=BTAT
一般地,(A1A2…Ak)T=AkTAk−1T…A1T
证明(AB)T=BTAT:
设A=(aij)m×s,B=(bij)s×n,AB=C=(cij)m×n,BTAT=D=(dij)n×m首先容易看到(AB)T与BTAT为同型矩阵其次(AB)T的(i,j)元即为(AB)的(j,i)元:cij=aj1b1i+aj2b2i+⋯+ajsbsi注意到BT中第i行元素即为B中第i列元素b1i,b2i,…,bsi,AT中第j列元素即为A中第j行元素aj1,aj2,…,ajs故BTAT的(i,j)元为dij=b1iaj1+b2iaj2+⋯+bsiajs综上可知(AB)T=BTAT
对称矩阵与反对称矩阵
定义
设A=(aij)为n阶方阵
- 如果AT=A,即aij=aji(i,j=1,2,…,n),则称A为对称矩阵
- 如果AT=−A,即aij=−aji(i,j=1,2,…,n),则称A为反对称矩阵
显然,若A是反对称矩阵,那么对任意i,有aii=0,即主对角线为零
简单结论
- 设A为(反)对称矩阵,则AT,λA也是(反对称矩阵
- 设A,B为(反)对称矩阵,则A±B也是(反)对称矩阵
- 设A,B为同阶对称矩阵,则AB也是对称矩阵⇔A与B可交换
矩阵的共轭
定义
设A=(aij)为复矩阵,用aij表示aij的共轭复数,记A=(aij),称A为A的共轭矩阵
运算性质
- A+B=A+B
- λA=λA
- AB=AB
- AT=(A)T
矩阵的迹
定义
n阶方阵A=(aij)m×n的主对角线上的各元素之和a11+a22+…ann称为A的迹,记作tr(A)
性质
- tr(A+B)=tr(A)+tr(B)
- tr(kA)=ktr(A)
- tr(AT)=tr(A),tr(A)=tr(A)
- tr(AB)=tr(BA)
方阵的行列式
定义
由n阶方阵A=(aij)的元素所构成的行列式(个元素的位置不变)称为方阵A的行列式,记作A或detA或det(aij)
运算性质
设A、B为n阶方阵
- AT=A
- λA=λnA
- AB=A⋅B=B⋅A=BA
证明AB=A⋅B:
AB=A−EOB=A−EABO=(−1)nABOA−E=(−1)nAB−E=(−1)nAB(−1)n=AB
伴随矩阵
定义
由方阵A的行列式A中各元素的代数余子式Aij构成的方阵A∗=A11A12⋮A1nA21A22⋮A2n………An1An2⋮Ann称为A的伴随矩阵
A∗中元素的下标与AT中元素的下标一致,与A不同
定理
设A∗是n阶方阵A=(aij)的伴随矩阵,则有AA∗=A∗A=AE
证明:
AA∗=a11a21⋮an1a12a22⋮an2………a1na2n⋮annA11A12⋮A1nA21A22⋮A2n………An1An2⋮Ann=A0⋮00A⋮0………00⋮A=AE
结论
- (AB)∗=B∗A∗
- 证明:
- (AB)∗=AB(AB)−1=ABB−1A−1=B∗A∗
- (kA)∗=kn−1A∗
- 证明:
- (kA)∗=kA(kA)−1=knAk−1A−1=kn−1A∗
- (A∗)∗=An−2A
- 证明:
- (A∗)∗=A∗(A∗)−1=An−1(AA−1)−1=An−2A
- A∗=An−1(无论A是否可逆都成立)
- 证明:
- 在AA∗=AE两边取行列式得:AA∗=An,那么易得A∗=An−1
- (A∗)−1=(A−1)∗
- (AT)−1=(A−1)T
- 若AAT=E,则(A∗)T=(A∗)−1
方阵A在可逆的条件下,A∗的问题可以转化为A−1的问题
可逆矩阵和逆矩阵
定义
对于n阶方阵A,若存在n阶方阵B,满足AB=BA=E则称方阵A可逆,且称B为A的逆矩阵,记作B=A−1
- 若A是可逆矩阵,则A的逆矩阵是唯一的
证明:
设B和C都是A的逆矩阵,则有AB=BA=E,AC=CA=E于是B=EB=CAB=CE=C故,A的逆矩阵是唯一的
- 只有方阵才有逆矩阵
- 逆矩阵的记号A−1是特定的,不能写作A1
- 若B是A的逆矩阵,那么A也是B的逆矩阵
- E−1=E
运算性质
- 若A可逆,则A−1也可逆,且(A−1)−1=A
- 若A可逆,且数k=0,则kA也可逆,且(kA)−1=k1A−1
- 若A,B为同阶可逆方阵,则AB也可逆,且(AB)−1=B−1A−1
- 若A可逆,则AT也可逆,且(AT)−1=(A−1)T
- 若A可逆,则A−1=A−1
(A+B)−1=A−1+B−1
求逆矩阵的方法
利用定义求逆矩阵
求A=(2143)的逆矩阵:设A−1=(acbd),则有(2143)(acbd)=(1001)即⎩⎨⎧2a+4c=12b+4d=0a+3c=0b+3d=1⇒⎩⎨⎧a=23b=−2c=−21d=1即A−1=(23−21−21)
#利用定义来求逆矩阵,对于高阶矩阵计算量十分庞大
利用公式求逆矩阵
由伴随矩阵的定理可知A−1=∣A∣1A∗,同时也可知矩阵可逆的充要条件为A=0
结论:
- 二阶方阵A=(acbd)可逆⇔A=ad−bc=0,且A−1=ad−bc1(d−c−ba)
- A=diag(a1,a2,…,an)可逆⇔a1a2…an=0,且A−1=diag(a1−1,a2−1,…,an−1)
- 方阵A=000λn00⋰00λ200λ1000可逆⇔λi=0(1=1,2,…,n),且A−1=A=000λ1−100⋰00λn−1−100λn−1000
当A可逆时存在初等矩阵G1,G2,⋯,Gl使得
A=G1G2⋯Gl⇒Gl−1⋯G2−1G1−1A=E⇒Gl−1⋯G2−1G1−1E=A−1
一系列初等行变换将A化为E,它们同时将E化为A−1
于是得到求逆矩阵的主要方法:
(A∣E)∼(E∣A−1)
逆矩阵的应用
- 证明Cramer法则
- 对于矩阵方程AX=B,若A可逆,则X=A−1B
- 对于矩阵方程XA=B,若A可逆,则X=BA−1
- 对于矩阵方程AXB=C,若A可逆,则X=A−1CB−1
奇异矩阵与非奇异矩阵
- 奇异矩阵:A=0(不可逆矩阵,退化矩阵)
- 非奇异矩阵:A=0(可逆矩阵,非退化矩阵)
矩阵的初等变换
定义
矩阵的下列3种行(列)变换称为矩阵的初等行(列)变换
- 对换变换:交换矩阵的i,j两行(列),记作ri↔rj(ci↔cj)
- 倍乘变换:用非零常数k乘以矩阵的第i行(列),记作kri(kci)也ri×k(ci×k)
- 倍加变换:将矩阵的第i行(列)倍加到第j行(列),记作rj+kri(cj+kci)
等价矩阵:若矩阵A经有限次初等变换化成矩阵B,则称矩阵A和B等价,记为A∼B
矩阵的初等行变换和初等列变换统称为初等变换
性质
- 初等变换不改变方阵的可逆性
- 若方阵An可逆,则An可经过有限次的初等变换化为单位矩阵En,即可逆阵An∼En
初等矩阵
定义
由单位阵E经过一次初等变换得到的方阵称为初等矩阵
三种初等变换对应三种初等矩阵:
- 对换矩阵E(i↔j):交换E的i,j两行(列)
- 倍乘矩阵E(i(k)):用非零数k乘以E的第i行(列)
- 倍加矩阵E(i+j(k)):将E的第j行(列)的k倍加到第i行(列)
性质
- 初等变换都是可逆的,从而初等矩阵都是可逆的
- E(i↔j)−1=E(i↔j)
- E(i(k))−1=E(i(k1))
- E(i+j(k))−1=E(i+j(−k))
- E(i↔j)=−1
- E(i(k))=k(=0)
- E(i+j(k))=1
应用
设A为m×n的矩阵,用初等矩阵左乘A等同于对A作相应的初等行变换,用初等矩阵右乘等同于对A作相应的初等列变换
具体地:
-
Em(i↔j)A⇔交换A的i,j两行
AEn(i↔j)⇔交换的i,j两列
-
Em(i(k))A⇔用数k(=0)乘以A的第i行
AEn(i(k))⇔用数k(=0)乘以的第i列
-
Em(i+j(k))A⇔把A的第j行的k倍加到第i行上去
AEm(i+j(k))⇔把A的第j列的k倍加到第i列上去
左乘则行变,右乘则列变
和可逆矩阵的关系
方阵A可逆⇔A可以表示成有限多个初等矩阵的积
利用初等变换解矩阵方程
对于矩阵方程AX=B ,如果A可逆,则X=A−1B那么进行初等行变换(A∣B)∼(E∣A−1B),即一系列初等行变换将A变为E的同时也将B变为了A−1B。
理由:对A做行变换将A变成E,即有初等矩阵Ps,⋯P2,P1,使得Ps⋯P2P1A=E,那么一定有Ps⋯P2P1=A−1,而对B进行了相同的初等行变换,相当于用Ps⋯P2P1左乘B,故Ps⋯P2P1B=A−1B
对于矩阵方程XA=B,如果B可逆,则X=BA−1那么进行初等列变换(AB)∼(EBA−1)或者XA=B⇒ATXT=BT那么进行初等行变换(AT∣BT)∼(E∣(AT)−1BT)
分块矩阵
对于行数与列数较高的矩阵,为了简化其运算,经常采用分块法,使大矩阵的运算化为小矩阵的运算
具体实现:将矩阵A用若干条纵线和横线分成若干小块,每一个小块称为A的子块(子矩阵),以子块为元素的矩阵称为分块矩阵
eg:
A=a11−a21a31a41a12−a22a32a42∣∣∣∣∣a13−a23a33a43a14−a24a34a44=(C1C3C2C4)其中C1=(a11a12),C2=(a13a14),C3=a21a31a41a22a32a42,C4=a23a33a43a24a34a44
对于同一矩阵, 采用不同的分块方法, 会得到不同的分块矩阵
运算
设矩阵A与B为同型矩阵,k为实数,对和B采用相同的分块法
A=A11A21⋮Am1A12A22⋮Am2⋯⋯⋱⋯A1nA2n⋮AmnB=B11B21⋮Bm1B12B22⋮Bm2⋯⋯⋱⋯B1nB2n⋮Bmn
其中Aij和Bij为同型矩阵,则
1.
A+B=A11+B11A21+B21⋮Am1+Bm1A12+B12A22+B22⋮Am2+Bm2⋯⋯⋱⋯A1n+B1nA2n+B2n⋮Amn+Bmn
kA=kA11kA21⋮kAm1kA12kA22⋮kAm2⋯⋯⋱⋯kA1nkA2n⋮kAmn
AT=A11TA12T⋮A1nTA21TA22T⋮A2nT⋯⋯⋱⋯Am1TAm2T⋮AnmT
分块矩阵的转置:矩阵本身转置,每一个子块也转置
分块对角矩阵
定义
形如:A=A1A2⋱An的分块矩阵称为分块对角矩阵,其中Ai(i=1,2,…,n)均为方阵
- 若矩阵为方阵,且非零元集中在主对角线附近,可分块为对角矩阵
- 显然分块对角矩阵的和、差、数乘、乘积仍为分块对角矩阵
性质
- A=A1A2…An
- A1A2⋱AnB1B2⋱Bn=A1B1A2B2⋱AnBn
- 分块对角阵A可逆⇔Ai(i=1,2,…n)都可逆,且A−1=A1−1A2−1⋱An−1
分块初等矩阵
对分块单位阵E=E1OE2⋱OEn进行一次初等变换得到初等分块矩阵
- 分块初等矩阵都是方阵
- 在运算可行的前提下,分块初等矩阵在分块矩阵的乘法中的作用与普通初等矩阵在矩阵乘法中的作用相同
矩阵的秩
矩阵的行秩和列秩
定义
矩阵A=a11a21⋮am1a12a22⋮am2……⋱…a1na2n⋮amn=(α1,α2,…,αn)=β1Tβ2T⋮βmT
称α1,α2,…,αn为A的列向量组,列向量组的秩≤n
称β1T,β2T,…,βmT为A的行向量组,列向量组的秩≤m
矩阵Am×n的行向量组的秩称为A的行秩,列向量组的秩称为A的列秩
性质
- 任何矩阵都有行秩=列秩,行阶梯形矩阵额外有行秩、列秩=其中非零行的行数
- 初等行变换不改变矩阵的行秩,初等列变换不改变矩阵的列秩
- 初等行变换不改变矩阵的列向量组的线性相关性,从而也不改变矩阵的列秩,同理初等列变换不改变矩阵的行秩
- 设A为m×n矩阵,且其行秩为r,则一定存在m阶可逆阵P和n阶可逆阵Q,使得PAQ=D=(ErOOO)
定义
矩阵A的行秩和列秩统称为矩阵A的秩,记为秩(A)或rank(A)或r(A)
易得:
- 设A为m×n的矩阵,则r(A)≤min{m,n}
- r(A)=0⇔A=O
则有推论:
- 矩阵的初等变换不改变矩阵的秩
- 等价矩阵的秩相等
- 矩阵A的标准形唯一且由r(A)决定,即:若r(A)=r,则A的标准形为(ErOOO)
- n阶矩阵A的秩等于n⇔∣A∣=0⇔A可逆,此时也称A为满秩矩阵(非奇异矩阵、非退化矩阵)
性质
- 0≤r(Am×n)≤min{m,n}
- r(A)=r(A)
- r(A+B)≤r(A)+r(B)
- r(AB)≤min{r(A),r(B)}
- 若P,Q可逆,则r(A)=r(PA)=r(AQ)=r(PAQ)
- r(AOOB)=r(A)+r(B),r(AODB)≥r(A)+r(B)
- 设有矩阵Am×s,Bs×n,有r(A)+r(B)−s≤r(AB)≤min{r(A),r(B)}
矩阵的k阶子式
定义
在m×n矩阵A中任取k(i1,i2,…,ik)行k(j1j2,…,jk)列(k≤m,k≤n),位于这些行列交叉处的k2个元素按它们原来的位置次序排列得到的k阶行列式,称为矩阵A的k阶子式(m×n矩阵A的k阶子式共有Cmk⋅Cnk个)
- 非零k阶子式:k阶子式的值不等于0
- k阶主子式:取的k行k列对应的顺序一致(m×n矩阵A的k阶主子式共有Cmin{m,n}k个)
- k阶顺序主子式:取前k行前k列(m×n矩阵A的k阶顺序主子式只有一个)
eg:
对于A=a11a21a31a41a12a22a32a42a13a23a33a43a14a24a34a44
a12a32a14a34是取1,3行,2,4列产生的2阶子式
a11a21a41a12a22a42a14a24a44是取1,2,4行,1,2,4列产生的3阶主子式
a11a21a31a12a22a32a13a23a33是取1,2,3行,1,2,3列产生的3阶顺序主子式
性质
- r(A)=r⇔A的非零子式的最高阶数为r
- r(A)≥r⇔A至少有一个r阶非零子式
- r(A)≤r⇔A中所有r+1阶子式(若存在)全为零
相似矩阵
定义
设A,B都是n阶方阵,若存在可逆矩阵P使P−1AP=B,则称A相似于B,或者A与B相似,记作A∼B
矩阵的相关性关系是一种等价关系
- 自反性:A与A本身相似
- 对称性:若A与B相似,则B与A相似
- 传递性:若A与B相似,B与C相似,则A与C相似
性质
若A∼B,即存在可逆矩阵P使得P−1AP=B,则
- A与B有相同的行列式和相同的秩,即∣A∣=∣B∣,r(A)=r(B)
- 当A可逆时,A−1∼B−1,A∗∼B∗
- An∼Bn,kA∼kB,f(A)∼f(B),其中n为正整数,k为实数,f(x)为多项式
矩阵的特征值和二次型
特征值和特征向量
定义
设A为n阶方阵,若存在数λ和n维非零列向量x使得Ax=λx成立,则
- λ:A的特征值,(或A的对应于特征向量x的特征值)
- x(=0):A的对应于(属于)λ的一个特征向量
- 特征值问题是对方阵而言的
- 特征向量x=0。当x=0时,对任意λ都有Ax=λx成立,对讨论特征值无意义
- A的特征值λ———方程∣λE−A∣=0的根λ;A的与λ对应的特征向量x——(λE−A)x=0的非零解
- ∣λE−A∣=0,即
λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋱⋯−a1n−a2n⋮λ−ann=0
称为A的特征方程——关于λ的一元n次方程。
多项式f(λ)=∣λE−A∣:A的特征多项式——λ的n次多项式。
A的特征值λ:A的特征方程的根,或特征多项式的零点。
注:n次代数方程有n个根(复根和实根,重根按重数计算),所以A有n个特征值(在复数范围内)。
求取方法
求方阵A的特征值与特征向量的步骤:
- 计算A的特征多项式∣λE−A∣;
- 求特征方程∣λE−A∣=0的全部根λ1,λ2,⋯,λn,即得A的全部特征值;
- 对于特征值λi,求(λiE−A)x=0的非零解,即得A的对应于λi的特征向量.
结论:
- 上(下)三角矩阵和对角阵的特征值就是矩阵的主对角元.
- 数量矩阵kE的特征值是k(n重),对应的特征向量为任意非零向量. ∵kEx=kx.
特征值的几何重数与代数重数
在方阵A的属于特征值λ0的全部特征向量中,设有极大无关组ξ1,ξ2,⋯,ξl,则称L{ξ1,ξ2,⋯,ξl}是A的关于特征值λ0的特征子空间,记作Vλ0. dimVλ0称为λ0的几何重数.
- λ0的几何重数就是A的对应于λ0的线性无关的特征向量的个数.
- Vλ0={A的对应于λ0的全部特征向量}∪{0},故
λ0的几何重数=n−r(λ0E−A).
- λ0的代数重数:λ0是A的特征值的重数.
A的特征值的几何重数≤代数重数.
A的单重特征值的几何重数=代数重数.
特征向量的性质
-
若x1和x2都是方阵A的属于特征值λ0的特征向量,则k1x1+k2x2也是A的属于特征值λ0的特征向量.(k1,k2为任意实数且k1x1+k2x2=0.)
- 属于同一特征值的特征向量的非零线性组合仍是属于该特征值的特征向量.
-
A的一个特征向量x不能属于A的不同特征值.
证明:假设向量x同时是A的属于不同特征值λ1,λ2(λ1=λ2)的特征向量,即有
Ax=λ1x,Ax=λ2x,
⟹λ1x=λ2x
⟹(λ1−λ2)x=0,
由于λ1−λ2=0,所以x=0.这与x是特征向量矛盾.
-
设ξ1,ξ2,⋯,ξm分别是n阶矩阵A对应于互不相等的特征值λ1,λ2,⋯,λm的特征向量,则ξ1,ξ2,⋯,ξm线性无关.
简言之:A的对应于不同特征值的特征向量线性无关.
-
设λ1,λ2,⋯,λm是An的m个互异特征值,对应于λi的线性无关的特征向量为ξi1,ξi2,⋯,ξiri(i=1,2,⋯,m),则所有这些特征向量(共r1+r2+⋯+rm个)构成的向量组线性无关.
简言之:A的对应于不同特征值的线性无关的特征向量所构成的向量组仍然是线性无关.
特征值的性质
-
设A=(aij)n×n的特征值为λ1,λ2,⋯,λn,则有:
- λ1+λ2+⋯+λn=a11+a22+⋯+ann=tr(A);
- λ1λ2⋯λn=∣A∣.
- An可逆⟺A的n个特征值都非零,即λi=0(i=1,2,⋯,n).
-
设λ是矩阵A的特征值,ξ=0是对应于λ的特征向量,则
- aλ是矩阵aA的特征值(a为任意实数);
- λk是矩阵Ak的特征值(k为任意正整数);
- 当A可逆时,λ−1是A−1的特征值;
∣A∣λ−1是A∗的特征值.
- φ(λ)是矩阵φ(A)的特征值,其中
φ(x)=a0+a1x+⋯+anxn.
ξ是对应的特征向量.
-
n阶矩阵A和它的转置矩阵AT有相同的特征值.
证明:因为
∣λE−AT∣=∣(λE−A)T∣=∣λE−A∣,
即A和AT有相同的特征多项式⟹A和AT有相同的特征值.
注:A和AT对应于同一特征值的特征向量一般不同.
矩阵的相似对角化
定义
对n阶方阵A,如果存在可逆矩阵P,使得
P−1AP=Λ=diag(λ1,λ2,⋯,λn)
为对角阵,则称矩阵A可相似对角化.
相似对角化的作用:
若存在可逆矩阵P,使得P−1AP=Λ为对角矩阵,则
Ak=PΛkP−1,φ(A)=Pφ(Λ)P−1.
利用上述结论可以很方便地计算A的幂Ak和A的多项式φ(A).
而对于对角阵Λ有
Λk=λ1kλ2k⋱λnk,φ(Λ)=φ(λ1)φ(λ2)⋱φ(λn).
注:并非任意方阵都可对角化,如:矩阵A=(1101)不能对角化.
方阵可相似对角化的条件
- An能相似对角化⟺An有n个线性无关的特征向量.
- An有n个互不相等的特征值⟹An可相似对角化.
注:当A有重特征值时,A不一定有n个线性无关的特征向量,从而A不一定能对角化.
- An可相似对角化⟺An每个特征值的几何重数=代数重数.
- λ0的代数重数:λ0作为∣λE−A∣=0的根的重数;
- λ0的几何重数:(λ0E−A)x=0的基础解系中解向量的个数.
关系:1≤λ0的几何重数≤λ0的代数重数.
- An可相似对角化⟺An每个重特征值的几何重数=代数重数.
实对称矩阵的对角化
一般的方阵A不一定能相似对角化,但如果A为实对称矩阵,那么A一定可以相似对角化.
本节所提到的对称矩阵均指实对称矩阵.即有AT=A.
注意:实矩阵的特征值不一定为实数,从而特征向量也不一定为实向量. 如:A=(01−10).
性质
-
实对称矩阵的特征值必为实数.
证明:
- 设Ax=λx(x=0),其中AT=A.
- 用λˉ表示λ的共轭复数,用xˉ表示x的共轭复向量.
一方面:
xˉTAx=xˉT(λx)=λxˉTx
另一方面:
xˉTAx=xˉTATx=(Axˉ)Tx=(λˉxˉ)Tx=λˉxˉTx
两式相减,得(λ−λˉ)xˉTx=0.
由于x=0,所以xˉTx=∑i=1n∣xˉi∣2=0,从而λ=λˉ.
由此可得,λ是实数.
说明
由于实对称矩阵A的特征值λi为实数,所以齐次线性方程组(A−λiE)x=0是实系数方程组,由∣A−λiE∣=0知,(A−λiE)x=0必有实的基础解系,从而对应的特征向量可以取实向量.
-
实对称矩阵A对应于不同特征值的特征向量正交.
证明:由条件设:Api=λipi(i=1,2),λ1=λ2,A=AT.
于是
λ1p1Tp2=(Ap1)Tp2=p1TATp2=p1TAp2=p1T(λ2p2)=λ2p1Tp2.
即(λ1−λ2)p1Tp2=0.
注意到λ1−λ2=0,所以p1Tp2=0 ⟹ p1与p2正交.
实对称矩阵的相似对角化
设A为n阶实对称矩阵,则必有正交矩阵P,使得
P−1AP=PTAP=λ1λ2⋱λn=Λ.
其中P=(p1,p2,⋯,pn),pi满足Api=λipi(i=1,2,⋯,n).
⟹n阶实对称矩阵A的k重特征值λ0必对应k个线性无关的特征向量,即
r(λ0E−A)=n−k.
注:此定理说明:实对称矩阵一定可以对角化,而且相似变换矩阵可以是正交矩阵.
步骤
-
解∣λE−A∣=0求出A的所有特征值λi;
-
对每个λi,解方程组(λiE−A)x=0,求出线性无关的特征向量(即基础解系),并将它们正交化,单位化(这是正交对角化的步骤,实际上可以不进行正交化,若不正交化则P不是正交矩阵);
-
将上述n个两两正交的单位特征向量作列,构成正交矩阵P,则
P−1AP=PTAP=diag(λ1,λ2,⋯,λn)=Λ,
其中P=(p1,p2,⋯,pn),pi满足Api=λipi(i=1,2,⋯,n).
二次型及其矩阵表示
二次型就是二次齐次多项式
如:
x2+y2=a2和a2x2+b2y2=1(a,b>0)的左端均是二次型,分别表示平面上的圆和椭圆,且主轴和坐标轴重合.
一般地,中心与坐标原点重合的有心二次曲线的方程是
ax2+bxy+cy2=k(a,b,c,k为常数)
其左端也是一个二次型,但是它表示的平面图形是什么(类型)呢?
若能用可逆的线性变换将上述方程化成标准形式的方程(只含平方项,不含交叉项),则容易看出.
二次型的主要问题
利用矩阵(可逆的线性变换),化二次型为标准形.
例如x2−xy+y2=4,通过(旋转)变换
(x′y′)=(1/2−1/21/21/2)(xy)
可化为标准形2x′2+23y′2=4.
又x2−xy+y2=(x−21y)2+43y2,所以它也可以通过可逆变换
(x′y′)=(10−1/23/2)(xy)
化为标准形x′2+y′2=4. 但此时曲线形状发生了改变,因为所用的变换不是正交变换.
注:要使曲线在坐标变换过程中保持形状不变,则必须使用正交变换. 因为所用的变换为正交变换,所以从标准形可知原方程表示的是椭圆.
二次型的矩阵表示
例如3元二次型f=x2+2y2−3z2−4xy+2yz+6xz可以写成:
f=(x,y,z)1−23−22131−3xyz
为保证唯一性,约定矩阵为对称矩阵.
n元二次型的定义
n元二次齐次多项式
f(x1,x2,⋯,xn)=a11x12+2a12x1x2+2a13x1x3+⋯+2a1nx1xn+a22x22+2a23x2x3+⋯+2a2nx2xn+⋯+annxn2
称为(n元)二次型
当aij∈C时,称f为复二次型;当aij∈R时,称f为实二次型.
用矩阵表示二次型
对二次型
f(x1,x2,⋯,xn)=a11x12+2a12x1x2+2a13x1x3+⋯+2a1nx1xn+a22x22+2a23x2x3+⋯+2a2nx2xn+⋯+annxn2
i>j时令aji=aij,则2aijxixj=aijxixj+ajixjxi,
f(x1,x2,⋯,xn)=a11x12+a12x1x2+⋯+a1nx1xn+a21x2x1+a22x22+⋯+a2nx2xn+⋯+an1xnx1+an2xnx2+⋯+annxn2
=(x1,x2,⋯,xn)a11x1+a12x2+⋯+a1nxna21x1+a22x2+⋯+a2nxn⋯an1x1+an2x2+⋯+annxn
=(x1,x2,⋯,xn)a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮annx1x2⋮xn
若记A=a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann,x=x1x2⋮xn
则二次型可记作f=xTAx,其中A为对称矩阵.
二次型的矩阵与秩
二次型与对称矩阵一一对应.标准二次型对应的矩阵为对角阵
对称矩阵A叫做二次型f的矩阵,f叫做对称矩阵A的二次型.
对称矩阵A的秩叫做二次型f的秩.
化二次型为标准形
设
⎩⎨⎧x1=c11y1+c12y2+⋯+c1nynx2=c21y1+c22y2+⋯+c2nyn⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯xn=cn1y1+cn2y2+⋯+cnnyn
对于二次型,讨论的主要问题是:寻求可逆(满秩,非退化)的线性变换,将二次型化为标准形.
从矩阵的角度看,主要问题是:
对于实对称矩阵A,寻找可逆阵C,使得CTAC为对角阵.
记C=(cij),则上述可逆线性变换可记作x=Cy.
将其代入f=xTAx得:
f=(Cy)TA(Cy)=yTCTACy.
合同矩阵
定义
对两个方阵A和B,若存在可逆阵C,使得CTAC=B,则称A与B合同),记为A≃B,C称为合同变换矩阵.
- 合同关系是等价关系.
- 对称矩阵的合同矩阵一定也是对称矩阵.
- 当实对称矩阵A与B合同时,也称它们对应的二次型合同.
- A与B相似⟹A与B等价
A与B合同⟹A与B等价
若A与B均为实对称矩阵,则A与B相似⟹A与B合同
性质
若A≃B,合同变换矩阵为C,即CTAC=B,则
- A与B有相同的秩,即r(A)=r(B).
- AT≃BT,且合同变换矩阵仍为C.
- 当A可逆时,A−1≃B−1,A∗≃B∗.
化二次型为标准形
正交变换法
已有结论:
对任意实对称矩阵A,一定存在正交矩阵P,使得
P−1AP=Λ=diag(λ1,λ2,⋯,λn)
其中λ1,λ2,⋯,λn为矩阵A的n个特征值.
因为P为正交阵,所以P−1=PT,于是
PTAP=Λ=diag(λ1,λ2,⋯,λn).
主轴定理: 任给实二次型f(x)=xTAx,总有正交变换x=Qy,使f化为标准形
f=λ1y12+λ2y22+⋯+λnyn2
其中λ1,λ2,⋯,λn为对称矩阵A的n个特征值,正交矩阵Q的n个列向量q1,q2,⋯,qn是A的对应于特征值λ1,λ2,⋯,λn的标准正交的特征向量.
正交变换法化二次型为标准形的步骤:
- 写出二次型f(x)=xTAx中的实对称矩阵A;
- 求出A的所有特征值λ1,λ2,⋯,λn(重根按重数计算);
- 求出A的对应于特征值λi的正交单位化的特征向量组,从而有正交单位向量组q1,q2,⋯,qn;
- 记Q=(q1,q2,⋯,qn),作正交变换x=Qy,则得f的标准形:
f=λ1y12+λ2y22+⋯+λnyn2.
拉格朗日配方法
-
若二次型含有xi的平方项,则先把含有xi的乘积项集中,配成完全平方项,再对其余的变量同样进行,直到都配成平方项为止,经过可逆线性变换,就得到标准形.
-
若二次型中不含有平方项,但是aij=0(i=j),则先作可逆线性变换:
⎩⎨⎧xi=yi−yjxj=yi+yjxk=yk(k=i,j)
化二次型为含有平方项的二次型,然后再按1中方法配方.
初等变换法
问题:对任一个n阶实对称矩阵A,寻找可逆阵C,使得
CTAC=diag(d1,d2,⋯,dn).
∵C可逆,∴存在一列初等矩阵使得C=P1P2⋯Pk,于是
CTAC=PkT⋯P2TP1TAP1P2⋯Pk=diag(d1,d2,⋯,dn).
且C=P1P2⋯Pk=EP1P2⋯Pk
注意到E(i↔j)T=E(i↔j),
E(i(k))T=E(i(k)),
E(i+j(k))T=E(j+i(k)).
故PkT⋯P2TP1TAP1P2⋯Pk表示对A进行同类型的初等行、列变换.
注:这里C不一定是正交矩阵,d1,d2,⋯,dn也不一定是A的特征值.
由
(AE)同类型的初等行,列变换(ΛC)
可知方法如下:
CTAC=PkT⋯P2TP1TAP1P2⋯Pk=diag(d1,d2,⋯,dn).
C=P1P2⋯Pk=EP1P2⋯Pk
惯性定理和二次型的规范形
一个实二次型,既可以通过正交变换法化为标准形,也可以通过拉格朗日配方法或者初等变换法化为标准形. 显然,其标准形一般来说是不唯一的,但标准形中所含有的项数是确定的,项数等于二次型的秩.
惯性定理
一个n元二次型f=xTAx,经任意可逆线性变换化为标准形f=k1y12+k2y22+⋯+knyn2后,标准形中正平方项的个数p和负平方项的个数q是唯一确定的. 且p+q=r(A).
- 二次型xTAx(或A)的正惯性指数:标准形中正系数的个数p,
- 二次型xTAx(或A)的负惯性指数:标准形中负系数的个数q.
- 符号差:正、负惯性指数的差p−q.
求二次型的秩,有两种方法:
- 求二次型对应的矩阵的秩;
- 将二次型化为标准形(用可逆变换),标准形中的项数即为二次型的秩.
实二次型的规范形
-
设二次型f的秩为r,正惯性指数为p,则f一定可经过可逆的线性变换化为标准形
f=d1y12+⋯+dpyp2−dp+1yp+12−⋯−dryr2,di>0,i=1,2,⋯,r.
继续做可逆线性变换
{yi=diziyj=zji=1,2,⋯,r(j=r+1,r+2,⋯,n)
则上述标准二次型可进一步化为
f=z12+⋯+zp2−zp+12−⋯−zr2,
称之为二次型的规范形.
注:规范形首先是标准形,且其系数只在−1,0,1三个数中取值.
- 任意实数域上的n元二次型f=xTAx,总可以经过可逆的线性变换化为规范形,且规范形是唯一的.
注:二次型的规范形由它的秩和正惯性指数(或者正、负惯性指数)唯一确定.
Ep−EqO=diag(p个1,⋯,1,q个−1,⋯,−1,n−p−q个0⋯,0).
其中p+q=r(A).
等价————保秩.
相似————保秩,保特征值,保行列式,保迹.
合同————保对称性,保秩,保正、负惯性指数,保正定性.
实二次型的正定性
正(负)定矩阵和正(负)定二次型
设有二次型f(x)=xTAx,若∀x=0,有
- f(x)>0,则称f为正定二次型,并称对称矩阵A是正定的;
- f(x)<0,则称f为负定二次型,并称对称矩阵A是负定的.
注:
- 正定或负定矩阵一定是对称矩阵.
- 例如:f(x1,x2,x3)=x12+4x22+16x32为正定二次型.
- f(x1,x2,x3)=−x12−3x22−2x32为负定二次型.
- 对称矩阵A为负定矩阵⟺(−A)为正定矩阵.
正定二次型的性质
实二次型f(x)=xTAx经任意可逆线性变换,正定性保持不变.
正定二次型的判定
xTAx是正定二次型(或A是正定矩阵)的充要条件是下列之一:
- A的n个特征值λ1,λ2,⋯,λn全大于0;
- A的正惯性指数为n,即A≃E;
- 存在可逆阵P使得A=PTP;
- A的n个顺序主子式全大于0,即
a11>0,a11a21a12a22>0,⋯,a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann>0.
负定二次型的判定
设A是实对称矩阵,则下列命题等价:
- xTAx是负定二次型;
- A的n个特征值λ1,λ2,⋯,λn全小于0;
- A的负惯性指数为n,即A≃−E;
- 存在可逆阵P使得A=−PTP;
- A的奇数阶顺序主子式小于0,偶数阶顺序主子式大于0,即
(−1)ra11a21⋮ar1a12a22⋮ar2⋯⋯⋱⋯a1ra2r⋮arr>0r=1,2,⋯,r.
简单结论
- 若A为正定的,则AT, A−1, kA(k为正数), A∗均为正定矩阵. (用特征值判定)
- 若A, B均为n阶正定矩阵,则kA+lB(k和l为正数)也是正定矩阵. (用定义判定)
- 若A, B分别为m阶, n阶正定矩阵,则分块矩阵C=(AOOB)也为正定矩阵. (用特征值或定义判定)
- 若A为n阶正定矩阵,C为n阶可逆矩阵,则CTAC也是正定矩阵. (用特征值或定义判定)
- 若A为n阶正定矩阵,则A一定对称且可逆.
- 若A为n阶正定矩阵,则一定存在正定矩阵B,使得A=B2,也记作B=A21.
其他类型的实二次型
设有二次型f(x)=xTAx, ∀x=0,
- f(x)≥0,且∃x0=0,使f(x0)=0,则称f为半正定二次型,并称对称矩阵A是半正定的;
- f(x)≤0,且∃x0=0,使f(x0)=0,则称f为半负定二次型,并称对称矩阵A是半负定的.
注:
- 正定、半正定、负定、半负定二次型统称为有定二次型.
- 不是有定的二次型,就称为不定二次型.
- 有定矩阵一定是对称矩阵.
- 对称矩阵A为半负定矩阵⟺(−A)为半正定矩阵.
半正定二次型的判定
设A是n阶实对称矩阵,则下列命题等价:
- xTAx是半正定二次型(或A是半正定矩阵);
- A的正惯性指数为r(A)且r(A)<n;
- 存在降秩阵B使得A=BTB.
- A的n个特征值都大于等于0,且至少有一个等于0;
- A≃diag(1,⋯,1,0,⋯,0),其中有r(A)个1且r(A)<n;
- A的各阶顺序主子式大于等于0,且至少有一个等于0.