矩阵

定义

m×nm\times n个数aij(i=1,2,,m;j=1,2,n)a_{ij}(i=1,2,\dots,m;j=1,2,\dots n)排成的mmnn列的数表

A=(a11a12a1na21a22a2nam1am2amn)\boldsymbol{A}=\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1n} \\a_{21} & a_{22} & \dots & a_{2n} \\\vdots & \vdots & \ddots & \vdots \\a_{m1} & a_{m2} & \dots & a_{mn}\end{pmatrix}

称为m×nm\times n矩阵,通常用大写字母A,B,C\boldsymbol{A},\boldsymbol{B},\boldsymbol{C}等表示,记作:A\boldsymbol{A}Am×n\boldsymbol{A}_{m\times n}

aija_{ij}:矩阵AA的第ii行第jj列元素,简称为(i,j)(i,j)

矩阵也可以简记为A=(aij)m×n\boldsymbol{A}=(a_{ij})_{m\times n}A=(aij)\boldsymbol{A}=(a_{ij})

实矩阵:元素全为实数的矩阵
复矩阵:元素不全为实数的矩阵

eg:

(10452629):2×4的实矩阵(21i35672i9):3×3的复矩阵(301):3×1的实矩阵(269):1×3的实矩阵(4):1×1的实矩阵,就是这个数本身\begin{aligned} &\begin{pmatrix}1 &0 & 4 & 5 \\2 & 6 & 2 & -9\end{pmatrix}: 2\times 4的实矩阵 \\ &\begin{pmatrix}2& 1 & i \\3 & -5 & 6 \\7 & 2i & 9\end{pmatrix}:3\times 3的复矩阵 \\ &\begin{pmatrix}3 \\0 \\1\end{pmatrix}: 3\times 1的实矩阵 \\ &\begin{pmatrix}2 & 6 & 9\end{pmatrix}: 1\times 3的实矩阵 \\ &\begin{pmatrix}4\end{pmatrix}: 1\times 1的实矩阵,就是这个数本身 \end{aligned}

特殊矩阵

  1. 行矩阵(行向量):只有一行的矩阵
    A=(a11a12a1n)\boldsymbol{A}=\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1n}\end{pmatrix}

  2. 列矩阵(列向量):只有一列的矩阵
    A=(a11a21an1)\boldsymbol{A}=\begin{pmatrix}a_{11} \\a_{21} \\\vdots \\a_{n1}\end{pmatrix}

  3. 零矩阵:所有元素全为零的m×nm\times n矩阵,记作Om×n\boldsymbol{O}_{m\times n}O\boldsymbol{O}

  4. 方针:行数与列数相等,即m=nm=n的矩阵
    An×n=(a11a12a1na21a22a2nan1an2ann)\boldsymbol{A}_{n\times n}=\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1n} \\a_{21} & a_{22} & \dots & a_{2n} \\\vdots & \vdots & \ddots & \vdots \\a_{n1} & a_{n2} & \dots & a_{nn}\end{pmatrix}
    An×n\boldsymbol{A}_{n\times n}称为nn阶矩阵或者nn阶方阵,也记作An\boldsymbol{A}_{n}A\boldsymbol{A}
    a11,a22anna_{11},a_{22}\dots a_{nn}A\boldsymbol{A}主对角元

注意:方阵A=(aij)\boldsymbol{A}=(a_{ij})是一个数表,行列式D=aij\boldsymbol{D}=\begin{vmatrix}a_{ij}\end{vmatrix}是一个算式

  1. 三角矩阵

    1. 上三角矩阵 :主对角线以下全为零的方阵
      An=(a11a12a1n0a22a2n00ann)\boldsymbol{A_{n}}=\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1n} \\0 & a_{22} & \dots & a_{2n} \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \dots & a_{nn}\end{pmatrix}
    2. 下三角矩阵 :主对角线以上全为零的方阵
      An=(a1100a21a220an1an2ann)\boldsymbol{A_{n}}=\begin{pmatrix}a_{11} & 0 & \dots & 0 \\a_{21} & a_{22} & \dots & 0 \\\vdots & \vdots & \ddots & \vdots \\a_{n1} & a_{n2} & \dots & a_{nn}\end{pmatrix}
    3. 对角矩阵:主对角线以外全为零的方阵
      An=(a11000a22000ann)\boldsymbol{A_{n}}=\begin{pmatrix}a_{11} & 0 & \dots & 0 \\0 & a_{22} & \dots & 0 \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \dots & a_{nn}\end{pmatrix}
      又记作A=diag(a11,a22ann)\boldsymbol{A}=diag(a_{11},a_{22}\dots a_{nn})
      对角线:diagonal
  2. 数量矩阵:主对角线上的元素都相同的对角矩阵
    A=(a000a000a)\boldsymbol{A}=\begin{pmatrix}a & 0 & \dots & 0 \\0 & a & \dots & 0 \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \dots & a\end{pmatrix}
    特别地a=1a=1时称为nn单位矩阵(或nn单位阵),记为En\boldsymbol{E_{n}}In\boldsymbol{I_{n}}En=(100010001)\boldsymbol{E_{n}}=\begin{pmatrix}1 & 0 & \dots & 0 \\0 & 1 & \dots & 0 \\\vdots & \vdots & \ddots & \vdots \\0 & 0 & \dots & 1\end{pmatrix}

  3. 行阶梯形矩阵:若存在零行,零行都在非零行的下边;各非零行的首非零元只出现在上一行的首非零元的右边
    (353704160003)\begin{pmatrix}3 & 5 & 3& 7 \\0 & 4 & 1 & 6 \\0 & 0 & 0& 3\end{pmatrix}(00655000370000000000)\begin{pmatrix}0 & 0 & 6 & 5 & -5\\0 & 0 & 0 & 3 & 7 \\0 & 0 & 0 & 0 & 0 \\0 & 0 & 0 & 0 & 0\end{pmatrix}

  4. 行最简形矩阵:各非零行的首非零元为1(首1)且每个首1所在的其余元素都是0的行阶梯形矩阵
    (103701160000)\begin{pmatrix}\color{red}1 & 0 & 3& 7 \\0 & \color{red}1 & 1 & 6 \\0 & 0 & 0& 0\end{pmatrix}(00105000170000000000)\begin{pmatrix}0 & 0 & \color{red}1& 0 & -5\\0 & 0 & 0 & \color{red}1 & 7 \\0 & 0 & 0 & 0 & 0 \\0 & 0 & 0 & 0 & 0\end{pmatrix}

  5. 标准形矩阵:左上角为一个单位阵且其余元素都是零的行最简形矩阵
    (100001000000)\begin{pmatrix}\color{red}1 & \color{red}0 & 0& 0\\\color{red}0 & \color{red}1 & 0 & 0 \\0 & 0 & 0& 0\end{pmatrix}

同型矩阵与矩阵的相等

  1. 两个矩阵的行数、列数分别对应时,称它们为同型矩阵

eg:
(359653)(205784)为同型矩阵\begin{pmatrix}3 & 5 \\9 & 6 \\5 & 3\end{pmatrix}和\begin{pmatrix}2 & 0 \\5 & 7 \\8 & 4\end{pmatrix}为同型矩阵

  1. 若两个矩阵A=(aij)\boldsymbol{A}=(a_{ij})B=(bij)\boldsymbol{B}=(b_{ij})为同型矩阵,并且对应元素相等,即aij=bij(i=1,2,..,m;j=1,2,,n)a_{ij}=b_{ij}(i=1,2,..,m;j=1,2,\dots,n)则称矩阵A\boldsymbol{A}B\boldsymbol{B}相等记作A=B\boldsymbol{A}=\boldsymbol{B}

运算

加法

定义

设矩阵A=(aij)m×n\boldsymbol{A}=(a_{ij})_{m\times n}B=(bij)m×n\boldsymbol{B}=(b_{ij})_{m\times n}为同型矩阵,那么A\boldsymbol{A}B\boldsymbol{B}的和记作A+B\boldsymbol{A}+\boldsymbol{B},规定如下:
A+B=(aij+bij)=(a11+b11a12+b12a1n+b1na21+b21a22+b22a2n+b2nam1+bm1am2+bm2amn+bmn)\boldsymbol{A+B}=(a_{ij}+b_{ij})=\begin{pmatrix}a_{11}+b_{11} & a_{12}+b_{12} & \dots & a_{1n}+b_{1n} \\a_{21}+b_{21} & a_{22}+b_{22} & \dots & a_{2n}+b_{2n} \\\vdots & \vdots & \ddots & \vdots \\a_{m1}+b_{m1} & a_{m2}+b_{m2} & \dots & a_{mn}+b_{mn}\end{pmatrix}

运算规律

  1. 交换律A+B=B+A\boldsymbol{A+B=B+A}
  2. 结合律(A+B)+C=A+(B+C)\boldsymbol{(A+B)+C=A+(B+C)}
  • 矩阵加法运算的实质是数的加法,故上述运算规律显然成立

A=(aij)=(a11a12a1na21a22a2nam1am2amn)\boldsymbol{-A}=(-a_{ij})=\begin{pmatrix}-a_{11} & -a_{12} & \dots & -a_{1n} \\-a_{21} & -a_{22} & \dots & -a_{2n} \\\vdots & \vdots & \ddots & \vdots \\-a_{m1} & -a_{m2} & \dots & -a_{mn}\end{pmatrix}A\boldsymbol{A}负矩阵
利用负矩阵可定义矩阵的差AB=defA+(B)\boldsymbol{A-B\xlongequal{def}{A+(-B)}}
显然有A+(A)=O\boldsymbol{A+(-A)=O}

乘法

数乘

定义

kk与矩阵A=(aij)m×nA=(a_{ij})_{m\times n}的乘积记作kAk\boldsymbol{A}Ak\boldsymbol{A}k,简称数乘,规定为:kA=Ak=(ka11ka12ka1nka21ka22ka2nkam1kam2kamn)k\boldsymbol{A}=\boldsymbol{A}k=\begin{pmatrix}ka_{11} & ka_{12} & \dots & ka_{1n} \\ka_{21} & ka_{22} & \dots & ka_{2n} \\\vdots & \vdots & \ddots & \vdots \\ka_{m1} & ka_{m2} & \dots & ka_{mn}\end{pmatrix}
AB\boldsymbol{A、B}为同型矩阵,ktk、t为数则

  1. k(tA)=(kt)Ak(t\boldsymbol{A})=(kt)\boldsymbol{A}
  2. (k+t)A=kA+tA(k+t)\boldsymbol{A}=k\boldsymbol{A}+t\boldsymbol{A}
  3. k(A+B)=kA+kBk(\boldsymbol{A+B})=k\boldsymbol{A}+k\boldsymbol{B}
  4. 1A=A,0A=O1\boldsymbol{A}=\boldsymbol{A},0\boldsymbol{A}=\boldsymbol{O}

数乘矩阵数乘行列式的区别,如:

2(1225)=(24410)                21225=24252\begin{pmatrix}1 & 2 \\2 & 5\end{pmatrix}=\begin{pmatrix}2 & 4 \\4 & 10\end{pmatrix}\;\;\;\;\;\;\;\;2\begin{vmatrix}1 & 2 \\2 & 5\end{vmatrix}=\begin{vmatrix}2& 4 \\2 & 5\end{vmatrix}

矩阵加减法与数乘运算统称为矩阵的线性运算

矩阵乘法

定义

矩阵A=(aij)m×l\boldsymbol{A}=(a_{ij})_{m\times l} ,B=(bij)l×n\boldsymbol{B}=(b_{ij})_{l\times n} ,规定A\boldsymbol{A}B\boldsymbol{B}的乘积为C=AB=(cij)m×n\boldsymbol{C}=\boldsymbol{AB}=(c_{ij})_{m\times n} ,其中cij=ai1b1j+ai2b2j++ailblj=k=1laikbkj(i=1,2,,m;j=1,2,n)c_{ij}=a_{i1}b_{1j}+a_{i2}b_{2j}+\dots+a_{il}b_{lj}=\sum_{k=1}^l a_{ik}b_{kj}(i=1,2,\dots,m;j=1,2,\dots n)

  1. C\boldsymbol{C}cij\boldsymbol{c_{ij}}项即A\boldsymbol{A}的第i\boldsymbol{i}行向量与B\boldsymbol{B}的第j\boldsymbol{j}列向量相乘得到
  2. 乘法AB\boldsymbol{AB}有意义的条件:A\boldsymbol{A}的列数=B\boldsymbol{B}的行数
  3. C\boldsymbol{C}的行数=A\boldsymbol{A}的行数,C\boldsymbol{C}的列数=B\boldsymbol{B}的列数
  4. 矩阵乘法不满足交换律,即一般情况下ABBA\boldsymbol{AB\neq BA}
  5. 矩阵乘法不满足消去律,即ABOA=OB=O\boldsymbol{AB\neq O}\nRightarrow \boldsymbol{A= O}或\boldsymbol{B=O}AB=ACB=C\boldsymbol{AB=AC}\nRightarrow \boldsymbol{B=C}

eg:

矩阵A=(a11a12a13a21a22a23)矩阵B=(b11b12b21b22b31b32)则乘积为AB=(a11b11+a12b21+a13b31a11b12+a12b22+a13b32a21b11+a22b21+a23b31a21b12+a22b22+a23b32)\begin{aligned} &矩阵\boldsymbol{A}=\begin{pmatrix}a_{11} & a_{12} & a_{13} \\a_{21} & a_{22} & a_{23}\end{pmatrix} \\ &矩阵\boldsymbol{B}=\begin{pmatrix}b_{11} & b_{12} \\b_{21} & b_{22} \\b_{31} & b_{32}\end{pmatrix} \\ &则乘积为\boldsymbol{AB}=\begin{pmatrix}a_{11}b_{11}+a_{12}b_{21}+a_{13}b_{31} & a_{11}b_{12}+a_{12}b_{22}+a_{13}b_{32} \\a_{21}b_{11}+a_{22}b_{21}+a_{23}b_{31} & a_{21}b_{12}+a_{22}b_{22}+a_{23}b_{32}\end{pmatrix} \end{aligned}

来源

设有两个线性变换(1){y1=a11x1+a12x2+a13x3y2=a21x1+a22x2+a23x3            (2){x1=b11t1+b12t2x2=b21t1+b22t2x3=b31t1+b32t2要求从t1,t2y1,y2的线性变换,将(2)带入(1){y1=a11(b11t1+b12t2)+a12(b21t1+b22t2)+a13(b31t1+b32t2)y2=a21(b11t1+b12t2)+a22(b21t1+b22t2)+a23(b31t1+b32t2)这个线性变换称为变换(1)和变换(2)的乘积\begin{aligned} &设有两个线性变换 \\ &(1)\begin{cases} y_{1} = a_{11}x_{1}+a_{12}x_{2}+a_{13}x_{3} \\ y_{2} = a_{21}x_{1}+a_{22}x_{2}+a_{23}x_{3} \end{cases}\;\;\;\;\;\;(2)\begin{cases} x_{1} = b_{11}t_{1}+b_{12}t_{2} \\ x_{2} = b_{21}t_{1}+b_{22}t_{2} \\ x_{3} = b_{31}t_{1}+b_{32}t_{2} \end{cases} \\ &要求从t_{1},t_{2}到y_{1},y_{2}的线性变换,将(2)带入(1): \\ &\begin{cases} y_{1} = a_{11}(b_{11}t_{1}+b_{12}t_{2})+a_{12}(b_{21}t_{1}+b_{22}t_{2})+a_{13}(b_{31}t_{1}+b_{32}t_{2}) \\ y_{2} = a_{21}(b_{11}t_{1}+b_{12}t_{2})+a_{22}(b_{21}t_{1}+b_{22}t_{2})+a_{23}(b_{31}t_{1}+b_{32}t_{2}) \end{cases} \\ &这个线性变换称为变换(1)和变换(2)的乘积 \end{aligned}

矩阵乘法满足的运算律:

  1. 结合律:(AB)C=A(BC)\boldsymbol{(AB)C}=\boldsymbol{A(BC)}
  2. 分配律:A(B+C)=AB+AC\boldsymbol{A(B+C)=\boldsymbol{AB+AC}}λ(AB)=(λA)B=A(λB)\lambda \boldsymbol{(AB)}=(\lambda \boldsymbol{A})\boldsymbol{B}=\boldsymbol{A}(\lambda \boldsymbol{B})其中λ\lambda为数
简单结论
  1. AE=EA=A\boldsymbol{AE=EA=A},即E\boldsymbol{E}在矩阵乘法中的作用相当于1在数的乘法中的作用
  2. (λ1λ2λn)(a11a12a1ma21a22a2man1an2anm)=(λ1a11λ1a12λ1a1mλ2a21λ2a22λ2a2mλnan1λnan2λnanm)\begin{pmatrix}\lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\end{pmatrix}\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1m} \\a_{21} & a_{22} &\dots & a_{2m} \\\vdots & \vdots & & \vdots \\a_{n1} & a_{n2} & \dots & a_{nm}\end{pmatrix}=\begin{pmatrix}\lambda_{1}a_{11} & \lambda_{1}a_{12} & \dots & \lambda_{1}a_{1m} \\\lambda_{2}a_{21} & \lambda_{2}a_{22} &\dots & \lambda_{2}a_{2m} \\\vdots & \vdots & & \vdots \\\lambda_{n}a_{n1} & \lambda_{n}a_{n2} & \dots & \lambda_{n}a_{nm}\end{pmatrix}
    (a11a12a1na21a22a2nam1am2amn)(λ1λ2λn)=(λ1a11λ2a12λna1nλ1a21λ2a22λna2nλ1am1λ2am2λnamn)\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1n} \\a_{21} & a_{22} &\dots & a_{2n} \\\vdots & \vdots & & \vdots \\a_{m1} & a_{m2} & \dots & a_{mn}\end{pmatrix}\begin{pmatrix}\lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\end{pmatrix}=\begin{pmatrix}\lambda_{1}a_{11} & \lambda_{2}a_{12} & \dots & \lambda_{n}a_{1n} \\\lambda_{1}a_{21} & \lambda_{2}a_{22} &\dots & \lambda_{n}a_{2n} \\\vdots & \vdots & & \vdots \\\lambda_{1}a_{m1} & \lambda_{2}a_{m2} & \dots & \lambda_{n}a_{mn}\end{pmatrix}
    即一个对角线左(右)乘一个矩阵等于这一个矩阵每一行(列)乘以相应的对角元
  3. (λ1λ2λn)(μ1μ2μn)=(μ1μ2μn)(λ1λ2λn)\begin{pmatrix}\lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\end{pmatrix}\begin{pmatrix}\mu_{1}& & & \\ & \mu_{2}& & \\ & & \ddots & \\ & & & \mu_{n}\end{pmatrix}=\begin{pmatrix}\mu_{1}& & & \\ & \mu_{2}& & \\ & & \ddots & \\ & & & \mu_{n}\end{pmatrix}\begin{pmatrix}\lambda_{1} & & & \\ & \lambda_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\end{pmatrix}
    =(λ1μ1λ2μ2λnμn)=\begin{pmatrix}\lambda_{1}\mu_{1} & & & \\ & \lambda_{2}\mu_{2} & & \\ & & \ddots & \\ & & & \lambda_{n}\mu_{n}\end{pmatrix}
  4. (λ1λ2λn)(μ1μ2μn)=(λ1μnλ2μn1λnμ1)\begin{pmatrix} & & & \lambda_{1}\\ & & \lambda_{2} & \\ & \text{⋰} & & \\\lambda_{n} & & & \end{pmatrix}\begin{pmatrix}& & & \mu_{1} \\ & & \mu_{2} & \\ & \text{⋰} & & \\\mu_{n} & & & \end{pmatrix}=\begin{pmatrix} & & & \lambda_{1}\mu_{n}\\ & & \lambda_{2}\mu_{n-1} & \\ & \text{⋰} & & \\\lambda_{n}\mu_{1} & & & \end{pmatrix}
应用

A=(a11a12a1na21a22a2nam1am2amn)x=(x1x2xn)b=(b1b2bn)y=(y1y2yn)则线性方程组{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2                                                am1x1+am2x2++amnxn=bn可以表达为Ax=b线性变换{y1=a11x1+a12x2++a1nxny2=a21x1+a22x2++a2nxn                                                ym=am1x1+am2x2++amnxn可以表达为Ax=y其中A称为线性方程组或线性变换的系数矩阵\begin{aligned} &记\boldsymbol{A=}\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1n} \\a_{21} & a_{22} &\dots & a_{2n} \\\vdots & \vdots & & \vdots \\a_{m1} & a_{m2} & \dots & a_{mn}\end{pmatrix},\boldsymbol{x=}\begin{pmatrix}x_{1} \\x_{2}\\\vdots \\x_{n}\end{pmatrix},\boldsymbol{b=}\begin{pmatrix}b_{1} \\b_{2} \\\vdots \\b_{n}\end{pmatrix},\boldsymbol{y= }\begin{pmatrix}y_{1} \\y_{2} \\\vdots \\y_{n}\end{pmatrix} \\ &则线性方程组\begin{cases} a_{11}x_{1}+a_{12}x_{2}+\dots+a_{1n}x_{n}=b_{1} \\ a_{21}x_{1}+a_{22}x_{2}+\dots+a_{2n}x_{n}=b_{2} \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\vdots \\ a_{m1}x_{1}+a_{m_{2}}x_{2}+\dots+a_{mn}x_{n}=b_{n} \end{cases} \\ &可以表达为\boldsymbol{Ax=b} \\ &线性变换\begin{cases} y_{1}=a_{11}x_{1}+a_{12}x_{2}+\dots+a_{1n}x_{n} \\ y_{2}=a_{21}x_{1}+a_{22}x_{2}+\dots+a_{2n}x_{n} \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\vdots \\ y_{m}=a_{m1}x_{1}+a_{m_{2}}x_{2}+\dots+a_{mn}x_{n} \end{cases} \\ &可以表达为\boldsymbol{Ax=y} \\ &其中\boldsymbol{A}称为线性方程组或线性变换的\boldsymbol{系数矩阵} \end{aligned}

可交换矩阵

AB=BA\boldsymbol{AB=BA}时称A,B\boldsymbol{A,B}可交换

  • A,B\boldsymbol{A,B}可交换,则A,B\boldsymbol{A,B}一定为同阶方阵
  • 单位矩阵E\boldsymbol{E}与任何同阶方阵可交换,即AE=EA=A\boldsymbol{AE=EA=A}
  • 任何两个同阶对角阵可交换
  • 矩阵A\boldsymbol{A}与任何同阶矩阵B\boldsymbol{B}可交换\LeftrightarrowA为数量矩阵(kE)\boldsymbol{(kE)}

一方面,若A=kE\boldsymbol{A=kE}(kE)B=B(kE)=kB\boldsymbol{(kE)B=B(kE)=kB}
另一方面,若AB=BA\boldsymbol{AB=BA}对任何B\boldsymbol{B}成立,对某个固定的i\boldsymbol{i},分别取B=Bij:(ij)\boldsymbol{B=B_{ij}:(ij)}元为1,其余元素全为0(j=1,2,,n)(j=1,2,\dots,n),带入ABij=BijA\boldsymbol{AB_{ij}=B_{ij}A}计算可得出A=kE\boldsymbol{A=kE}

方阵的幂

A\boldsymbol{A}nn方阵kk为正整数,定义A1=A,Ak+1=AkA1\boldsymbol{A^1}=\boldsymbol{A},\boldsymbol{A^{k+1}=A^kA^1}
一般的称An=AAAA\boldsymbol{A^n=AAA\dots A}为方阵A\boldsymbol{A}次幂

当m、k为正整数时,有

AmAk=Am+k,(Am)k=Amk\boldsymbol{A^mA^k=A^{m+k}},\boldsymbol{(A^m)^k=A^{mk}}

一般(A+B)2A2+2AB+B2,(A+B)(AB)A2B2\boldsymbol{(A+B)^2\neq A^2+2AB+B^2,(A+B)(A-B)\neq A^2-B^2},若要“=”成立则需AB=BA\boldsymbol{AB=BA}

方阵的多项式

方阵A\boldsymbol{A}mm次多项式为f(A)=amAm+am1Am1++a1A+a0Ef(\boldsymbol{A})=a_{m}\boldsymbol{A^m}+a_{m-1}\boldsymbol{A^{m-1}}+\dots+a_{1}\boldsymbol{A}+a_{0}\boldsymbol{E}

  • f(x)g(x)f(x)g(x)为多项式,A\boldsymbol{A}nn阶方阵,因为Ak,Al,E\boldsymbol{A^k,A^l,E}都是可交换的,所以f(A)g(A)=g(A)f(A)f(\boldsymbol{A})g(\boldsymbol{A})=g(\boldsymbol{A})f(\boldsymbol{A})

  • 方阵A\boldsymbol{A}的多项式可以类似一般多项式一样相乘或分解因式
    eg:

(E+A)(2EA)=2E+AA2(EA)3=E3A+3A2A3A2E=(AE)(A+E)(A+kE)n=An+Cn1kAn1++Cnn1kn1A+knE\begin{aligned} &\boldsymbol{(E+A)(2E-A)=2E+A-A^2} \\ &\boldsymbol{(E-A)^3=E-3A+3A^2-A^3} \\ &\boldsymbol{A^2-E=(A-E)(A+E)} \\ &\boldsymbol{(A+kE)^n=A^n+C^1_{n}kA^{n-1}+\dots+C^{n-1}_{n}k^{n-1}A+k^nE} \end{aligned}

矩阵的转置

定义

将矩阵A=(aij)m×n\boldsymbol{A}=(a_{ij})_{m\times n}的行列互换,得到新的n×mn\times m矩阵,称为A\boldsymbol{A}转置矩阵,记作AT\boldsymbol{A^T}
eg:

A=(123456),AT=(142536)B=(12),BT=(12)\begin{aligned} &\boldsymbol{A=}\begin{pmatrix}1 & 2 & 3 \\4 & 5 & 6\end{pmatrix},\boldsymbol{A^T}=\begin{pmatrix}1 & 4 \\2 & 5 \\3 & 6\end{pmatrix} \\ &\boldsymbol{B=}\begin{pmatrix}1\\2\end{pmatrix},\boldsymbol{B^T}=\begin{pmatrix}1 & 2\end{pmatrix} \end{aligned}

运算性质

  1. (AT)T=A\boldsymbol{(A^T)^T=A}
  2. (A+B)T=AT+BT\boldsymbol{(A+B)^T=A^T+B^T}
  3. (λA)T=λAT\boldsymbol{(\lambda A)^T=\lambda A^T}
  4. (AB)T=BTAT\boldsymbol{(AB)^T=B^TA^T}
    一般地,(A1A2Ak)T=AkTAk1TA1T\boldsymbol{(A_{1}A_{2}\dots A_{k})^T=A^T_{k}A^T_{k-1}\dots A^T_{1}}

证明(AB)T=BTAT\boldsymbol{(AB)^T=B^TA^T}

A=(aij)m×s,B=(bij)s×n,AB=C=(cij)m×n,BTAT=D=(dij)n×m首先容易看到(AB)TBTAT为同型矩阵其次(AB)T(i,j)元即为(AB)(j,i)元:cij=aj1b1i+aj2b2i++ajsbsi注意到BT中第i行元素即为B中第i列元素b1i,b2i,,bsiAT中第j列元素即为A中第j行元素aj1,aj2,,ajsBTAT(i,j)元为dij=b1iaj1+b2iaj2++bsiajs综上可知(AB)T=BTAT\begin{aligned} &设\boldsymbol{A=(a_{ij})_{m\times s},B=(b_{ij})_{s\times n}} ,\\ &\boldsymbol{AB=C=(c_{ij})_{m\times n},B^TA^T=D=(d_{ij})_{n\times m}} \\ &首先容易看到\boldsymbol{(AB)^T}与\boldsymbol{B^TA^T}为同型矩阵 \\ &其次\boldsymbol{(AB)^T}的(i,j)元即为\boldsymbol{(AB)}的(j,i)元: \\ &c_{ij}=a_{j1}b_{1i}+a_{j2}b_{2i}+\dots+a_{js}b_{si} \\ &注意到\boldsymbol{B^T}中第i行元素即为\boldsymbol{B}中第i列元素b_{1i},b_{2i},\dots,b_{si},\\&\boldsymbol{A^T}中第j列元素即为\boldsymbol{A}中第j行元素a_{j1},a_{j2},\dots,a_{js} \\ &故\boldsymbol{B^TA^T}的(i,j)元为d_{ij}=b_{1i}a_{j1}+b_{2i}a_{j2}+\dots+b_{si}a_{js} \\ &综上可知\boldsymbol{(AB)^T=B^TA^T} \end{aligned}

对称矩阵与反对称矩阵

定义

A=(aij)\boldsymbol{A=}(a_{ij})nn阶方阵

  • 如果AT=AA^T=A,即aij=aji(i,j=1,2,,n)a_{ij}=a_{ji}(i,j=1,2,\dots,n),则称A\boldsymbol{A}为对称矩阵
  • 如果AT=AA^T=-A,即aij=aji(i,j=1,2,,n)a_{ij}=-a_{ji}(i,j=1,2,\dots,n),则称A\boldsymbol{A}为反对称矩阵
    显然,若A\boldsymbol{A}是反对称矩阵,那么对任意i,有aii=0a_{ii}=0,即主对角线为零

简单结论

  1. A\boldsymbol{A}为(反)对称矩阵,则AT,λA\boldsymbol{A^T,\lambda A}也是(反对称矩阵
  2. A,B\boldsymbol{A,B}为(反)对称矩阵,则A±B\boldsymbol{A\pm B}也是(反)对称矩阵
  3. A,B\boldsymbol{A,B}为同阶对称矩阵,则AB\boldsymbol{AB}也是对称矩阵\LeftrightarrowA\boldsymbol{A}B\boldsymbol{B}可交换

矩阵的共轭

定义

A=(aij)\boldsymbol{A}=(a_{ij})为复矩阵,用aij\overline{a_{ij}}表示aija_{ij}的共轭复数,记A=(aij)\overline{\boldsymbol{A}}=(\overline{a_{ij}}),称A\overline{\boldsymbol{A}}A\boldsymbol{A}的共轭矩阵

运算性质

  1. A+B=A+B\overline{\boldsymbol{A+B}}=\boldsymbol{\overline{A}+\overline{B}}
  2. λA=λ  A\overline{\boldsymbol{\lambda A}}=\boldsymbol{\overline{\lambda}\;\overline{A}}
  3. AB=A  B\boldsymbol{\overline{AB}}=\boldsymbol{\overline{A}\;\overline{B}}
  4. AT=(A)T\overline{\boldsymbol{A^T}}=(\overline{A})^T

矩阵的迹

定义

nn阶方阵A=(aij)m×n\boldsymbol{A=}(a_{ij})_{m\times n}的主对角线上的各元素之和a11+a22+anna_{11}+a_{22}+\dots a_{nn}称为A\boldsymbol{A},记作tr(A)\boldsymbol{tr(A)}

性质

  1. tr(A+B)=tr(A)+tr(B)tr(\boldsymbol{A+B})=tr(\boldsymbol{A})+tr(B)
  2. tr(kA)=ktr(A)tr(k\boldsymbol{A})=ktr(\boldsymbol{A})
  3. tr(AT)=tr(A)tr(\boldsymbol{A^T})=tr(\boldsymbol{A}),tr(A)=tr(A)tr(\overline{\boldsymbol{A}})=\overline{tr(\boldsymbol{A})}
  4. tr(AB)=tr(BA)tr(\boldsymbol{AB})=tr(\boldsymbol{BA})

方阵的行列式

定义

nn方阵A=(aij)\boldsymbol{A}=(a_{ij})的元素所构成的行列式(个元素的位置不变)称为方阵A\boldsymbol{A}的行列式,记作A\begin{vmatrix}\boldsymbol{A}\end{vmatrix}detA\det \boldsymbol{A}det(aij)\det(a_{ij})

运算性质

AB\boldsymbol{A}、\boldsymbol{B}nn阶方阵

  1. AT=A\begin{vmatrix}\boldsymbol{A^T}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}
  2. λA=λnA\begin{vmatrix}\lambda \boldsymbol{A}\end{vmatrix}=\lambda ^n\begin{vmatrix}\boldsymbol{A}\end{vmatrix}
  3. AB=AB=BA=BA\begin{vmatrix}\boldsymbol{AB}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\cdot \begin{vmatrix}\boldsymbol{B}\end{vmatrix}=\begin{vmatrix}\boldsymbol{B}\end{vmatrix}\cdot \begin{vmatrix}\boldsymbol{A}\end{vmatrix}=\begin{vmatrix}\boldsymbol{BA}\end{vmatrix}

证明AB=AB\begin{vmatrix}\boldsymbol{AB}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\cdot \begin{vmatrix}\boldsymbol{B}\end{vmatrix}:

AB=AOEB=AABEO=(1)nABAOE=(1)nABE=(1)nAB(1)n=AB\begin{aligned} &\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\begin{vmatrix}\boldsymbol{B}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A} & \boldsymbol{O} \\\boldsymbol{-E} & \boldsymbol{B}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A} & \boldsymbol{AB} \\\boldsymbol{-E} & \boldsymbol{O}\end{vmatrix}=(-1)^n\begin{vmatrix}\boldsymbol{AB} & \boldsymbol{A} \\\boldsymbol{O} & \boldsymbol{-E}\end{vmatrix} \\ &=(-1)^n\begin{vmatrix}\boldsymbol{AB}\end{vmatrix}\begin{vmatrix}\boldsymbol{-E}\end{vmatrix}=(-1)^n\begin{vmatrix} \boldsymbol{AB} \end{vmatrix}(-1)^n=\begin{vmatrix} \boldsymbol{AB} \end{vmatrix} \end{aligned}

伴随矩阵

定义

由方阵A\boldsymbol{A}的行列式A\begin{vmatrix}\boldsymbol{A}\end{vmatrix}中各元素的代数余子式Aij\boldsymbol{A_{ij}}构成的方阵A=(A11A21An1A12A22An2A1nA2nAnn)\boldsymbol{A^*}=\begin{pmatrix}\boldsymbol{A_{11}} & \boldsymbol{A_{21}} & \dots & \boldsymbol{A_{n1}} \\\boldsymbol{A_{12}} & \boldsymbol{A_{22}} & \dots & \boldsymbol{A_{n2}} \\\vdots & \vdots & & \vdots \\\boldsymbol{A_{1n}} & \boldsymbol{A_{2n}} & \dots & A_{nn}\end{pmatrix}称为A\boldsymbol{A}的伴随矩阵

A\boldsymbol{A^*}中元素的下标与AT\boldsymbol{A^T}中元素的下标一致,与A\boldsymbol{A}不同

定理

A\boldsymbol{A^*}nn阶方阵A=(aij)\boldsymbol{A}=(a_{ij})的伴随矩阵,则有AA=AA=AE\boldsymbol{AA^*}=\boldsymbol{A^*A}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\boldsymbol{E}

证明:

AA=(a11a12a1na21a22a2nan1an2ann)(A11A21An1A12A22An2A1nA2nAnn)=(A000A000A)=AE\begin{aligned} \boldsymbol{AA^*}&=\begin{pmatrix}a_{11} & a_{12} &\dots & a_{1n} \\a_{21} & a_{22} &\dots & a_{2n} \\\vdots & \vdots& & \vdots \\a_{n1} & a_{n2} & \dots & a_{nn}\end{pmatrix}\begin{pmatrix}\boldsymbol{A_{\color{red}11}}& \boldsymbol{A_{\color{red}21}} &\dots & \boldsymbol{A_{\color{red}n1}} \\\boldsymbol{A_{\color{red}12}} & \boldsymbol{A_{\color{red}22}}&\dots & \boldsymbol{A_{\color{red}n2}} \\\vdots & \vdots& & \vdots \\\boldsymbol{A_{\color{red}1n}} & \boldsymbol{A_{\color{red}2n}} & \dots & \boldsymbol{A_{\color{red}nn}}\end{pmatrix} \\ &=\begin{pmatrix}\begin{vmatrix} \boldsymbol{A} \end{vmatrix} & 0 &\dots & 0 \\0 & \begin{vmatrix} \boldsymbol{A} \end{vmatrix}&\dots & 0 \\\vdots & \vdots& & \vdots \\0 & 0 & \dots & \begin{vmatrix} \boldsymbol{A} \end{vmatrix}\end{pmatrix}=\begin{vmatrix} \boldsymbol{A} \end{vmatrix}\boldsymbol{E} \end{aligned}

结论

  • (AB)=BA(\boldsymbol{AB})^*=\boldsymbol{B^*}\boldsymbol{A^*}
    • 证明:
    • (AB)=AB(AB)1=ABB1A1=BA(\boldsymbol{AB})^*=\begin{vmatrix}\boldsymbol{AB}\end{vmatrix}(\boldsymbol{AB})^{-1}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\begin{vmatrix}\boldsymbol{B}\end{vmatrix}\boldsymbol{B^{-1}}\boldsymbol{A^{-1}}=\boldsymbol{B^*A^*}
  • (kA)=kn1A(k\boldsymbol{A})^*=k^{n-1}\boldsymbol{A^*}
    • 证明:
    • (kA)=kA(kA)1=knAk1A1=kn1A(\boldsymbol{kA})^*=\begin{vmatrix}\boldsymbol{kA}\end{vmatrix}(\boldsymbol{kA})^{-1}=k^n\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\boldsymbol{k^{-1}}\boldsymbol{A^{-1}}=\boldsymbol{k^{n-1}A^*}
  • (A)=An2A(\boldsymbol{A^*})^*=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}^{n-2}\boldsymbol{A}
    • 证明:
    • (A)=A(A)1=An1(AA1)1=An2A(\boldsymbol{A^*})^*=\begin{vmatrix}\boldsymbol{A^*}\end{vmatrix}(\boldsymbol{A^*})^{-1}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}^{n-1}(\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\boldsymbol{A^{-1}})^{-1}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}^{n-2}\boldsymbol{A}
  • A=An1\begin{vmatrix}\boldsymbol{A^*}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}^{n-1}(无论A\boldsymbol{A}是否可逆都成立)
    • 证明:
    • AA=AE两边取行列式得:AA=An,那么易得A=An1在\boldsymbol{AA^*}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\boldsymbol{E}两边取行列式得:\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\begin{vmatrix}\boldsymbol{A^*}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}^n,那么易得\begin{vmatrix}\boldsymbol{A^*}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}^{n-1}
  • (A)1=(A1)(\boldsymbol{A^*})^{-1}=(\boldsymbol{A^{-1}})^*
  • (AT)1=(A1)T(\boldsymbol{A^T})^{-1}=(\boldsymbol{A^{-1}})^T
  • AAT=E\boldsymbol{AA^T=E},则(A)T=(A)1(\boldsymbol{A^*})^T=(\boldsymbol{A^*})^{-1}

方阵A\boldsymbol{A}在可逆的条件下,A\boldsymbol{A^*}的问题可以转化为A1\boldsymbol{A^{-1}}的问题

可逆矩阵和逆矩阵

定义

对于nn阶方阵A\boldsymbol{A},若存在nn阶方阵B\boldsymbol{B},满足AB=BA=E\boldsymbol{AB=BA=E}则称方阵A\boldsymbol{A}可逆,且称B\boldsymbol{B}A\boldsymbol{A}的逆矩阵,记作B=A1\boldsymbol{B=A^{-1}}

  • A\boldsymbol{A}是可逆矩阵,则A\boldsymbol{A}的逆矩阵是唯一的
    证明:

BC都是A的逆矩阵,则有AB=BA=E,AC=CA=E于是B=EB=CAB=CE=C故,A的逆矩阵是唯一的\begin{aligned} &设\boldsymbol{B}和\boldsymbol{C}都是\boldsymbol{A}的逆矩阵,则有 \\ &\boldsymbol{AB=BA=E,AC=CA=E} \\ &于是 \boldsymbol{B=EB=CAB=CE=C} \\ &故,\boldsymbol{A}的逆矩阵是唯一的 \end{aligned}

  1. 只有方阵才有逆矩阵
  2. 逆矩阵的记号A1\boldsymbol{A^{-1}}是特定的,不能写作1A\frac{1}{\boldsymbol{A}}
  3. B\boldsymbol{B}A\boldsymbol{A}的逆矩阵,那么A\boldsymbol{A}也是B\boldsymbol{B}的逆矩阵
  4. E1=E\boldsymbol{E^{-1}}=E

运算性质

  1. A\boldsymbol{A}可逆,则A1\boldsymbol{A^{-1}}也可逆,且(A1)1=A(\boldsymbol{A^{-1}})^{-1}=\boldsymbol{A}
  2. A\boldsymbol{A}可逆,且数k0k\neq 0,则kAk\boldsymbol{A}也可逆,且(kA)1=1kA1(k\boldsymbol{A})^{-1}=\frac{1}{k}\boldsymbol{A^{-1}}
  3. A,B\boldsymbol{A,B}为同阶可逆方阵,则AB\boldsymbol{AB}也可逆,且(AB)1=B1A1(\boldsymbol{AB})^{-1}=\boldsymbol{B^{-1}}\boldsymbol{A^{-1}}
  4. A\boldsymbol{A}可逆,则AT\boldsymbol{A^T}也可逆,且(AT)1=(A1)T(\boldsymbol{A^T})^{-1}=(\boldsymbol{A}^{-1})^T
  5. A\boldsymbol{A}可逆,则A1=A1\begin{vmatrix}\boldsymbol{A^{-1}}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}\end{vmatrix}^{-1}

(A+B)1A1+B1(\boldsymbol{A+B})^{-1}\neq \boldsymbol{A^{-1}}+\boldsymbol{B^{-1}}

求逆矩阵的方法

利用定义求逆矩阵

A=(2413)的逆矩阵:A1=(abcd),则有(2413)(abcd)=(1001){2a+4c=12b+4d=0a+3c=0b+3d=1      {a=32b=2c=12d=1A1=(322121)\begin{aligned} &求\boldsymbol{A}=\begin{pmatrix}2 & 4 \\1 & 3\end{pmatrix}的逆矩阵: \\ &设\boldsymbol{A^{-1}}=\begin{pmatrix}a& b \\c& d\end{pmatrix},则有\begin{pmatrix}2 & 4 \\1 & 3\end{pmatrix}\begin{pmatrix}a& b \\c& d\end{pmatrix}=\begin{pmatrix}1& 0\\0 & 1\end{pmatrix} \\ &即\begin{cases} 2a+4c=1 \\ 2b+4d=0 \\ a+3c=0 \\ b+3d=1 \end{cases} \;\;\;\Rightarrow \begin{cases} a=\frac{3}{2} \\ b=-2 \\ c=-\frac{1}{2} \\ d=1 \end{cases} \\ &即\boldsymbol{A^{-1}}=\begin{pmatrix} \frac{3}{2} & -2 \\ -\frac{1}{2} & 1\end{pmatrix} \end{aligned}

#利用定义来求逆矩阵,对于高阶矩阵计算量十分庞大

利用公式求逆矩阵

伴随矩阵的定理可知A1=1AA\boldsymbol{A^{-1}}=\frac{1}{\begin{vmatrix}\boldsymbol{A}\end{vmatrix}}\boldsymbol{A^*},同时也可知矩阵可逆的充要条件为A0\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\neq 0

结论:

  1. 二阶方阵A=(abcd)\boldsymbol{A}=\begin{pmatrix}a & b \\c & d\end{pmatrix}可逆A=adbc0\Leftrightarrow\begin{vmatrix}\boldsymbol{A}\end{vmatrix}=ad-bc\neq 0,且A1=1adbc(dbca)\boldsymbol{A^{-1}}=\frac{1}{ad-bc}\begin{pmatrix}d& -b \\-c & a \end{pmatrix}
  2. A=diag(a1,a2,,an)\boldsymbol{A}=diag(a_{1},a_{2},\dots ,a_{n})可逆a1a2an0\Leftrightarrow a_{1}a_{2}\dots a_{n}\neq 0,且A1=diag(a11,a21,,an1)\boldsymbol{A^{-1}}=diag(a_{1}^{-1},a_{2}^{-1},\dots ,a_{n}^{-1})
  3. 方阵A=(000λ100λ20000λn000)\boldsymbol{A}=\begin{pmatrix}0 & 0& 0 & \lambda_{1} \\0 & 0 & \lambda_{2} & 0 \\0 & \text{⋰} & 0 & 0 \\\lambda_{n}& 0 & 0& 0\end{pmatrix}可逆λi0(1=1,2,,n)\Leftrightarrow\lambda_{i}\neq 0(1=1,2,\dots,n),且A1=A=(000λn100λn110000λ11000)\boldsymbol{A^{-1}}=\boldsymbol{A}=\begin{pmatrix}0 & 0& 0 & \lambda_{n}^{-1} \\0 & 0 & \lambda_{n-1}^{-1} & 0 \\0 & \text{⋰} & 0 & 0 \\\lambda_{1}^{-1}& 0 & 0& 0\end{pmatrix}

利用初等变换求逆矩阵

A\boldsymbol{A}可逆时存在初等矩阵G1,G2,,Gl\boldsymbol{G}_{1}, \boldsymbol{G}_{2}, \cdots, \boldsymbol{G}_{l}使得

A=G1G2GlGl1G21G11A=EGl1G21G11E=A1\begin{aligned} \boldsymbol{A=G_{1}G_{2}\cdots G_{l}}& \Rightarrow \boldsymbol{G_{l}^{-1} \cdots G_{2}^{-1} G_{1}^{-1} A=E} \\ &\Rightarrow \boldsymbol{G_{l}^{-1} \cdots G_{2}^{-1} G_{1}^{-1} E=A^{-1}} \end{aligned}

一系列初等行变换将A化为E,它们同时将E化为A1一系列初等行变换将 \boldsymbol{A} 化为 \boldsymbol{E} ,它们同时将 \boldsymbol{E} 化为 \boldsymbol{A}^{-\mathbf{1}}
于是得到求逆矩阵的主要方法:
(AE)(EA1)\boldsymbol{(A \mid E) \sim\left(E \mid A^{-1}\right)}

逆矩阵的应用

  1. 证明Cramer法则
  2. 对于矩阵方程AX=B\boldsymbol{AX=B},若A\boldsymbol{A}可逆,则X=A1B\boldsymbol{X=A^{-1}B}
  3. 对于矩阵方程XA=B\boldsymbol{XA=B},若A\boldsymbol{A}可逆,则X=BA1\boldsymbol{X=BA^{-1}}
  4. 对于矩阵方程AXB=C\boldsymbol{AXB=C},若A\boldsymbol{A}可逆,则X=A1CB1\boldsymbol{X=A^{-1}CB^{-1}}

奇异矩阵与非奇异矩阵

  • 奇异矩阵:A=0\begin{vmatrix}\boldsymbol{A}\end{vmatrix}=0(不可逆矩阵,退化矩阵)
  • 非奇异矩阵:A0\begin{vmatrix}\boldsymbol{A}\end{vmatrix}\neq 0(可逆矩阵,非退化矩阵)

矩阵的初等变换

定义

矩阵的下列3种行(列)变换称为矩阵的初等行(列)变换

  1. 对换变换:交换矩阵的i,ji,j两行(列),记作rirj(cicj)r_{i}\leftrightarrow r_{j}(c_{i}\leftrightarrow c_{j})
  2. 倍乘变换:用非零常数kk乘以矩阵的第ii行(列),记作kri(kci)kr_{i}(kc_{i})ri×k(ci×k)r_{i}\times k(c_{i}\times k)
  3. 倍加变换:将矩阵的第ii行(列)倍加到第jj行(列),记作rj+kri(cj+kci)r_{j}+kr_{i}(c_{j}+kc_{i})

等价矩阵:若矩阵A\boldsymbol{A}经有限次初等变换化成矩阵B\boldsymbol{B},则称矩阵AB\boldsymbol{A}和\boldsymbol{B}等价,记为AB\boldsymbol{A}\sim \boldsymbol{B}

矩阵的初等行变换和初等列变换统称为初等变换

性质

  • 初等变换不改变方阵的可逆性
    • 若方阵An\boldsymbol{A_{n}}可逆,则An\boldsymbol{A_{n}}可经过有限次的初等变换化为单位矩阵En\boldsymbol{E_{n}},即可逆阵AnEn\boldsymbol{A_{n}}\sim\boldsymbol{E_{n}}

初等矩阵

定义

由单位阵E\boldsymbol{E}经过一次初等变换得到的方阵称为初等矩阵

三种初等变换对应三种初等矩阵:

  1. 对换矩阵E(ij)\boldsymbol{E(i\leftrightarrow j)}:交换E\boldsymbol{E}i,ji,j两行(列)
  2. 倍乘矩阵E(i(k))\boldsymbol{E(i(k))}:用非零数kk乘以E\boldsymbol{E}的第ii行(列)
  3. 倍加矩阵E(i+j(k))\boldsymbol{E(i+j(k))}:将E\boldsymbol{E}的第jj行(列)的kk倍加到第ii行(列)

性质

  1. 初等变换都是可逆的,从而初等矩阵都是可逆的
  2. E(ij)1=E(ij)\boldsymbol{E}(i\leftrightarrow j)^{-1}=\boldsymbol{E}(i\leftrightarrow j)
  3. E(i(k))1=E(i(1k))\boldsymbol{E}(i(k))^{-1}=\boldsymbol{E}\left( i\left( \frac{1}{k} \right) \right)
  4. E(i+j(k))1=E(i+j(k))\boldsymbol{E}(i+j(k))^{-1}=\boldsymbol{E}(i+j(-k))
  5. E(ij)=1\begin{vmatrix}\boldsymbol{E}(i\leftrightarrow j)\end{vmatrix}=-1
  6. E(i(k))=k(0)\begin{vmatrix}\boldsymbol{E}(i(k))\end{vmatrix}=k(\neq 0)
  7. E(i+j(k))=1\begin{vmatrix}\boldsymbol{E}(i+j(k))\end{vmatrix}=1

应用

A\boldsymbol{A}m×nm\times n的矩阵,用初等矩阵左乘A\boldsymbol{A}等同于对A\boldsymbol{A}作相应的初等行变换,用初等矩阵右乘等同于对A\boldsymbol{A}作相应的初等列变换

具体地:

  1. Em(ij)A\boldsymbol{E}_{m}(i\leftrightarrow j)\boldsymbol{A}\Leftrightarrow交换A\boldsymbol{A}i,ji,j两行

    AEn(ij)\boldsymbol{A}\boldsymbol{E}_{n}(i\leftrightarrow j)\Leftrightarrow交换的i,ji,j两列

  2. Em(i(k))A\boldsymbol{E}_{m}(i(k))\boldsymbol{A}\Leftrightarrow用数k(0)k(\neq 0)乘以A\boldsymbol{A}的第ii

    AEn(i(k))\boldsymbol{A}\boldsymbol{E}_{n}(i(k))\Leftrightarrow用数k(0)k(\neq 0)乘以的第ii

  3. Em(i+j(k))A\boldsymbol{E}_{m}(i+j(k))\boldsymbol{A}\LeftrightarrowA\boldsymbol{A}的第jj行的kk倍加到第ii行上去

    AEm(i+j(k))\boldsymbol{A}\boldsymbol{E}_{m}(i+j(k))\LeftrightarrowA\boldsymbol{A}的第jj列的kk倍加到第ii列上去

左乘则行变,右乘则列变

和可逆矩阵的关系

方阵A\boldsymbol{A}可逆A\Leftrightarrow\boldsymbol{A}可以表示成有限多个初等矩阵的积

利用初等变换解矩阵方程

对于矩阵方程AX=B\boldsymbol{A} \boldsymbol{X}=\boldsymbol{B} ,如果A\boldsymbol{A}可逆,则X=A1B\boldsymbol{X=A^{-1} B}那么进行初等行变换(AB)(EA1B)\boldsymbol{(\boldsymbol{A} \mid \boldsymbol{B}) \sim\left(\boldsymbol{E} \mid \boldsymbol{A}^{-\mathbf{1}} \boldsymbol{B}\right)},即一系列初等行变换将A\boldsymbol{A}变为E\boldsymbol{E}的同时也将B\boldsymbol{B}变为了A1B\boldsymbol{A^{-1} B}

理由:对A\boldsymbol{A}做行变换将A\boldsymbol{A}变成E\boldsymbol{E},即有初等矩阵Ps,P2,P1\boldsymbol{P_{s}, \cdots P_{2}, P_{1}},使得PsP2P1A=E\boldsymbol{P_{s} \cdots P_{2} P_{1} A=E},那么一定有PsP2P1=A1\boldsymbol{P_{s} \cdots P_{2} P_{1}=A^{-1}},而对B\boldsymbol{B}进行了相同的初等行变换,相当于用PsP2P1\boldsymbol{P_{s} \cdots P_{2} P_{1}}左乘B\boldsymbol{B},故PsP2P1B=A1B\boldsymbol{P_{s} \cdots P_{2} P_{1} B=A^{-1} B}

对于矩阵方程XA=B\boldsymbol{XA=B},如果B\boldsymbol{B}可逆,则X=BA1\boldsymbol{X=BA^{-1}}那么进行初等列变换(AB)(EBA1)\begin{pmatrix}\boldsymbol{A} \\\boldsymbol{B}\end{pmatrix}\sim \begin{pmatrix}\boldsymbol{E} \\\boldsymbol{BA^{-1}}\end{pmatrix}或者XA=BATXT=BT\boldsymbol{XA=B}\Rightarrow\boldsymbol{A^TX^T=B^T}那么进行初等行变换(ATBT)(E(AT)1BT)\boldsymbol{(\boldsymbol{A^T} \mid \boldsymbol{B^T}) \sim\left(\boldsymbol{E} \mid (\boldsymbol{A^T})^{-\mathbf{1}} \boldsymbol{B^T}\right)}

分块矩阵

对于行数与列数较高的矩阵,为了简化其运算,经常采用分块法,使大矩阵的运算化为小矩阵的运算

具体实现:将矩阵A\boldsymbol{A}用若干条纵线和横线分成若干小块,每一个小块称为A\boldsymbol{A}的子块(子矩阵),以子块为元素的矩阵称为分块矩阵

eg:

A=(a11a12a13a14a21a22a23a24a31a32a33a34a41a42a43a44)=(C1C2C3C4)其中C1=(a11a12),C2=(a13a14),C3=(a21a22a31a32a41a42),C4=(a23a24a33a34a43a44)\begin{aligned} &\boldsymbol{A}=\begin{pmatrix}a_{11} & a_{12} & \mid & a_{13} & a_{14} \\-& - & \mid & - & -\\a_{21} & a_{22} & \mid & a_{23} & a_{24} \\a_{31} & a_{32} & \mid & a_{33} & a_{34} \\a_{41} & a_{42} & \mid & a_{43} & a_{44}\end{pmatrix} =\begin{pmatrix}\boldsymbol{C_{1}} & \boldsymbol{C_{2}}\\\boldsymbol{C_{3}} & \boldsymbol{C_{4}}\end{pmatrix} \\ &其中\boldsymbol{C_{1}}=\begin{pmatrix}a_{11} & a_{12}\end{pmatrix},\boldsymbol{C_{2}}=\begin{pmatrix}a_{13} & a_{14}\end{pmatrix}, \\ &\boldsymbol{C_{3}}=\begin{pmatrix}a_{21} & a_{22} \\a_{31} & a_{32} \\a_{41} & a_{42}\end{pmatrix},\boldsymbol{C_{4}}=\begin{pmatrix}a_{23} & a_{24} \\a_{33} & a_{34} \\a_{43} & a_{44}\end{pmatrix} \end{aligned}

对于同一矩阵, 采用不同的分块方法, 会得到不同的分块矩阵

运算

设矩阵AB\boldsymbol{A}与\boldsymbol{B}同型矩阵kk为实数,对和B\boldsymbol{B}采用相同的分块法

A=(A11A12A1nA21A22A2nAm1Am2Amn)B=(B11B12B1nB21B22B2nBm1Bm2Bmn)\boldsymbol{A}=\begin{pmatrix} \boldsymbol{A}_{11}& \boldsymbol{A}_{12}& \cdots & \boldsymbol{A}_{1n} \\ \boldsymbol{A}_{21}& \boldsymbol{A}_{22}& \cdots & \boldsymbol{A}_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \boldsymbol{A}_{m1}& \boldsymbol{A}_{m2}& \cdots & \boldsymbol{A}_{mn} \end{pmatrix} \boldsymbol{B}=\begin{pmatrix} \boldsymbol{B}_{11}& \boldsymbol{B}_{12}& \cdots & \boldsymbol{B}_{1n} \\ \boldsymbol{B}_{21}& \boldsymbol{B}_{22}& \cdots & \boldsymbol{B}_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \boldsymbol{B}_{m1}& \boldsymbol{B}_{m2}& \cdots & \boldsymbol{B}_{mn} \end{pmatrix}

其中Aij\boldsymbol{A_{ij}}Bij\boldsymbol{B_{ij}}为同型矩阵,则
1.

A+B=(A11+B11A12+B12A1n+B1nA21+B21A22+B22A2n+B2nAm1+Bm1Am2+Bm2Amn+Bmn)\boldsymbol{A+B}=\begin{pmatrix} \boldsymbol{A}_{11}+\boldsymbol{B}_{11}& \boldsymbol{A}_{12}+\boldsymbol{B}_{12}& \cdots & \boldsymbol{A}_{1n}+\boldsymbol{B}_{1n} \\ \boldsymbol{A}_{21}+\boldsymbol{B}_{21}& \boldsymbol{A}_{22}+\boldsymbol{B}_{22}& \cdots & \boldsymbol{A}_{2n}+\boldsymbol{B}_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \boldsymbol{A}_{m1}+\boldsymbol{B}_{m1}& \boldsymbol{A}_{m2}+\boldsymbol{B}_{m2}& \cdots & \boldsymbol{A}_{mn}+\boldsymbol{B}_{mn} \end{pmatrix}

kA=(kA11kA12kA1nkA21kA22kA2nkAm1kAm2kAmn)k\boldsymbol{A}= \begin{pmatrix} k\boldsymbol{A}_{11}& k\boldsymbol{A}_{12}& \cdots & k\boldsymbol{A}_{1n} \\ k\boldsymbol{A}_{21}& k\boldsymbol{A}_{22}& \cdots & k\boldsymbol{A}_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ k\boldsymbol{A}_{m1}& k\boldsymbol{A}_{m2}& \cdots & k\boldsymbol{A}_{mn} \end{pmatrix}

AT=(A11TA21TAm1TA12TA22TAm2TA1nTA2nTAnmT)\boldsymbol{A^T}= \begin{pmatrix} \boldsymbol{A}^T_{11}& \boldsymbol{A}^T_{21}& \cdots & \boldsymbol{A}^T_{m1} \\ \boldsymbol{A}^T_{12}& \boldsymbol{A}^T_{22}& \cdots & \boldsymbol{A}^T_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ \boldsymbol{A}^T_{1n}& \boldsymbol{A}^T_{2n}& \cdots & \boldsymbol{A}^T_{nm} \end{pmatrix}

分块矩阵的转置:矩阵本身转置,每一个子块也转置

分块对角矩阵

定义

形如:A=(A1A2An)\boldsymbol{A}=\begin{pmatrix}\boldsymbol{A}_{1} & & & \\ & \boldsymbol{A}_{2} & & \\ & & \ddots & \\ & & & \boldsymbol{A}_{n}\end{pmatrix}的分块矩阵称为分块对角矩阵,其中Ai(i=1,2,,n)\boldsymbol{A}_{i}(i=1,2,\dots,n)均为方阵

  • 若矩阵为方阵,且非零元集中在主对角线附近,可分块为对角矩阵
  • 显然分块对角矩阵的和、差、数乘、乘积仍为分块对角矩阵

性质

  1. A=A1A2An\begin{vmatrix}\boldsymbol{A}\end{vmatrix}=\begin{vmatrix}\boldsymbol{A}_{1}\end{vmatrix}\begin{vmatrix}\boldsymbol{A}_{2}\end{vmatrix}\dots \begin{vmatrix}\boldsymbol{A}\end{vmatrix}_{n}
  2. (A1A2An)(B1B2Bn)=(A1B1A2B2AnBn)\begin{pmatrix}\boldsymbol{A}_{1} & & & \\ & \boldsymbol{A}_{2} & & \\ & & \ddots & \\ & & & \boldsymbol{A}_{n}\end{pmatrix}\begin{pmatrix}\boldsymbol{B}_{1} & & & \\ & \boldsymbol{B}_{2} & & \\ & & \ddots & \\ & & & \boldsymbol{B}_{n}\end{pmatrix}=\begin{pmatrix}\boldsymbol{A}_{1}\boldsymbol{B}_{1} & & & \\ & \boldsymbol{A}_{2} \boldsymbol{B}_{2} & & \\ & & \ddots & \\ & & & \boldsymbol{A}_{n}\boldsymbol{B}_{n}\end{pmatrix}
  3. 分块对角阵A\boldsymbol{A}可逆Ai(i=1,2,n)\Leftrightarrow\boldsymbol{A}_{i}(i=1,2,\dots n)都可逆,且A1=(A11A21An1)\boldsymbol{A}^{-1}=\begin{pmatrix}\boldsymbol{A}_{1}^{-1} & & & \\ & \boldsymbol{A}_{2}^{-1} & & \\ & & \ddots & \\ & & & \boldsymbol{A}_{n}^{-1}\end{pmatrix}

分块初等矩阵

对分块单位阵E=(E1OE2OEn)\boldsymbol{E}=\begin{pmatrix}\boldsymbol{E}_{1} & & & O \\ & \boldsymbol{E}_{2} & & \\ & &\ddots & \\ O & & & \boldsymbol{E}_{n}\end{pmatrix}进行一次初等变换得到初等分块矩阵

  • 分块初等矩阵都是方阵
  • 在运算可行的前提下,分块初等矩阵在分块矩阵的乘法中的作用与普通初等矩阵在矩阵乘法中的作用相同

矩阵的秩

矩阵的行秩和列秩

定义

矩阵A=(a11a12a1na21a22a2nam1am2amn)=(α1,α2,,αn)=(β1Tβ2TβmT)\boldsymbol{A}=\begin{pmatrix}a_{11} & a_{12} & \dots & a_{1n} \\a_{21} & a_{22} & \dots & a_{2n} \\\vdots & \vdots & \ddots & \vdots \\a_{m1} & a_{m2} & \dots & a_{mn}\end{pmatrix}=(\boldsymbol{\alpha_{1},\alpha_{2},\dots,\alpha_{n}})=\begin{pmatrix}\boldsymbol{\beta_{1}^T} \\\boldsymbol{\beta_{2}^T} \\\vdots \\\boldsymbol{\beta_{m}^T}\end{pmatrix}
α1,α2,,αn\boldsymbol{\alpha_{1},\alpha_{2},\dots,\alpha_{n}}A\boldsymbol{A}列向量组,列向量组的秩n\leq n
β1T,β2T,,βmT\boldsymbol{\beta_{1}^T} ,\boldsymbol{\beta_{2}^T} ,\dots ,\boldsymbol{\beta_{m}^T}A\boldsymbol{A}行向量组,列向量组的秩m\leq m

矩阵Am×nA_{m\times n}的行向量组的秩称为A\boldsymbol{A}行秩,列向量组的秩称为A\boldsymbol{A}列秩

性质

  1. 任何矩阵都有行秩=列秩,行阶梯形矩阵额外有行秩、列秩=其中非零行的行数
  2. 初等行变换不改变矩阵的行秩,初等列变换不改变矩阵的列秩
  3. 初等行变换不改变矩阵的列向量组的线性相关性,从而也不改变矩阵的列秩,同理初等列变换不改变矩阵的行秩
  4. A\boldsymbol{A}m×nm\times n矩阵,且其行秩为rr,则一定存在mm阶可逆阵P\boldsymbol{P}nn阶可逆阵Q\boldsymbol{Q},使得PAQ=D=(ErOOO)\boldsymbol{PAQ}=\boldsymbol{D}=\begin{pmatrix}\boldsymbol{E_{r}} & \boldsymbol{O} \\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}

定义

矩阵A\boldsymbol{A}的行秩和列秩统称为矩阵A\boldsymbol{A},记为秩(A)(\boldsymbol{A})rank(A)rank(\boldsymbol{A})r(A)r(\boldsymbol{A})

易得:

  1. A\boldsymbol{A}m×nm\times n的矩阵,则r(A)min{m,n}r(\boldsymbol{A})\leq min\{m,n\}
  2. r(A)=0A=Or(\boldsymbol{A})=0\Leftrightarrow\boldsymbol{A}=\boldsymbol{O}

则有推论:

  1. 矩阵的初等变换不改变矩阵的秩
  2. 等价矩阵的秩相等
  3. 矩阵A\boldsymbol{A}的标准形唯一且由r(A)r(\boldsymbol{A})决定,即:若r(A)=rr(\boldsymbol{A})=r,则A\boldsymbol{A}的标准形为(ErOOO)\begin{pmatrix}\boldsymbol{E_{r}} & \boldsymbol{O} \\\boldsymbol{O} & \boldsymbol{O}\end{pmatrix}
  4. nn阶矩阵A\boldsymbol{A}的秩等于nA=0An\Leftrightarrow|\boldsymbol{A}|=0\Leftrightarrow\boldsymbol{A}可逆,此时也称A\boldsymbol{A}为满秩矩阵(非奇异矩阵、非退化矩阵)

性质

  1. 0r(Am×n)min{m,n}0\leq r(\boldsymbol{A}_{m\times n})\leq min\{m,n\}
  2. r(A)=r(A)r(\boldsymbol{A})=r(\boldsymbol{A})
  3. r(A+B)r(A)+r(B)r(\boldsymbol{A+B})\leq r(\boldsymbol{A})+r(\boldsymbol{B})
  4. r(AB)min{r(A),r(B)}r(\boldsymbol{AB})\leq min\{r(\boldsymbol{A}),r(\boldsymbol{B})\}
  5. P,Q\boldsymbol{P,Q}可逆,则r(A)=r(PA)=r(AQ)=r(PAQ)r(\boldsymbol{A})=r(\boldsymbol{PA})=r(\boldsymbol{AQ})=r(\boldsymbol{PAQ})
  6. r(AOOB)=r(A)+r(B),r(ADOB)r(A)+r(B)r\begin{pmatrix}\boldsymbol{A} & \boldsymbol{O} \\\boldsymbol{O} & \boldsymbol{B}\end{pmatrix}=r(\boldsymbol{A})+r(\boldsymbol{B}),r\begin{pmatrix}\boldsymbol{A} & \boldsymbol{D} \\\boldsymbol{O} & \boldsymbol{B}\end{pmatrix}\geq r(\boldsymbol{A})+r(\boldsymbol{B})
  7. 设有矩阵Am×s,Bs×n\boldsymbol{A}_{m\times s},\boldsymbol{B}_{s\times n},有r(A)+r(B)sr(AB)min{r(A),r(B)}r(\boldsymbol{A})+r(\boldsymbol{B})-s\leq r(\boldsymbol{AB})\leq min\{r(\boldsymbol{A}),r(\boldsymbol{B})\}

矩阵的kk阶子式

定义

m×nm\times n矩阵A\boldsymbol{A}中任取k(i1,i2,,ik)k(i_{1},i_{2},\dots,i_{k})k(j1j2,,jk)k(j_{1}j_{2},\dots,j_{k})(km,kn)(k\leq m,k\leq n),位于这些行列交叉处的k2k^2个元素按它们原来的位置次序排列得到的kk阶行列式,称为矩阵A\boldsymbol{A}kk阶子式m×nm\times n矩阵A\boldsymbol{A}kk阶子式共有CmkCnkC^k_{m}\cdot C^k_{n}个)

  • 非零kk阶子式:kk阶子式的值不等于00
  • kk阶主子式:取的kkkk列对应的顺序一致(m×nm\times n矩阵A\boldsymbol{A}kk阶主子式共有Cmin{m,n}kC^k_{min\{m,n\}}个)
  • kk阶顺序主子式:取前kk行前kk列(m×nm\times n矩阵A\boldsymbol{A}kk阶顺序主子式只有一个)

eg:
对于A=(a11a12a13a14a21a22a23a24a31a32a33a34a41a42a43a44)\boldsymbol{A}=\begin{pmatrix}a_{11} & a_{12} & a_{13} & a_{14} \\a_{21} & a_{22} & a_{23} & a_{24} \\a_{31} & a_{32} & a_{33} & a_{34} \\a_{41} & a_{42} & a_{43} & a_{44}\end{pmatrix}
a12a14a32a34\begin{vmatrix}a_{12} & a_{14} \\a_{32} & a_{34}\end{vmatrix}是取1,31,3行,2,42,4列产生的22阶子式

a11a12a14a21a22a24a41a42a44\begin{vmatrix}a_{11} & a_{12} & a_{14} \\a_{21} & a_{22} & a_{24} \\a_{41} & a_{42} & a_{44}\end{vmatrix}是取1,2,41,2,4行,1,2,41,2,4列产生的33阶主子式

a11a12a13a21a22a23a31a32a33\begin{vmatrix}a_{11} & a_{12} & a_{13} \\a_{21} & a_{22} & a_{23} \\a_{31} & a_{32} & a_{33}\end{vmatrix}是取1,2,31,2,3行,1,2,31,2,3列产生的33阶顺序主子式

性质

  1. r(A)=rAr(\boldsymbol{A})=r\Leftrightarrow\boldsymbol{A}的非零子式的最高阶数为rr
  2. r(A)rAr(\boldsymbol{A})\geq r\Leftrightarrow\boldsymbol{A}至少有一个rr阶非零子式
  3. r(A)rAr(\boldsymbol{A})\leq r\Leftrightarrow\boldsymbol{A}中所有r+1r+1阶子式(若存在)全为零

相似矩阵

定义

A,B\boldsymbol{A,B}都是nn阶方阵,若存在可逆矩阵P\boldsymbol{P}使P1AP=B\boldsymbol{P^{-1}AP=B},则称A\boldsymbol{A}相似于B\boldsymbol{B},或者A\boldsymbol{A}B\boldsymbol{B}相似,记作AB\boldsymbol{A\sim B}

矩阵的相关性关系是一种等价关系

  1. 自反性:A\boldsymbol{A}A\boldsymbol{A}本身相似
  2. 对称性:若A\boldsymbol{A}B\boldsymbol{B}相似,则B\boldsymbol{B}A\boldsymbol{A}相似
  3. 传递性:若A\boldsymbol{A}B\boldsymbol{B}相似,B\boldsymbol{B}C\boldsymbol{C}相似,则A\boldsymbol{A}C\boldsymbol{C}相似

性质

AB\boldsymbol{A\sim B},即存在可逆矩阵P\boldsymbol{P}使得P1AP=B\boldsymbol{P^{-1}AP=B},则

  1. A\boldsymbol{A}B\boldsymbol{B}有相同的行列式和相同的秩,即A=B,r(A)=r(B)|\boldsymbol{A}|=|\boldsymbol{B}|,r(\boldsymbol{A})=r(\boldsymbol{B})
  2. A\boldsymbol{A}可逆时,A1B1,AB\boldsymbol{A^{-1}\sim B^{-1},A^*\sim B^*}
  3. AnBn,kAkB,f(A)f(B)\boldsymbol{A^n\sim B^n},k\boldsymbol{A}\sim k\boldsymbol{B},f(\boldsymbol{A})\sim f(\boldsymbol{B}),其中nn为正整数,kk为实数,f(x)f(x)为多项式

矩阵的特征值和二次型

特征值和特征向量

定义

AAnn阶方阵,若存在数λ\lambdann维非零列向量x\boldsymbol{x}使得Ax=λxA\boldsymbol{x}=\lambda\boldsymbol{x}成立,则

  • λ\lambdaAA的特征值,(或AA的对应于特征向量x\boldsymbol{x}的特征值)
  • x(0)\boldsymbol{x}(\neq \boldsymbol{0})AA的对应于(属于)λ\lambda的一个特征向量
  1. 特征值问题是对方阵而言的
  2. 特征向量x0\boldsymbol{x} \neq \boldsymbol{0}。当x=0\boldsymbol{x}=\boldsymbol{0}时,对任意λ\lambda都有Ax=λxA\boldsymbol{x}=\lambda\boldsymbol{x}成立,对讨论特征值无意义
  3. AA的特征值λ\lambda———方程λEA=0|\lambda E-A|=0的根λ\lambdaAA的与λ\lambda对应的特征向量x\boldsymbol{x}——(λEA)x=0(\lambda E-A)\boldsymbol{x}=\boldsymbol{0}的非零解
  4. λEA=0|\lambda E-A|=0,即

    λa11a12a1na21λa22a2nan1an2λann=0\begin{vmatrix} \lambda-a_{11} & -a_{12} & \cdots & -a_{1n} \\ -a_{21} & \lambda-a_{22} & \cdots & -a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ -a_{n1} & -a_{n2} & \cdots & \lambda-a_{nn} \end{vmatrix} = 0

    称为AA的特征方程——关于λ\lambda的一元nn次方程。
    多项式f(λ)=λEAf(\lambda)=|\lambda E-A|AA的特征多项式——λ\lambdann次多项式。
    AA的特征值λ\lambdaAA的特征方程的根,或特征多项式的零点。

nn次代数方程有nn个根(复根和实根,重根按重数计算),所以AAnn个特征值(在复数范围内)。

求取方法

求方阵AA的特征值与特征向量的步骤:

  1. 计算AA的特征多项式λEA|\lambda E-A|;
  2. 求特征方程λEA=0|\lambda E-A|=0的全部根λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n,即得AA的全部特征值;
  3. 对于特征值λi\lambda_i,求(λiEA)x=0(\lambda_i E-A)\boldsymbol{x}=\boldsymbol{0}的非零解,即得AA的对应于λi\lambda_i的特征向量.

结论

  1. 上(下)三角矩阵和对角阵的特征值就是矩阵的主对角元.
  2. 数量矩阵kEkE的特征值是kk(nn重),对应的特征向量为任意非零向量. kEx=kx\because kE\boldsymbol{x}=k\boldsymbol{x}.

特征值的几何重数与代数重数

在方阵AA的属于特征值λ0\lambda_0的全部特征向量中,设有极大无关组ξ1,ξ2,,ξl\boldsymbol{\xi}_1,\boldsymbol{\xi}_2,\cdots,\boldsymbol{\xi}_l,则称L{ξ1,ξ2,,ξl}L\{\boldsymbol{\xi}_1,\boldsymbol{\xi}_2,\cdots,\boldsymbol{\xi}_l\}AA的关于特征值λ0\lambda_0的特征子空间,记作Vλ0V_{\lambda_0}. dimVλ0\dim V_{\lambda_0}称为λ0\lambda_0的几何重数.

  • λ0\lambda_0的几何重数就是AA的对应于λ0\lambda_0的线性无关的特征向量的个数.
  • Vλ0={A的对应于λ0的全部特征向量}{0}V_{\lambda_0}=\{A\text{的对应于}\lambda_0\text{的全部特征向量}\}\cup\{\boldsymbol{0}\},故
    λ0\lambda_0的几何重数=nr(λ0EA)=n-r(\lambda_0 E-A).
  • λ0\lambda_0的代数重数:λ0\lambda_0AA的特征值的重数.

AA的特征值的几何重数\leq代数重数.
AA的单重特征值的几何重数==代数重数.

特征向量的性质

  1. x1\boldsymbol{x}_1x2\boldsymbol{x}_2都是方阵AA的属于特征值λ0\lambda_0的特征向量,则k1x1+k2x2k_1\boldsymbol{x}_1+k_2\boldsymbol{x}_2也是AA的属于特征值λ0\lambda_0的特征向量.(k1,k2k_1,k_2为任意实数且k1x1+k2x20k_1\boldsymbol{x}_1+k_2\boldsymbol{x}_2\neq\boldsymbol{0}.)

    • 属于同一特征值的特征向量的非零线性组合仍是属于该特征值的特征向量.
  2. AA的一个特征向量x\boldsymbol{x}不能属于AA的不同特征值.
    证明:假设向量x\boldsymbol{x}同时是AA的属于不同特征值λ1,λ2\lambda_1,\lambda_2(λ1λ2\lambda_1\neq\lambda_2)的特征向量,即有
    Ax=λ1x,Ax=λ2xA\boldsymbol{x}=\lambda_1\boldsymbol{x}, A\boldsymbol{x}=\lambda_2\boldsymbol{x},
    λ1x=λ2x\Longrightarrow \lambda_1\boldsymbol{x}=\lambda_2\boldsymbol{x}
    (λ1λ2)x=0\Longrightarrow (\lambda_1-\lambda_2)\boldsymbol{x}=\boldsymbol{0},
    由于λ1λ20\lambda_1-\lambda_2\neq0,所以x=0\boldsymbol{x}=\boldsymbol{0}.这与x\boldsymbol{x}是特征向量矛盾.

  3. ξ1,ξ2,,ξm\boldsymbol{\xi}_1,\boldsymbol{\xi}_2,\cdots,\boldsymbol{\xi}_m分别是nn阶矩阵AA对应于互不相等的特征值λ1,λ2,,λm\lambda_1,\lambda_2,\cdots,\lambda_m的特征向量,则ξ1,ξ2,,ξm\boldsymbol{\xi}_1,\boldsymbol{\xi}_2,\cdots,\boldsymbol{\xi}_m线性无关.
    简言之:AA的对应于不同特征值的特征向量线性无关.

  4. λ1,λ2,,λm\lambda_1,\lambda_2,\cdots,\lambda_mAnA_nmm个互异特征值,对应于λi\lambda_i的线性无关的特征向量为ξi1,ξi2,,ξiri\boldsymbol{\xi}_{i1},\boldsymbol{\xi}_{i2},\cdots,\boldsymbol{\xi}_{ir_i}(i=1,2,,mi=1,2,\cdots,m),则所有这些特征向量(共r1+r2++rmr_1+r_2+\cdots+r_m个)构成的向量组线性无关.
    简言之:AA的对应于不同特征值的线性无关的特征向量所构成的向量组仍然是线性无关.

特征值的性质

  1. A=(aij)n×nA=(a_{ij})_{n\times n}的特征值为λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n,则有:

    1. λ1+λ2++λn=a11+a22++ann=tr(A)\lambda_1+\lambda_2+\cdots+\lambda_n=a_{11}+a_{22}+\cdots+a_{nn}=\text{tr}(A);
    2. λ1λ2λn=A\lambda_1\lambda_2\cdots\lambda_n=|A|.
    • AnA_n可逆A\Longleftrightarrow Ann个特征值都非零,即λi0\lambda_i\neq0(i=1,2,,ni=1,2,\cdots,n).
  2. λ\lambda是矩阵AA的特征值,ξ0\boldsymbol{\xi}\neq\boldsymbol{0}是对应于λ\lambda的特征向量,则

    1. aλa\lambda是矩阵aAaA的特征值(aa为任意实数);
    2. λk\lambda^k是矩阵AkA^k的特征值(kk为任意正整数);
    3. AA可逆时,λ1\lambda^{-1}A1A^{-1}的特征值;
      Aλ1|A|\lambda^{-1}AA^*的特征值.
    4. φ(λ)\varphi(\lambda)是矩阵φ(A)\varphi(A)的特征值,其中
      φ(x)=a0+a1x++anxn\varphi(x)=a_0+a_1x+\cdots+a_nx^n.
      ξ\boldsymbol{\xi}是对应的特征向量.
  3. nn阶矩阵AA和它的转置矩阵ATA^T有相同的特征值.
    证明:因为
    λEAT=(λEA)T=λEA|\lambda E-A^T|=|(\lambda E-A)^T|=|\lambda E-A|,
    AAATA^T有相同的特征多项式A\Longrightarrow AATA^T有相同的特征值.
    AAATA^T对应于同一特征值的特征向量一般不同.

矩阵的相似对角化

定义

nn阶方阵AA,如果存在可逆矩阵PP,使得
P1AP=Λ=diag(λ1,λ2,,λn)P^{-1}AP=\Lambda=\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)
为对角阵,则称矩阵AA相似对角化.

相似对角化的作用
若存在可逆矩阵PP,使得P1AP=ΛP^{-1}AP=\Lambda为对角矩阵,则
Ak=PΛkP1,φ(A)=Pφ(Λ)P1A^k=P\Lambda^kP^{-1}, \varphi(A)=P\varphi(\Lambda)P^{-1}.
利用上述结论可以很方便地计算AA的幂AkA^kAA的多项式φ(A)\varphi(A).

而对于对角阵Λ\Lambda

Λk=(λ1kλ2kλnk),φ(Λ)=(φ(λ1)φ(λ2)φ(λn)).\Lambda^k=\begin{pmatrix} \lambda_1^k & & & \\ & \lambda_2^k & & \\ & & \ddots & \\ & & & \lambda_n^k \end{pmatrix}, \varphi(\Lambda)=\begin{pmatrix} \varphi(\lambda_1) & & & \\ & \varphi(\lambda_2) & & \\ & & \ddots & \\ & & & \varphi(\lambda_n) \end{pmatrix}.

:并非任意方阵都可对角化,如:矩阵A=(1011)A=\begin{pmatrix} 1 & 0 \\ 1 & 1 \end{pmatrix}不能对角化.

方阵可相似对角化的条件

  1. AnA_n能相似对角化An\Longleftrightarrow A_nnn个线性无关的特征向量.
  2. AnA_nnn个互不相等的特征值An\Longrightarrow A_n可相似对角化.
    :当AA有重特征值时,AA不一定有nn个线性无关的特征向量,从而AA不一定能对角化.
  3. AnA_n可相似对角化An\Longleftrightarrow A_n每个特征值的几何重数==代数重数.
    • λ0\lambda_0的代数重数:λ0\lambda_0作为λEA=0|\lambda E-A|=0的根的重数;
    • λ0\lambda_0的几何重数:(λ0EA)x=0(\lambda_0 E-A)\boldsymbol{x}=\boldsymbol{0}的基础解系中解向量的个数.
      关系1λ01\leq\lambda_0的几何重数λ0\leq\lambda_0的代数重数.
  4. AnA_n可相似对角化An\Longleftrightarrow A_n每个重特征值的几何重数==代数重数.

实对称矩阵的对角化

一般的方阵AA不一定能相似对角化,但如果AA为实对称矩阵,那么AA一定可以相似对角化.
本节所提到的对称矩阵均指实对称矩阵.即有AT=AA^T=A.

注意:实矩阵的特征值不一定为实数,从而特征向量也不一定为实向量. 如:A=(0110)A=\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}.

性质

  1. 实对称矩阵的特征值必为实数.
    证明

    1. Ax=λxA\boldsymbol{x}=\lambda\boldsymbol{x}(x0\boldsymbol{x}\neq\boldsymbol{0}),其中AT=AA^T=A.
    2. λˉ\bar{\lambda}表示λ\lambda的共轭复数,用xˉ\bar{\boldsymbol{x}}表示x\boldsymbol{x}的共轭复向量.

    一方面:

    xˉTAx=xˉT(λx)=λxˉTx\bar{\boldsymbol{x}}^T A\boldsymbol{x}=\bar{\boldsymbol{x}}^T(\lambda\boldsymbol{x})=\lambda\bar{\boldsymbol{x}}^T\boldsymbol{x}

    另一方面:

    xˉTAx=xˉTATx=(Axˉ)Tx=(λˉxˉ)Tx=λˉxˉTx\bar{\boldsymbol{x}}^T A\boldsymbol{x}=\bar{\boldsymbol{x}}^T A^T\boldsymbol{x}=(A\bar{\boldsymbol{x}})^T\boldsymbol{x}=(\bar{\lambda}\bar{\boldsymbol{x}})^T\boldsymbol{x}=\bar{\lambda}\bar{\boldsymbol{x}}^T\boldsymbol{x}

    两式相减,得(λλˉ)xˉTx=0(\lambda-\bar{\lambda})\bar{\boldsymbol{x}}^T\boldsymbol{x}=0.
    由于x0\boldsymbol{x}\neq\boldsymbol{0},所以xˉTx=i=1nxˉi20\bar{\boldsymbol{x}}^T\boldsymbol{x}=\sum_{i=1}^n|\bar{x}_i|^2\neq0,从而λ=λˉ\lambda=\bar{\lambda}.
    由此可得,λ\lambda是实数.

说明
由于实对称矩阵AA的特征值λi\lambda_i为实数,所以齐次线性方程组(AλiE)x=0(A-\lambda_i E)\boldsymbol{x}=\boldsymbol{0}是实系数方程组,由AλiE=0|A-\lambda_i E|=0知,(AλiE)x=0(A-\lambda_i E)\boldsymbol{x}=\boldsymbol{0}必有实的基础解系,从而对应的特征向量可以取实向量.

  1. 实对称矩阵AA对应于不同特征值的特征向量正交.

    证明:由条件设:Api=λipiA\boldsymbol{p}_i=\lambda_i\boldsymbol{p}_i(i=1,2i=1,2),λ1λ2\lambda_1\neq\lambda_2A=ATA=A^T.
    于是

    λ1p1Tp2=(Ap1)Tp2=p1TATp2=p1TAp2=p1T(λ2p2)=λ2p1Tp2.\lambda_1\boldsymbol{p}_1^T\boldsymbol{p}_2=(A\boldsymbol{p}_1)^T\boldsymbol{p}_2=\boldsymbol{p}_1^T A^T\boldsymbol{p}_2=\boldsymbol{p}_1^T A\boldsymbol{p}_2=\boldsymbol{p}_1^T(\lambda_2\boldsymbol{p}_2)=\lambda_2\boldsymbol{p}_1^T\boldsymbol{p}_2.
    (λ1λ2)p1Tp2=0(\lambda_1-\lambda_2)\boldsymbol{p}_1^T\boldsymbol{p}_2=0.

    注意到λ1λ20\lambda_1-\lambda_2\neq0,所以p1Tp2=0\boldsymbol{p}_1^T\boldsymbol{p}_2=0 \Longrightarrow p1\boldsymbol{p}_1p2\boldsymbol{p}_2正交.

实对称矩阵的相似对角化

AAnn阶实对称矩阵,则必有正交矩阵PP,使得

P1AP=PTAP=(λ1λ2λn)=Λ.P^{-1}AP=P^T AP=\begin{pmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{pmatrix}=\Lambda.

其中P=(p1,p2,,pn)P=(\boldsymbol{p}_1,\boldsymbol{p}_2,\cdots,\boldsymbol{p}_n)pi\boldsymbol{p}_i满足Api=λipiA\boldsymbol{p}_i=\lambda_i\boldsymbol{p}_i(i=1,2,,ni=1,2,\cdots,n).

n\Longrightarrow n阶实对称矩阵AAkk重特征值λ0\lambda_0必对应kk个线性无关的特征向量,即

r(λ0EA)=nk.r(\lambda_0 E-A)=n-k.

:此定理说明:实对称矩阵一定可以对角化,而且相似变换矩阵可以是正交矩阵.

步骤

  1. λEA=0|\lambda E-A|=0求出AA的所有特征值λi\lambda_i;

  2. 对每个λi\lambda_i,解方程组(λiEA)x=0(\lambda_i E-A)\boldsymbol{x}=\boldsymbol{0},求出线性无关的特征向量(即基础解系),并将它们正交化,单位化(这是正交对角化的步骤,实际上可以不进行正交化,若不正交化则PP不是正交矩阵);

  3. 将上述nn个两两正交的单位特征向量作列,构成正交矩阵PP,则
    P1AP=PTAP=diag(λ1,λ2,,λn)=Λ,P^{-1}AP=P^T AP=\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)=\Lambda,

    其中P=(p1,p2,,pn)P=(\boldsymbol{p}_1,\boldsymbol{p}_2,\cdots,\boldsymbol{p}_n)pi\boldsymbol{p}_i满足Api=λipiA\boldsymbol{p}_i=\lambda_i\boldsymbol{p}_i(i=1,2,,ni=1,2,\cdots,n).

二次型及其矩阵表示

二次型就是二次齐次多项式
如:
x2+y2=a2x^2+y^2=a^2x2a2+y2b2=1\frac{x^2}{a^2}+\frac{y^2}{b^2}=1(a,b>0a,b>0)的左端均是二次型,分别表示平面上的圆和椭圆,且主轴和坐标轴重合.

一般地,中心与坐标原点重合的有心二次曲线的方程是

ax2+bxy+cy2=k(a,b,c,k为常数)ax^2+bxy+cy^2=k \quad (a,b,c,k\text{为常数})

其左端也是一个二次型,但是它表示的平面图形是什么(类型)呢?

若能用可逆的线性变换将上述方程化成标准形式的方程(只含平方项,不含交叉项),则容易看出.

二次型的主要问题

利用矩阵(可逆的线性变换),化二次型为标准形.

例如x2xy+y2=4x^2-xy+y^2=4,通过(旋转)变换

(xy)=(1/21/21/21/2)(xy)\begin{pmatrix} x' \\ y' \end{pmatrix} = \begin{pmatrix} 1/\sqrt{2} & 1/\sqrt{2} \\ -1/\sqrt{2} & 1/\sqrt{2} \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}

可化为标准形x22+3y22=4\frac{x'^2}{2}+\frac{3y'^2}{2}=4.

x2xy+y2=(x12y)2+34y2x^2-xy+y^2=(x-\frac{1}{2}y)^2+\frac{3}{4}y^2,所以它也可以通过可逆变换

(xy)=(11/203/2)(xy)\begin{pmatrix} x' \\ y' \end{pmatrix} = \begin{pmatrix} 1 & -1/2 \\ 0 & \sqrt{3}/2 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix}

化为标准形x2+y2=4x'^2+y'^2=4. 但此时曲线形状发生了改变,因为所用的变换不是正交变换.

:要使曲线在坐标变换过程中保持形状不变,则必须使用正交变换. 因为所用的变换为正交变换,所以从标准形可知原方程表示的是椭圆.

二次型的矩阵表示

例如3元二次型f=x2+2y23z24xy+2yz+6xzf=x^2+2y^2-3z^2-4xy+2yz+6xz可以写成:

f=(x,y,z)(123221313)(xyz)f=(x,y,z)\begin{pmatrix} 1 & -2 & 3 \\ -2 & 2 & 1 \\ 3 & 1 & -3 \end{pmatrix}\begin{pmatrix} x \\ y \\ z \end{pmatrix}

为保证唯一性,约定矩阵为对称矩阵.

nn元二次型的定义

nn元二次齐次多项式

f(x1,x2,,xn)=a11x12+2a12x1x2+2a13x1x3++2a1nx1xn+a22x22+2a23x2x3++2a2nx2xn++annxn2f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+2a_{12}x_1x_2+2a_{13}x_1x_3+\cdots+2a_{1n}x_1x_n+a_{22}x_2^2+2a_{23}x_2x_3+\cdots+2a_{2n}x_2x_n+\cdots+a_{nn}x_n^2

称为(nn二次型

aijCa_{ij}\in\mathbb{C}时,称ff复二次型;当aijRa_{ij}\in\mathbb{R}时,称ff实二次型.

用矩阵表示二次型

对二次型

f(x1,x2,,xn)=a11x12+2a12x1x2+2a13x1x3++2a1nx1xn+a22x22+2a23x2x3++2a2nx2xn++annxn2f(x_1,x_2,\cdots,x_n)=a_{11}x_1^2+2a_{12}x_1x_2+2a_{13}x_1x_3+\cdots+2a_{1n}x_1x_n+a_{22}x_2^2+2a_{23}x_2x_3+\cdots+2a_{2n}x_2x_n+\cdots+a_{nn}x_n^2

i>ji>j时令aji=aija_{ji}=a_{ij},则2aijxixj=aijxixj+ajixjxi2a_{ij}x_ix_j=a_{ij}x_ix_j+a_{ji}x_jx_i

f(x1,x2,,xn)=a11x12+a12x1x2++a1nx1xn+a21x2x1+a22x22++a2nx2xn++an1xnx1+an2xnx2++annxn2\begin{aligned} f(x_1,x_2,\cdots,x_n)&=a_{11}x_1^2+a_{12}x_1x_2+\cdots+a_{1n}x_1x_n\\ &+a_{21}x_2x_1+a_{22}x_2^2+\cdots+a_{2n}x_2x_n\\ &+\cdots\\ &+a_{n1}x_nx_1+a_{n2}x_nx_2+\cdots+a_{nn}x_n^2 \end{aligned}

=(x1,x2,,xn)(a11x1+a12x2++a1nxna21x1+a22x2++a2nxnan1x1+an2x2++annxn)=(x_1,x_2,\cdots,x_n)\begin{pmatrix} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n\\ \cdots\\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n \end{pmatrix}

=(x1,x2,,xn)(a11a12a1na21a22a2nan1an2ann)(x1x2xn)=(x_1,x_2,\cdots,x_n)\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix}\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}

若记A=(a11a12a1na21a22a2nan1an2ann)x=(x1x2xn)A=\begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1n}\\a_{21} & a_{22} & \cdots & a_{2n}\\\vdots & \vdots & \ddots & \vdots\\a_{n1} & a_{n2} & \cdots & a_{nn}\end{pmatrix},\boldsymbol{x}=\begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}

则二次型可记作f=xTAxf=\boldsymbol{x}^T A\boldsymbol{x},其中AA为对称矩阵.

二次型的矩阵与秩

二次型与对称矩阵一一对应.标准二次型对应的矩阵为对角阵

对称矩阵AA叫做二次型ff的矩阵,ff叫做对称矩阵AA的二次型.

对称矩阵AA的秩叫做二次型ff的秩.

化二次型为标准形

{x1=c11y1+c12y2++c1nynx2=c21y1+c22y2++c2nynxn=cn1y1+cn2y2++cnnyn\begin{cases} x_1=c_{11}y_1+c_{12}y_2+\cdots+c_{1n}y_n\\ x_2=c_{21}y_1+c_{22}y_2+\cdots+c_{2n}y_n\\ \cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\\ x_n=c_{n1}y_1+c_{n2}y_2+\cdots+c_{nn}y_n \end{cases}

对于二次型,讨论的主要问题是:寻求可逆(满秩,非退化)的线性变换,将二次型化为标准形.

从矩阵的角度看,主要问题是:
对于实对称矩阵AA,寻找可逆阵CC,使得CTACC^T AC为对角阵.

C=(cij)C=(c_{ij}),则上述可逆线性变换可记作x=Cy\boldsymbol{x}=C\boldsymbol{y}.

将其代入f=xTAxf=\boldsymbol{x}^T A\boldsymbol{x}得:

f=(Cy)TA(Cy)=yTCTACy.f=(C\boldsymbol{y})^T A(C\boldsymbol{y})=\boldsymbol{y}^T C^T AC \boldsymbol{y}.

合同矩阵

定义

对两个方阵AABB,若存在可逆阵CC,使得CTAC=BC^T AC=B,则称AABB合同),记为ABA\simeq BCC称为合同变换矩阵.

  1. 合同关系是等价关系.
  2. 对称矩阵的合同矩阵一定也是对称矩阵.
  3. 当实对称矩阵AABB合同时,也称它们对应的二次型合同.
  4. AABB相似A\Longrightarrow ABB等价
    AABB合同A\Longrightarrow ABB等价
    AABB均为实对称矩阵,则AABB相似A\Longrightarrow ABB合同
性质

ABA\simeq B,合同变换矩阵为CC,即CTAC=BC^T AC=B,则

  1. AABB有相同的秩,即r(A)=r(B)r(A)=r(B).
  2. ATBTA^T\simeq B^T,且合同变换矩阵仍为CC.
  3. AA可逆时,A1B1A^{-1}\simeq B^{-1}ABA^*\simeq B^*.

化二次型为标准形

正交变换法

已有结论:
对任意实对称矩阵AA,一定存在正交矩阵PP,使得

P1AP=Λ=diag(λ1,λ2,,λn)P^{-1}AP=\Lambda=\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)

其中λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n为矩阵AAnn个特征值.

因为PP为正交阵,所以P1=PTP^{-1}=P^T,于是

PTAP=Λ=diag(λ1,λ2,,λn).P^T AP=\Lambda=\text{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n).

主轴定理: 任给实二次型f(x)=xTAxf(\boldsymbol{x})=\boldsymbol{x}^T A\boldsymbol{x},总有正交变换x=Qy\boldsymbol{x}=Q\boldsymbol{y},使ff化为标准形

f=λ1y12+λ2y22++λnyn2f=\lambda_1 y_1^2+\lambda_2 y_2^2+\cdots+\lambda_n y_n^2

其中λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n为对称矩阵AAnn个特征值,正交矩阵QQnn个列向量q1,q2,,qn\boldsymbol{q}_1,\boldsymbol{q}_2,\cdots,\boldsymbol{q}_nAA的对应于特征值λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n的标准正交的特征向量.

正交变换法化二次型为标准形的步骤:

  1. 写出二次型f(x)=xTAxf(\boldsymbol{x})=\boldsymbol{x}^T A\boldsymbol{x}中的实对称矩阵AA;
  2. 求出AA的所有特征值λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n(重根按重数计算);
  3. 求出AA的对应于特征值λi\lambda_i的正交单位化的特征向量组,从而有正交单位向量组q1,q2,,qn\boldsymbol{q}_1,\boldsymbol{q}_2,\cdots,\boldsymbol{q}_n;
  4. Q=(q1,q2,,qn)Q=(\boldsymbol{q}_1,\boldsymbol{q}_2,\cdots,\boldsymbol{q}_n),作正交变换x=Qy\boldsymbol{x}=Q\boldsymbol{y},则得ff的标准形:

    f=λ1y12+λ2y22++λnyn2.f=\lambda_1 y_1^2+\lambda_2 y_2^2+\cdots+\lambda_n y_n^2.

拉格朗日配方法

  1. 若二次型含有xix_i的平方项,则先把含有xix_i的乘积项集中,配成完全平方项,再对其余的变量同样进行,直到都配成平方项为止,经过可逆线性变换,就得到标准形.

  2. 若二次型中不含有平方项,但是aij0a_{ij}\neq0(iji\neq j),则先作可逆线性变换:

    {xi=yiyjxj=yi+yjxk=yk(ki,j)\begin{cases} x_i=y_i-y_j\\ x_j=y_i+y_j\\ x_k=y_k & (k\neq i,j) \end{cases}

    化二次型为含有平方项的二次型,然后再按1中方法配方.

初等变换法

问题:对任一个nn阶实对称矩阵AA,寻找可逆阵CC,使得

CTAC=diag(d1,d2,,dn).C^T AC=\text{diag}(d_1,d_2,\cdots,d_n).

C\because C可逆,\therefore存在一列初等矩阵使得C=P1P2PkC=P_1P_2\cdots P_k,于是

CTAC=PkTP2TP1TAP1P2Pk=diag(d1,d2,,dn).C^T AC=P_k^T\cdots P_2^T P_1^T AP_1P_2\cdots P_k=\text{diag}(d_1,d_2,\cdots,d_n).

C=P1P2Pk=EP1P2PkC=P_1P_2\cdots P_k=EP_1P_2\cdots P_k

注意到E(ij)T=E(ij)E(i\leftrightarrow j)^T=E(i\leftrightarrow j),
E(i(k))T=E(i(k))E(i(k))^T=E(i(k)),
E(i+j(k))T=E(j+i(k))E(i+j(k))^T=E(j+i(k)).

PkTP2TP1TAP1P2PkP_k^T\cdots P_2^T P_1^T AP_1P_2\cdots P_k表示对AA进行同类型的初等行、列变换.

:这里CC不一定是正交矩阵,d1,d2,,dnd_1,d_2,\cdots,d_n也不一定是AA的特征值.

(AE)同类型的初等行,列变换(ΛC)\begin{pmatrix} A \\ E \end{pmatrix}\xrightarrow[\text{同类型的初等行,列变换}]{}\begin{pmatrix} \Lambda \\ C \end{pmatrix}

可知方法如下:
CTAC=PkTP2TP1TAP1P2Pk=diag(d1,d2,,dn).C^T AC=P_k^T\cdots P_2^T P_1^T AP_1P_2\cdots P_k=\text{diag}(d_1,d_2,\cdots,d_n).
C=P1P2Pk=EP1P2PkC=P_1P_2\cdots P_k=EP_1P_2\cdots P_k

惯性定理和二次型的规范形

一个实二次型,既可以通过正交变换法化为标准形,也可以通过拉格朗日配方法或者初等变换法化为标准形. 显然,其标准形一般来说是不唯一的,但标准形中所含有的项数是确定的,项数等于二次型的秩.

惯性定理

一个nn元二次型f=xTAxf=\boldsymbol{x}^T A\boldsymbol{x},经任意可逆线性变换化为标准形f=k1y12+k2y22++knyn2f=k_1y_1^2+k_2y_2^2+\cdots+k_ny_n^2后,标准形中正平方项的个数pp和负平方项的个数qq是唯一确定的. 且p+q=r(A)p+q=r(A).

  • 二次型xTAx\boldsymbol{x}^T A\boldsymbol{x}(或AA)的正惯性指数:标准形中正系数的个数pp,
  • 二次型xTAx\boldsymbol{x}^T A\boldsymbol{x}(或AA)的负惯性指数:标准形中负系数的个数qq.
  • 符号差:正、负惯性指数的差pqp-q.
    求二次型的秩,有两种方法:
  1. 求二次型对应的矩阵的秩;
  2. 将二次型化为标准形(用可逆变换),标准形中的项数即为二次型的秩.

实二次型的规范形

  • 设二次型ff的秩为rr,正惯性指数为pp,则ff一定可经过可逆的线性变换化为标准形

    f=d1y12++dpyp2dp+1yp+12dryr2,di>0,i=1,2,,r.f=d_1y_1^2+\cdots+d_py_p^2-d_{p+1}y_{p+1}^2-\cdots-d_ry_r^2, \quad d_i>0, i=1,2,\cdots,r.

    继续做可逆线性变换

    {yi=zidii=1,2,,ryj=zj(j=r+1,r+2,,n)\begin{cases} y_i=\frac{z_i}{\sqrt{d_i}} & i=1,2,\cdots,r\\ y_j=z_j & (j=r+1,r+2,\cdots,n) \end{cases}

    则上述标准二次型可进一步化为

    f=z12++zp2zp+12zr2,f=z_1^2+\cdots+z_p^2-z_{p+1}^2-\cdots-z_r^2,

    称之为二次型的规范形.

:规范形首先是标准形,且其系数只在1,0,1-1,0,1三个数中取值.

  • 任意实数域上的nn元二次型f=xTAxf=\boldsymbol{x}^T A\boldsymbol{x},总可以经过可逆的线性变换化为规范形,且规范形是唯一的.

:二次型的规范形由它的秩和正惯性指数(或者正、负惯性指数)唯一确定.

  • 任意实对称矩阵AA必合同于一个下列形式的对角阵

(EpEqO)=diag(1,,1p,1,,1q,0,0npq).\begin{pmatrix} E_p & & \\ & -E_q & \\ & & O \end{pmatrix}=\text{diag}(\underbrace{1,\cdots,1}_{p\text{个}},\underbrace{-1,\cdots,-1}_{q\text{个}},\underbrace{0\cdots,0}_{n-p-q\text{个}}).

其中p+q=r(A)p+q=r(A).

等价————保秩.
相似————保秩,保特征值,保行列式,保迹.
合同————保对称性,保秩,保正、负惯性指数,保正定性.

实二次型的正定性

正(负)定矩阵和正(负)定二次型

设有二次型f(x)=xTAxf(\boldsymbol{x})=\boldsymbol{x}^T A\boldsymbol{x},若x0\forall\boldsymbol{x}\neq\boldsymbol{0},有

  1. f(x)>0f(\boldsymbol{x})>0,则称ff为正定二次型,并称对称矩阵AA是正定的;
  2. f(x)<0f(\boldsymbol{x})<0,则称ff为负定二次型,并称对称矩阵AA是负定的.

  • 正定或负定矩阵一定是对称矩阵.
  • 例如:f(x1,x2,x3)=x12+4x22+16x32f(x_1,x_2,x_3)=x_1^2+4x_2^2+16x_3^2为正定二次型.
  • f(x1,x2,x3)=x123x222x32f(x_1,x_2,x_3)=-x_1^2-3x_2^2-2x_3^2为负定二次型.
  • 对称矩阵AA为负定矩阵(A)\Longleftrightarrow(-A)为正定矩阵.

正定二次型的性质

实二次型f(x)=xTAxf(\boldsymbol{x})=\boldsymbol{x}^T A\boldsymbol{x}经任意可逆线性变换,正定性保持不变.

正定二次型的判定

xTAx\boldsymbol{x}^T A\boldsymbol{x}是正定二次型(或AA是正定矩阵)的充要条件是下列之一:

  1. AAnn个特征值λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n全大于00;
  2. AA的正惯性指数为nn,即AEA\simeq E;
  3. 存在可逆阵PP使得A=PTPA=P^T P;
  4. AAnn个顺序主子式全大于00,即

    a11>0,a11a12a21a22>0,,a11a12a1na21a22a2nan1an2ann>0.a_{11}>0, \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}>0, \cdots, \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix}>0.

负定二次型的判定

AA是实对称矩阵,则下列命题等价:

  1. xTAx\boldsymbol{x}^T A\boldsymbol{x}是负定二次型;
  2. AAnn个特征值λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n全小于00;
  3. AA的负惯性指数为nn,即AEA\simeq-E;
  4. 存在可逆阵PP使得A=PTPA=-P^T P;
  5. AA的奇数阶顺序主子式小于00,偶数阶顺序主子式大于00,即

    (1)ra11a12a1ra21a22a2rar1ar2arr>0r=1,2,,r.(-1)^r\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1r} \\ a_{21} & a_{22} & \cdots & a_{2r} \\ \vdots & \vdots & \ddots & \vdots \\ a_{r1} & a_{r2} & \cdots & a_{rr} \end{vmatrix}>0 \quad r=1,2,\cdots,r.

简单结论

  1. AA为正定的,则ATA^T, A1A^{-1}, kAkA(kk为正数), AA^*均为正定矩阵. (用特征值判定)
  2. AA, BB均为nn阶正定矩阵,则kA+lBkA+lB(kkll为正数)也是正定矩阵. (用定义判定)
  3. AA, BB分别为mm阶, nn阶正定矩阵,则分块矩阵C=(AOOB)C=\begin{pmatrix} A & O \\ O & B \end{pmatrix}也为正定矩阵. (用特征值或定义判定)
  4. AAnn阶正定矩阵,CCnn阶可逆矩阵,则CTACC^T AC也是正定矩阵. (用特征值或定义判定)
  5. AAnn阶正定矩阵,则AA一定对称且可逆.
  6. AAnn阶正定矩阵,则一定存在正定矩阵BB,使得A=B2A=B^2,也记作B=A12B=A^{\frac{1}{2}}.

其他类型的实二次型

设有二次型f(x)=xTAxf(\boldsymbol{x})=\boldsymbol{x}^T A\boldsymbol{x}, x0\forall\boldsymbol{x}\neq\boldsymbol{0},

  1. f(x)0f(\boldsymbol{x})\geq0,且x00\exists\boldsymbol{x}_0\neq\boldsymbol{0},使f(x0)=0f(\boldsymbol{x}_0)=0,则称ff为半正定二次型,并称对称矩阵AA是半正定的;
  2. f(x)0f(\boldsymbol{x})\leq0,且x00\exists\boldsymbol{x}_0\neq\boldsymbol{0},使f(x0)=0f(\boldsymbol{x}_0)=0,则称ff为半负定二次型,并称对称矩阵AA是半负定的.

  • 正定、半正定、负定、半负定二次型统称为有定二次型.
  • 不是有定的二次型,就称为不定二次型.
  • 有定矩阵一定是对称矩阵.
  • 对称矩阵AA为半负定矩阵(A)\Longleftrightarrow(-A)为半正定矩阵.

半正定二次型的判定

AAnn阶实对称矩阵,则下列命题等价:

  1. xTAx\boldsymbol{x}^T A\boldsymbol{x}是半正定二次型(或AA是半正定矩阵);
  2. AA的正惯性指数为r(A)r(A)r(A)<nr(A)<n;
  3. 存在降秩阵BB使得A=BTBA=B^T B.
  4. AAnn个特征值都大于等于00,且至少有一个等于00;
  5. Adiag(1,,1,0,,0)A\simeq\text{diag}(1,\cdots,1,0,\cdots,0),其中有r(A)r(A)11r(A)<nr(A)<n;
  6. AA的各阶顺序主子式大于等于00,且至少有一个等于00.