第一章 行列式

1.1 n阶行列式的概念

n阶行列式
a11a12a1na21a22a2nan1an2ann\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots&\vdots& &\vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{vmatrix}
是所有取自不同行不同列的n个元素的乘积
a1j1a2j2anjna_{1j_1}a_{2j_2}\cdots a_{nj_n}
的代数和。当j1j2jnj_1j_2\cdots j_n是偶排列时,该项的前面带正号;当j1j2jnj_1j_2\cdots j_n是奇排列时,该项的前面带负号,即
a11a12a1na21a22a2nan1an2ann=j1j2jn(1)τ(j1j2jn)a1j1a2j2anjn\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots&\vdots& &\vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{vmatrix}=\sum\limits_{j_1j_2\cdots j_n}(-1)^{\tau(j_1j_2\cdots j_n)}a_{1j_1}a_{2j_2}\cdots a_{nj_n}
j1j2jn\sum\limits_{j_1j_2\cdots j_n}表示对所有n阶排列求和。上式称为n阶行列式的完全展开式

1.2 行列式的性质

  1. 经过转置行列式的值不变,即AT=A|A^T|=|A|
    a1a2a3b1b2b3c1c2c3=a1b1c1a2b2c2a3b3c3\begin{vmatrix} a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \\ \end{vmatrix}= \begin{vmatrix} a_{1} & b_{1} & c_{1} \\ a_{2} & b_{2} & c_{2} \\ a_{3} & b_{3} & c_{3} \\ \end{vmatrix}
    由此可见行列式中的性质和的性质是对等的

  2. 两行(两列)互换位置,行列式的值变号
    特别地,两行(两列)相同,行列式的值为0

  3. 某行(或列)如有公因子k,则可把k提出行列式记号外。即用数k乘以行列式|A|等于用k乘以它的某行(或列)
    特别地:

    1. 某行(或列)的元素全为0,行列式的值为0
    2. 若两行(或列)的元素对应成比例,行列式的值为0
  4. 如果行列式某行(或列)是两个元素之和,则可把行列式拆成两个行列式之和
    a1+b1a2+b2a3+b3c1c2c3d1d2d3=a1a2a3c1c2c3d1d2d3+b1b2b3c1c2c3d1d2d3\begin{vmatrix} a_{1}+b_{1} & a_{2}+b_{2} & a_{3}+b_{3} \\ c_{1} & c_{2} & c_{3} \\ d_1 & d_2 & d_3 \\ \end{vmatrix}= \begin{vmatrix} a_{1} & a_{2} & a_{3} \\ c_{1} & c_{2} & c_{3} \\ d_1 & d_2 & d_3 \\ \end{vmatrix}+ \begin{vmatrix} b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \\ d_1 & d_2 & d_3 \\ \end{vmatrix}

  5. 把某行(或列)的k倍加到另一行(或列),行列式的值不变
    a1a2a3b1b2b3c1c2c3=a1a2a3b1+ka1b2+ka2b3+ka3c1c2c3\begin{vmatrix} a_{1} & a_{2} & a_{3} \\ b_{1} & b_{2} & b_{3} \\ c_{1} & c_{2} & c_{3} \\ \end{vmatrix}= \begin{vmatrix} a_{1} & a_{2} & a_{3} \\ b_{1}+ka_1 & b_{2}+ka_2 & b_{3}+ka_3 \\ c_{1} & c_{2} & c_{3} \\ \end{vmatrix}

1.3 行列式按行(或列)展开公式

n阶行列式的值等于它的任何一行(列)元素,与其对应的代数余子式乘积之和,即
A=ai1Ai1+ai2Ai2++ainAin=k=1naikAik,i=1,2,,n  (1.2)|A|=a_{i1}A_{i1}+a_{i2}A{i2}+\cdots+a_{in}A_{in}=\sum\limits^n_{k=1}a_{ik}A_{ik}, i=1,2,\cdots,n \ \ (1.2)
A=a1jA1j+a2jA2j++anjAnj=k=1nakjAkj,i=1,2,,n  (1.2)|A|=a_{1j}A_{1j}+a_{2j}A{2j}+\cdots+a_{nj}A_{nj}=\sum\limits^n_{k=1}a_{kj}A_{kj}, i=1,2,\cdots,n\ \ (1.2')
公式(1.2)称|A|按第i行展开的展开式,公式(1.2')称|A|按第j列展开的展开式

注:关于代数余子式的概念
在n阶行列式中划去aija_{ij}所在的第i行、第j列的元素,由剩下的元素按原来的位置排法构成的一个n-1阶的行列式。称其为aija_{ij}余子式,记为MijM_{ij};称(1)i+jMij(-1)^{i+j}M_{ij}aija_{ij}代数余子式,记为AijA_{ij}
Aij=(1)i+jMijA_{ij}=(-1)^{i+j}M_{ij}

1.4 几个重要公式

  1. 上(下)三角形行列式的值等于主对角线元素的乘积
    a11a12a1na22a2nann=a11a12a22an1an2ann=a11a22ann\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ & a_{22} & \cdots & a_{2n} \\ & &\ddots &\vdots \\ & & & a_{nn} \\ \end{vmatrix}= \begin{vmatrix} a_{11} & & & \\ a_{12} & a_{22} & & \\ \vdots & \vdots &\ddots &\\ a_{n1} & a_{n2} & \cdots& a_{nn} \\ \end{vmatrix}=a_{11}a_{22}\cdots a_{nn}

  2. 关于副对角线的行列式
    a11a12a1,n1a1na21a22a2,n10an1000=00a1n0a2,n1a2nan1an,n1ann=(1)n(n1)2a1na2,n1...an1\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1,n-1} & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2,n-1} & 0\\ \vdots & \vdots & & \vdots &\vdots \\ a_{n1} & 0 & \cdots & 0 & 0 \\ \end{vmatrix}= \begin{vmatrix} 0 & \cdots & 0 & a_{1n} \\ 0 & \cdots & a_{2,n-1} & a_{2n} \\ \vdots & &\vdots &\vdots \\ a_{n1} & \cdots & a_{n,n-1} & a_{nn} \\ \end{vmatrix}= (-1)^{\frac{n(n-1)}{2}}a_{1n}a_{2,n-1}...a_{n1}

  3. 两个特殊的拉普拉斯展开式
    如果A和B分别是m阶和n阶矩阵,则
    AOB=AOB=AB\begin{vmatrix} A & * \\ O & B \\ \end{vmatrix}= \begin{vmatrix} A & O \\ * & B \\ \end{vmatrix}=|A|\cdot |B|
    OAB=ABO=(1)mnAB\begin{vmatrix} O & A \\ B & * \\ \end{vmatrix}= \begin{vmatrix} * & A \\ B & O \\ \end{vmatrix}= (-1)^{mn}|A|\cdot |B|

  4. 范德蒙行列式
    111x1x2xnx12x22xn2x1n1x2n1xnn1=1j<in(xixj)\begin{vmatrix} 1 & 1 & \cdots & 1 \\ x_1 & x_2 & \cdots & x_n \\ x_1^2 & x_2^2 & \cdots & x_n^2 \\ \vdots & \vdots & & \vdots \\ x_1^{n-1} & x_2^{n-1} & \cdots & x_n^{n-1} \\ \end{vmatrix} =\prod_{1\leq j<i\leq n}(x_i-x_j)
    等式右侧表示所有(xixj)(x_i-x_j)的乘积

1.5 抽象n阶方阵行列式公式

  1. 若A是n阶矩阵,ATA^T是A的转置矩阵,则AT=A|A^T|=|A|
  2. 若A是n阶矩阵,则kA=knA|kA|=k^n|A|
  3. (行列式乘法公式)若A,B都是n阶矩阵,则AB=AB|AB|=|A||B|。特别地A2=A2|A^2|=|A|^2
  4. 若A是n阶矩阵,AA^*是A的伴随矩阵,则A=An1|A^*|=|A|^{n-1}
  5. 若A是n阶可逆矩阵,A1A^{-1}是A的逆矩阵,则A1=A1|A^{-1}|=|A|^{-1}
  6. 若A是n阶矩阵,λi(i=1,2,...,n)\lambda_i(i=1,2,...,n)是A的特征值,则A=i=1nλi|A|=\prod\limits^n_{i=1}\lambda_i
  7. 若矩阵A和B相似ABA\sim B,则A=B|A|=|B|

注:一般情况A+BA+B,ABAB,kAkA|A+B|\neq |A|+|B|,|A-B|\neq |A|-|B|,|kA|\neq k|A|

1.6 代数余子式性质的补充

  1. 行列式的任一行(列)元素与另一行(列)元素的代数余子式乘积之和为0,即
    k=1naikAjk=ai1Aj1+ai2Aj2++ainAjn=0, ij\sum^n_{k=1}a_{ik}A_{jk}=a_{i1}A_{j1}+a_{i2}A_{j2}+\cdots +a_{in}A_{jn}=0,\ i\neq j
    k=1nakiAkj=a1iA1j+a2iA2j++aniAnj=0, ij\sum^n_{k=1}a_{ki}A_{kj}=a_{1i}A_{1j}+a_{2i}A_{2j}+\cdots +a_{ni}A_{nj}=0,\ i\neq j

  2. 若A是n阶矩阵,AA^*是A的伴随矩阵,则
    AA=AA=AEAA^*=A^*A=|A|E

第二章 矩阵

1 矩阵的概念及运算

一、矩阵的概念

定义 2.1

m×nm\times n个数排成如下m行n列的一个表格
[a11a12a1na21a22a2nam1am2amn]\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix}
称为是一个m×nm\times n矩阵,当m=n时,矩阵A称为n阶矩阵或叫n阶方阵

如果一个矩阵的所有元素都是0,即
[000000000]\begin{bmatrix} 0 & 0 & \cdots & 0 \\ 0 & 0 & \cdots & 0 \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & 0 \end{bmatrix}
则称这个矩阵是零矩阵,可简记为O\bm{O}

两个矩阵A=[aij]m×n,B=[bij]s×t\bm{A}=[a_{ij}]_{m\times n},\bm{B}=[b_{ij}]_{s\times t},如果m=s,n=t,则称A与B是同型矩阵

两个同型矩阵A=[aij]m×n,B=[bij]m×n\bm{A}=[a_{ij}]_{m\times n},\bm{B}=[b_{ij}]_{m\times n},如果对应的元素都相等,即aij=bij(i=1,2,,m;j=1,2,,n)a_{ij}=b_{ij}(i=1,2,\cdots,m;j=1,2,\cdots,n),则称矩阵A与B相等,记作A=B

n阶方阵A=[aij]n×n\bm{A}=[a_{ij}]_{n\times n}的元素所构成的行列式
a11a12a1na21a22a2nan1an2ann\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix}
注:矩阵A是一个表格,而行列式|A|是一个数。A=O\bm{A}=\bm{O}A=0|\bm{A}|=0是不同的。当AO\bm{A}\neq \bm{O}时可以有A=0|\bm{A}|=0

二、矩阵的运算

定义 2.2(加法)

两个同型矩阵可以相加,且
A+B=[aij]m×n+[bij]m×n=[aij+bij]m×n\bm{A}+\bm{B}=[a_{ij}]_{m\times n}+[b_{ij}]_{m\times n}=[a_{ij}+b_{ij}]_{m\times n}

定义 2.3(数量乘法、简称数乘)

设k是数,A=[aij]m×n\bm{A}=[a_{ij}]_{m\times n}是矩阵,则定义数与矩阵的乘法为
kA=k[aij]m×n=[kaij]m×nk\bm{A}=k[a_{ij}]_{m\times n}=[ka_{ij}]_{m\times n}

定义 2.4(乘法)

设A是一个m×sm\times s矩阵,B是一个s×ns\times n矩阵(A的列数=B的行数),则A,B可乘,且乘积AB是一个m×nm\times n矩阵,记成C=AB=[cij]m×n\bm{C}=\bm{AB}=[c_{ij}]_{m\times n},其中C的第i行、第j列元素cijc_{ij}是A的第i行s个元素和B的第j列的s个对应元素两两乘积之和,即
cij=k=1saikbkj=ai1b1j+ai2b2j++aisbsjc_{ij}=\sum\limits^{s}_{k=1}a_{ik}b_{kj}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots+a_{is}b_{sj}
矩阵的乘法可图示如下:
i[ai1ai2ais][b1jb2jbsj]=[cij]ii\begin{bmatrix} \cdots & \cdots & \cdots & \cdots \\ a_{i1} & a_{i2} & \cdots & a_{is} \\ \cdots & \cdots & \cdots & \cdots \end{bmatrix} \begin{bmatrix} \vdots & b_{1j} & \vdots \\ \vdots & b_{2j} & \vdots \\ \vdots & \vdots & \vdots \\ \vdots & b_{sj} & \vdots \end{bmatrix}= \begin{bmatrix} & \vdots & \\ \cdots & c_{ij} & \cdots \\ & \vdots & \end{bmatrix}i
特别地,设A是一个n阶方阵,则记AAAk=Ak\overbrace{A\cdot A\cdots A}^{k个}=A^k称为A的k次幂

定义 2.5(转置)

m×nm\times n型矩阵A=[aij]m×n\bm{A}=[a_{ij}]_{m\times n}的行列互换得到的n×mn\times m矩阵[aji]n×m[a_{ji}]_{n\times m}称为A的转置矩阵,记为ATA^T,即

三、矩阵的运算规则

1. 加法

A,B,C是同型矩阵,则

2. 数乘矩阵

3. 乘法

A,B,C满足可乘条件

注意一般情况 ABBAAB\neq BA

4. 转置

5. 伴随阵的运算

6. 方阵的幂

(Ak)l=Akl,AkAl=Ak+l(A^k)^l=A^{kl},A^kA^l=A^{k+l}
注意

四、特殊矩阵

设A是n阶矩阵

  1. 单位矩阵:主对角元素为1,其余元素为0的矩阵称为单位阵,记成EnE_n(有时E记为I)
  2. 数量阵:数k与单位阵E的积kEkE称为数量阵
  3. 对角阵:非对角元素都是0的矩阵(即ij\forall i\neq j恒有aij=0a_{ij}=0)称为对角阵,记成Λ\Lambda
    Λ=diag[a1,a2,,an]\Lambda=diag[a_1,a_2,\cdots,a_n]
  4. 上(下)三角阵:当i>j(i<j)i>j(i<j)时,有aij=0a_{ij}=0的矩阵称为上(下)三角阵
  5. 对称阵:满足AT=AA^T=A,即aij=ajia_{ij}=a{ji}的矩阵称为对称阵
  6. 反对称阵:满足AT=AA^T=-A,即aij=aji,aii=0a_{ij}=-a{ji},a{ii}=0的矩阵称为反对称阵
  7. 正交阵ATA=AAT=EA^TA=AA^T=E的矩阵称为正交阵,即AT=A1A^T=A^{-1}
  8. 初等矩阵:单位矩阵经过一次初等变换所得到的矩阵
  9. 伴随矩阵:由矩阵A的行列式|A|所有的代数余子式所构成的形如
    [A11A21An1A12A22An2A1nA2nAnn]\begin{bmatrix} A_{11} & A_{21} & \cdots & A_{n1} \\ A_{12} & A_{22} & \cdots & A_{n2} \\ \vdots & \vdots & & \vdots \\ A_{1n} & A_{2n} & \cdots & A_{nn} \end{bmatrix}
    的矩阵称为矩阵A的伴随矩阵,记为AA^*

2 可逆矩阵

主要定理
定理2.1 若A可逆,则A的逆矩阵唯一
定理2.2 AA0A可逆\Leftrightarrow |A|\neq 0

一、可逆矩阵的概念

定义2.6 设A是n阶矩阵,如果存在n阶矩阵B使得
AB=BA=E()AB=BA=E(单位矩阵)
成立,则称A是可逆矩阵非奇异矩阵,B是A的逆矩阵,记成A1=BA^{-1}=B

二、n阶矩阵A可逆的充分必要条件

  1. 存在n阶矩阵B,使AB=E(或BA=E)
  2. A0|A|\neq 0,或秩r(A)=nr(A)=n,或A的列(行)向量线性无关
  3. 齐次方程组Ax=0Ax=0只有零解
  4. b\forall b,非齐次线性方程组Ax=bAx=b总有唯一解
  5. 矩阵A的特征值全不为0

三、逆矩阵的运算性质

k0k\neq 0,则(kA)1=1AA1(kA)^{-1}=\frac{1}{A}A^{-1},若A,B可逆,则(AB)1=B1A1(AB)^{-1}=B^{-1}A^{-1},特别地(A2)1=(A1)2(A^2)^{-1}=(A^{-1})^2

ATA^T可逆,则(AT)1=(A1)T;(A1)1=A;A1=1A(A^T)^{-1}=(A^{-1})^T;(A^{-1})^{-1}=A;|A^{-1}|=\frac{1}{|A|}

注:即使A,B和A+B都可逆,一般地(A+B)1A1+B1(A+B)^{-1}\neq A^{-1}+B^{-1}

四、求逆矩阵的方法

方法一 用公式,若A0|A|\neq 0,则
A1=1AAA^{-1}=\frac{1}{|A|}A^*

方法二 初等变换法
(AE)(EA1)(A|E)\underrightarrow{初等行变换}(E|A^{-1})

方法三 用定义求B,使AB=E或BA=E,则A可逆,且A1=BA^{-1}=B

方法四 用分块矩阵
设B,C都是可逆矩阵,则
[BOOC]1=[B1OOC1];[OBCO]1=[OC1B1O]\begin{bmatrix} B & O\\ O & C \end{bmatrix}^{-1} =\begin{bmatrix} B^{-1} & O \\ O & C^{-1} \end{bmatrix}; \begin{bmatrix} O & B \\ C & O \end{bmatrix}^{-1} =\begin{bmatrix} O & C^{-1} \\ B^{-1} & O \end{bmatrix}

3 初等变换、初等矩阵

主要结论:用初等矩阵P左乘A,所得PA矩阵就是矩阵A作了一次和矩阵P同样的行变换(若左乘就是相应的列变换)

一、定义

定义2.7(初等变换) 设A是m×nm\times n矩阵

  1. 用某个非零常数k(k0)k(k\neq 0)乘A的某行(列)的每个元素
  2. 互换A的某两行(列)的位置
  3. 将A的某行(列)元素的k倍加到另一行(列)

称为矩阵的三种初等行(列)变换,且分别称为初等倍乘、互换、倍加行(列)变换,统称初等变换

定义2.8(初等矩阵) 由单位矩阵经一次初等变换得到的矩阵称为初等矩阵,它们分别是(以三阶为例)

  1. 倍乘初等矩阵,记
    E2(k)=[1000k0001]E_2(k)=\begin{bmatrix} 1 & 0 & 0\\ 0 & k &0\\ 0&0&1 \end{bmatrix}
    E2(k)E_2(k)表示由单位阵E的第2行(或第2列)乘k(k0)k(k\neq 0)倍得到的矩阵

  2. 互换初等矩阵,记
    E12=[010100001]E_{12}=\begin{bmatrix} 0 & 1 & 0\\ 1& 0 &0\\ 0&0&1 \end{bmatrix}
    E12E_{12}表示由单位阵的第1,第2行(或1,2列)互换得到的矩阵

  3. 倍加初等矩阵,记
    E31(k)=[100010k01]E_{31}(k)=\begin{bmatrix} 1 &0 & 0\\ 0& 1 &0\\ k&0&1 \end{bmatrix}
    E31(k)E_{31}(k)表示由单位阵E的第1行的k倍加到第3行得到的矩阵。当看成列变换时,应是E的第3列的k倍加到第1列得到的矩阵

定义2.9(等价矩阵)
矩阵A经过有限次初等变换变成矩阵B,则称A与B等价,记成ABA\simeq B。若A[ErOOO]A\simeq\begin{bmatrix}E_r&O\\O&O\end{bmatrix},则后者称为A的等价标准形。(A的等价标准形是与A等价的所有矩阵中的最简矩阵)

二、初等矩阵与初等变换的性质

  1. 初等矩阵的转置仍是初等矩阵
  2. 初等矩阵均是可逆阵,且其逆矩阵仍是同一类型的初等矩阵
    注意,有Ei1(k)=Ei(1k),Eij1=Eij,Eij1(k)=Eij(k)E^{-1}_i(k)=E_i(\frac{1}{k}),E^{-1}_{ij}=E_{ij},E^{-1}_{ij}(k)=E_{ij}(-k)
  3. A左乘(右乘)初等矩阵,相当于对A做相应的初等行(列)变换
  4. 当A是可逆阵时,则A可作一系列初等行变换化成单位阵,即存在初等矩阵P1,P2,,PNP_1,P_2,\cdots,P_N,使得PNP2P1A=EP_N\cdots P_2P_1A=E

4 矩阵的秩

求秩主要方法:

定理2.3 经初等变换矩阵的秩不变

定理2.4 如果A可逆,则r(AB)=r(B),r(BA)=r(B)r(AB)=r(B),r(BA)=r(B)

一、矩阵秩的概念

定义2.10(矩阵的秩) 设A是m×nm\times n矩阵,若A中存在r阶子式不等于零,且所有r+1阶子式(如果存在的话)均等于零,则称矩阵A的秩为r,记成r(A),零矩阵的秩规定为0

注 在m×nm\times n矩阵A中,任取k行与k列(km,knk\leq m,k\leq n),位于这些行与列的交叉点上的k2k^2个元素按其在原来矩阵A中的次序可构成一个k阶行列式,称其为矩阵A的一个k列子式

r(A)=rr(A)=r\Leftrightarrow矩阵A中非零子式的最高阶数是r
r(A)<rr(A)<r\LeftrightarrowA中每一个r阶子式全为0
r(A)rr(A)\geq r\LeftrightarrowA中有r阶子式不为0

特别地,r(A)=0A=Or(A)=0\Leftrightarrow A=O
AOr(A)1A\neq O\Leftrightarrow r(A)\geq 1

若A是n阶矩阵,则

若A是m×nm\times n矩阵,则r(A)min(m,n)r(A)\leq \min(m,n)

二、矩阵秩的公式

5 分块矩阵

1、分块矩阵的概念

将矩阵用若干纵线和横线分成许多小块,每一小块称为原矩阵的子矩阵(或子块),把子块看成原矩阵的一个元素,则原矩阵叫分块矩阵

由于不同的需要,同一个矩阵可以用不同的方法分块,构成不同的分块矩阵
A=[a11a12a1na21a22a2nam1am2amn]=[α1α2αm]A=\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn}\end{bmatrix}= \begin{bmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_m \end{bmatrix},其中αi=[ai1,ai2,,ain],i=1,2,,m\alpha_i=[a_{i1},a_{i2},\cdots,a_{in}],i=1,2,\cdots,m,是A的子矩阵,A是以行分块的分块阵

以列分块的矩阵类似

C=[c11c12000c21c22000c31c32c33c34c35c41c42c43c44c45]=[C1OC3C4]C=\begin{bmatrix} c_{11}&c_{12}&0&0&0\\ c_{21}&c_{22}&0&0&0\\ c_{31}&c_{32}&c_{33}&c_{34}&c_{35}\\ c_{41}&c_{42}&c_{43}&c_{44}&c_{45} \end{bmatrix}=\begin{bmatrix}C_1&O\\C_3&C_4\end{bmatrix} 其中C1,O,C3,C4C_1,O,C_3,C_4是C的子矩阵

二、分块矩阵的运算

若B,C分别是m阶与s阶矩阵,则
[BOOC]n=[BnOOCn]\begin{bmatrix}B&O\\ O&C\end{bmatrix}^n=\begin{bmatrix}B^n&O\\ O&C^n\end{bmatrix}

若B,C分别是m阶与n阶可逆矩阵,则
[BOOC]1=[B1OOC1],[OBCO]1=[OC1B1O]\begin{bmatrix}B&O\\ O&C\end{bmatrix}^{-1}=\begin{bmatrix}B^{-1}&O\\ O&C^{-1}\end{bmatrix}, \begin{bmatrix}O&B\\ C&O\end{bmatrix}^{-1}=\begin{bmatrix}O&C^{-1}\\ B^{-1}&O\end{bmatrix}
若A是m×nm\times n矩阵,B是n×sn\times s矩阵且AB=O,对B和O矩阵按列分块有
AB=A[β1,β2,,βs]=[Aβ1,Aβ2,,Aβs]=[0,0,,0]AB=A[\beta_1,\beta_2,\cdots,\beta_s]=[A\beta_1,A\beta_2,\cdots,A\beta_s]=[0,0,\cdots,0]
Aβi=0 (i=1,2,,s)A\beta_i=0\ (i=1,2,\cdots,s)
即B的列向量是齐次方程组Ax=0Ax=0的解

若AB=C,其中A是m×nm\times n的矩阵,B是n×sn\times s的矩阵,则对B,C按行分块有
[a11a12a1na21a22a2nam1am2amn][β1β2βn]=[α1α2αm]\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{bmatrix} \begin{bmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{bmatrix}= \begin{bmatrix}\alpha_1\\ \alpha_2\\ \vdots\\ \alpha_m\end{bmatrix}

{a11β1+a12β2++a1nβn=α1a21β1+a22β2++a2nβn=α2am1β1+am2β2++amnβn=αm\begin{cases} a_{11}\beta_1+a_{12}\beta_2+\cdots+a_{1n}\beta_n=\alpha_1 \\ a_{21}\beta_1+a_{22}\beta_2+\cdots+a_{2n}\beta_n=\alpha_2 \\ \vdots\\ a_{m1}\beta_1+a_{m2}\beta_2+\cdots+a_{mn}\beta_n=\alpha_m \end{cases}
可见矩阵AB的行向量α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m可由B的行向量β1,β2,,βn\beta_1,\beta_2,\cdots,\beta_n线性表出

类似地,对矩阵A,C按列分块,有
[γ1,γ2,,γn][b11b12b1sb21b22b2sbn1bn2bns]=[δ1,δ2,,δs][\gamma_1,\gamma_2,\cdots,\gamma_n] \begin{bmatrix} b_{11}&b_{12}&\cdots&b_{1s}\\ b_{21}&b_{22}&\cdots&b_{2s}\\ \vdots&\vdots& &\vdots\\ b_{n1}&b_{n2}&\cdots&b_{ns} \end{bmatrix}=[\delta_1,\delta_2,\cdots,\delta_s]

由此得
{b11γ1+b21γ2++bn1γs=δ1b12γ1+b22γ2++bn2γs=δ2b1sγ1+b2sγ2++bnsγs=δs\begin{cases} b_{11}\gamma_1+b_{21}\gamma_2+\cdots+b_{n1}\gamma_s=\delta_1 \\ b_{12}\gamma_1+b_{22}\gamma_2+\cdots+b_{n2}\gamma_s=\delta_2 \\ \vdots\\ b_{1s}\gamma_1+b_{2s}\gamma_2+\cdots+b_{ns}\gamma_s=\delta_s \end{cases}
即矩阵AB的列向量可由A的列向量线性表出

第三章 向量

1 n维向量的概念与运算

n维向量 n个数a1,a2,,ana_1,a_2,\cdots,a_n所构成的一个有序数组称为n维向量。记成(a1,a2,,an)(a_1,a_2,\cdots,a_n)(a1,a2,,an)T(a_1,a_2,\cdots,a_n)^T,分别称为n维行向量或n维列向量,数aia_i称为向量的第i个分量

零向量 所有分量都是0的向量称为零向量,记为0

n维向量α=(a1,a2,,an)T,β=(b1,b2,,bn)T\alpha=(a_1,a_2,\cdots,a_n)^T,\beta=(b_1,b_2,\cdots,b_n)^T相等
α=βa1=b1,a2=b2,,an=bn\alpha=\beta \Leftrightarrow a_1=b_1,a_2=b_2,\cdots,a_n=b_n

n维向量的运算。如α=(a1,a2,,an)T,β=(b1,b2,,bn)T\alpha=(a_1,a_2,\cdots,a_n)^T,\beta=(b_1,b_2,\cdots,b_n)^T,则

  1. 加法 α+β=(a1+b1,a2+b2,,an+bn)T\alpha+\beta=(a_1+b_1,a_2+b_2,\cdots,a_n+b_n)^T
  2. 数乘 kα=(ka1,ka2,,kan)Tk\alpha=(ka_1,ka_2,\cdots,ka_n)^T
  3. 内积 (α,beta)=a1b1+a2b2++anbn=αTβ=βTα(\alpha,beta)=a_1b_1+a_2b_2+\cdots+a_nb_n=\alpha^T\beta=\beta^T\alpha
    特别地,如(α,β)=0(\alpha,\beta)=0,则称向量α\alphabetabeta正交
    (α,α)=αTα=a12+a22++an2(\alpha,\alpha)=\alpha^T\alpha=a^2_1+a^2_2+\cdots+a^2_n,称a12+a22++an2\sqrt{a^2_1+a^2_2+\cdots+a^2_n}为向量α\alpha的长度

向量的加法、数乘满足:
α+β=β+α,(α+β)+γ=α+(β+γ),α+0=0+α=α,α+(α)=0\alpha+\beta=\beta+\alpha,(\alpha+\beta)+\gamma=\alpha+(\beta+\gamma),\alpha+\bm{0}=\bm{0}+\alpha=\alpha,\alpha+(-\alpha)=\bm{0}
1α=α,k(lα)=(kl)α,(k+l)α=kα+lα,k(α+β)=kα+kβ1\cdot\alpha=\alpha,k(l\alpha)=(kl)\alpha,(k+l)\alpha=k\alpha+l\alpha,k(\alpha+\beta)=k\alpha+k\beta

向量内积满足:
(α,β)=(β,α)  k(α,β)=(kα,beta)=(α,kβ)(\alpha,\beta)=(\beta,\alpha)\ \ k(\alpha,\beta)=(k\alpha,beta)=(\alpha,k\beta)
(α+β,γ)=(α,γ)+(β,γ),(α,α)0(\alpha+\beta,\gamma)=(\alpha,\gamma)+(\beta,\gamma),(\alpha,\alpha)\geq 0,等号成立当且仅当α=0\alpha=0

2 线性表出、线性相关

线性组合 m个n维向量α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m及m个数k1,k2,,kmk_1,k_2,\cdots,k_m所构成的向量
k1α1+k2α2++kmαmk_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m
称为向量组α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m的一个线性组合,数k1,k2,,kmk_1,k_2,\cdots,k_m称为组合系数

一、线性表出的概念

定义 3.1 对n维向量α1,α2,,αsβ\alpha_1,\alpha_2,\cdots,\alpha_s和\beta,如果存在实数k1,k2,,ksk_1,k_2,\cdots,k_s,使得
k1α1+k2α2++ksαs=βk_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s=\beta
则称向量β\beta是向量α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性组合,或者说向量β\beta可由α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性表出(示)

定义 3.2 设有两个n维向量组(I)α1,α2,,αs;(II)β1,β2,,βt;(I)\alpha_1,\alpha_2,\cdots,\alpha_s;(II)\beta_1,\beta_2,\cdots,\beta_t;如果(I)中每个向量αi(i=1,2,,s)\alpha_i(i=1,2,\cdots,s)都可由(II)中的向量β1,β2,,βt\beta_1,\beta_2,\cdots,\beta_t线性表出,则称向量组(I)可由向量组(II)线性表出

如果两个向量组可以互相线性表出,则称这两个向量组等价

注:

  1. 等价向量组具有传递性、对称性、反身性
  2. 向量组和它的极大线性无关组是等价向量组
  3. 向量组的任意两个极大线性无关组是等价向量组
  4. 等价的向量组有相同的秩,但秩相等的向量组不一定等价

二、线性相关、线性无关的概念

定义 3.3 对于n维向量α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s,如果存在不全为零的数k1,k2,,ksk_1,k_2,\cdots,k_s使得
k1α1+k2α2++ksαs=0k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s=\bm{0}
则称向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性相关,否则称它线性无关

线性无关应当理解清晰:
只要k1,k2,,ksk_1,k_2,\cdots,k_s不全为零,必有k1α1+k2α2++ksαs0k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s\neq \bm{0}
或者,当且仅当k1=k2==ks=0k_1=k_2=\cdots=k_s=0时,才有k1α1+k2α2++ksαs=0k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s=\bm{0}

显然,含有零向量、相等向量、坐标成比例的向量组都是线性相关的,而阶梯型向量组一定是线性无关的

三、线性表出、线性相关的重要定理

定理 3.1 n维向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性相关
等价于 齐次方程组(α1,α2,,αs)[x1x2xs]=0(\alpha_1,\alpha_2,\cdots,\alpha_s)\begin{bmatrix}x_1\\x_2\\ \vdots\\x_s\end{bmatrix}=0有非零解
等价于 秩r(α1,α2,,αs)<sr(\alpha_1,\alpha_2,\cdots,\alpha_s)<s

推论

  1. n个n维向量α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性相关\Leftrightarrow行列式α1,α2,,αn=0|\alpha_1,\alpha_2,\cdots,\alpha_n|=0
  2. n+1个n维向量必线性相关
  3. 如果α1,α2,,αr\alpha_1,\alpha_2,\cdots,\alpha_r线性相关,则α1,α2,,αr,αr+1,,αs\alpha_1,\alpha_2,\cdots,\alpha_r,\alpha_{r+1},\cdots,\alpha_s必线性相关
  4. 如果n维向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性无关,则它的延伸组(α1β1),(α2β2),,(αsβs)\begin{pmatrix}\alpha_1\\ \beta_1\end{pmatrix},\begin{pmatrix}\alpha_2\\ \beta_2\end{pmatrix},\cdots,\begin{pmatrix}\alpha_s\\ \beta_s\end{pmatrix}必线性无关

定理 3.2 n维向量β\beta可由α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m线性表出
等价于 非齐次方程组x1α1+x2α2++xmαm=βx_1\alpha_1+x_2\alpha_2+\cdots+x_m\alpha_m=\beta有解
等价于 秩r(α1,α2,,αm)=r(α1,α2,,αm,β)r(\alpha_1,\alpha_2,\cdots,\alpha_m)=r(\alpha_1,\alpha_2,\cdots,\alpha_m,\beta)

定理 3.3 向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性相关 等价于 至少有一个向量αi\alpha_i可以由其余s-1个向量线性表出

定理 3.4 向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性无关,而向量组α1,α2,,αs,β\alpha_1,\alpha_2,\cdots,\alpha_s,\beta线性相关,则向量β\beta可以由α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性表出,且表示法唯一

定理 3.5 设有两个n维向量组(I)α1,α2,,αs,(II)β1,β2,,βt(I)\alpha_1,\alpha_2,\cdots,\alpha_s,(II)\beta_1,\beta_2,\cdots,\beta_t
如果(I)能由(II)线性表出,且s>t,则α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s必线性相关
推论 若n维向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s可由β1,β2,,βt\beta_1,\beta_2,\cdots,\beta_t线性表出,且α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s线性无关,则sts\leq t

3 极大线性无关组、秩

一、极大线性无关组、向量组秩的概念

定义 3.4 设向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s中,有一个部分组αi1,αi2,,αir(1rs)\alpha_{i_1},\alpha_{i_2},\cdots,\alpha_{i_r}(1\leq r\leq s),满足条件

  1. αi1,αi2,,αir\alpha_{i_1},\alpha_{i_2},\cdots,\alpha_{i_r}线性无关
  2. 再添加任一向量αj(1js)\alpha_j(1\leq j\leq s),向量组αi1,αi2,,αir,αj\alpha_{i_1},\alpha_{i_2},\cdots,\alpha_{i_r},\alpha_j必线性相关

则称向量组αi1,αi2,,αir\alpha_{i_1},\alpha_{i_2},\cdots,\alpha_{i_r}是向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s的一个极大线性无关组

  1. 只有一个零向量构成的向量组没有极大线性无关组
  2. 一个线性无关的向量组的极大线性无关组是该向量组本身
  3. 向量组的极大线性无关组一般不唯一,但其极大线性无关组的向量个数是一样的
  4. 条件2. 的等价说法是:向量组α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s中任一向量αj(1js)\alpha_j(1\leq j\leq s),必可由αi1,αi2,,αir\alpha_{i_1},\alpha_{i_2},\cdots,\alpha_{i_r},线性表出

定义 3.5 向量α1,α2,,αs\alpha_1,\alpha_2,\cdots,\alpha_s的极大线性无关组中所含向量的个数r称为向量组的秩,记为r(α1,α2,,αs)=rr(\alpha_1,\alpha_2,\cdots,\alpha_s)=r

r(α1,α2,,αs)r(α1,α2,,αs,αs+1)r(\alpha_1,\alpha_2,\cdots,\alpha_s)\leq r(\alpha_1,\alpha_2,\cdots,\alpha_s,\alpha_{s+1})

二、有关秩的定理

定理 3.6 如果向量组(I)α1,α2,,αs(I)\alpha_1,\alpha_2,\cdots,\alpha_s可由(II)β1,β2,,βi(II)\beta_1,\beta_2,\cdots,\beta_i线性表出
r(I)r(II)r(I)\leq r(II)

推论 如果向量组(I)和(II)等价,则r(I)=r(II)r(I)=r(II)

定理 3.7 r(A)=A的行秩(矩阵A的行向量组的秩)=A的列秩(矩阵A的列向量组的秩)

定理 3.8 经初等变换向量组的秩不变

4 Schmidt 正交化、正交矩阵

一、Schmidt正交化(正交化规范方法)

设向量组α1,α2,α3\alpha_1,\alpha_2,\alpha_3线性无关,其正交规范化方法步骤如下:
β1=α1\beta_1=\alpha_1
β2=α2(α2,β1)(β1,β2)β1\beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_2)}\beta_1
β3=α3frac(α3,β1)(β1,β2)β1(α3,β2)(β2,β2)β2\beta_3=\alpha_3-frac{(\alpha_3,\beta_1)}{(\beta_1,\beta_2)}\beta_1-\frac{(\alpha_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2
β1,β2,β3\beta_1,\beta_2,\beta_3两两正交

再将β1,β2,β3\beta_1,\beta_2,\beta_3单位化,取
γ1=β1β1,γ2=β2β2,γ3=β3β3\gamma_1=\frac{\beta_1}{|\beta_1|},\gamma_2=\frac{\beta_2}{|\beta_2|},\gamma_3=\frac{\beta_3}{|\beta_3|}
γ1,γ2,γ3\gamma_1,\gamma_2,\gamma_3是正交规范向量组(即两两正交且均是单位向量)

二、正交矩阵

设A是n阶矩阵,满足AAT=ATA=EAA^T=A^TA=E,则A是正交矩阵

A是正交矩阵
等价于 AT=A1A^T=A^{-1}
等价于 A的列(行)向量组是正交规范向量组

如A是正交矩阵,则行列式|A|=1或-1

5 向量空间

一、向量空间的概念

定义 3.6 全体n维向量连同向量的加法和数乘运算合称为n维向量空间

定义 3.7 设W是n维向量的非空集合,如果满足

  1. α,βW\forall \alpha,\beta\in W必有α+βW\alpha+\beta\in W
  2. αW\forall\alpha\in W及任一实数k必有kαWk\alpha\in W

则称W是向量空间的子空间

定义 3.8 如果向量空间V中的m个向量α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m满足

  1. α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m线性无关
  2. 对于V中任意向量β\betaβ\beta均可由向量组α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m线性表出,即
    x1α1+x2α2++xmαm=βx_1\alpha_1+x_2\alpha_2+\cdots+x_m\alpha_m=\beta
    则称α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m为向量空间V的一个基底(或)。基中所含向量的个数m称为向量空间V的维数,记作dimV=mdimV=m,并称V是m维向量空间。向量β\beta的表示系数x1,x2,,xmx_1,x_2,\cdots,x_m称为向量β\beta在基底α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_m下的坐标

定义 3.9e1,e2,,ene_1,e_2,\cdots,e_n是向量空间的一组基,如果它们满足
(ei,ej)={1,i=j0,ij(e_i,e_j)=\begin{cases}1,& i=j\\0,& i\neq j\end{cases}
则称e1,e2,,ene_1,e_2,\cdots,e_n规范正交基

齐次方程组Ax=0的解向量的集合W,由解的性质知:
α,β\alpha,\beta是Ax=0的解,则α+β,kα\alpha+\beta,k\alpha仍是Ax=0的解,所以W是n维向量空间的子空间,通常称为解空间

例如A=[11010101]A=\begin{bmatrix}1&1&0&-1\\0&1&0&1\end{bmatrix}

则齐次方程组Ax=0的基础解系
η1=[0,0,1,0]T,η2=[2,1,0,1]T\eta_1=[0,0,1,0]^T,\eta_2=[2,-1,0,1]^T
是解空间的基,解空间的维数是nr(A)=42=2n-r(A)=4-2=2

本题中,η1η2\eta_1与\eta_2已经正交,将其单位化
γ1=[0,0,1,0]T,γ2=1sqrt6[2,1,0,1]T\gamma_1=[0,0,1,0]^T,\gamma_2=\frac{1}{sqrt{6}}[2,-1,0,1]^T
就是解空间的规范正交基

定义 3.10 在n维向量空间给定两组基
(I)α1,α2,,αn  (II)β1,β2,,βn(I)\alpha_1,\alpha_2,\cdots,\alpha_n\ \ (II)\beta_1,\beta_2,\cdots,\beta_n

β1=c11α1+c21α2++cn1αn\beta_1=c_{11}\alpha_1+c_{21}\alpha_2+\cdots+c_{n1}\alpha_n
β2=c12α1+c22α2++cn2αn\beta_2=c_{12}\alpha_1+c_{22}\alpha_2+\cdots+c_{n2}\alpha_n
\cdots
βn=c1nα1+c2nα2++cnnαn\beta_n=c_{1n}\alpha_1+c_{2n}\alpha_2+\cdots+c_{nn}\alpha_n
[β1,β2,,βn]=[α1,α2,,αn]C[\beta_1,\beta_2,\cdots,\beta_n]=[\alpha_1,\alpha_2,\cdots,\alpha_n]C
其中ParseError: KaTeX parse error: Expected & or \\ or \cr or \end at end of input: …}&\cdots&c_{nn}
称为由基α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n到基β1,β2,,βn\beta_1,\beta_2,\cdots,\beta_n过渡矩阵

二、主要定理

定理 3.9 如果α1,α2,,αm\alpha_1,\alpha_2,\cdots,\alpha_mβ1,β2,,βn\beta_1,\beta_2,\cdots,\beta_n是n维向量空间的两个基底,则由基α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n到基β1,β2,,βn\beta_1,\beta_2,\cdots,\beta_n的过渡矩阵C是可逆矩阵

定理 3.10 如果向量γ\gamma在基底α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n的坐标为x1,x2,,xnx_1,x_2,\cdots,x_n,向量γ\gamma在基底β1,β2,,βn\beta_1,\beta_2,\cdots,\beta_n的坐标为y1,y2,,yny_1,y_2,\cdots,y_n,则坐标变换公式为
[x1x2xn]=C[y1y2yn]x=Cy\begin{bmatrix}x_1\\x_2\\ \vdots\\x_n\end{bmatrix}=C\begin{bmatrix}y_1\\y_2\\ \vdots\\y_n\end{bmatrix} 或 x=Cy
其中n阶矩阵C是由基底α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n到基底β1,β2,,βn\beta_1,\beta_2,\cdots,\beta_n的过渡矩阵

定理 3.11e1,e2,,ene_1,e_2,\cdots,e_n是规范正交基,设
[ε1,ε2,,εn]=[e1,e2,,en]C[\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n]=[e_1,e_2,\cdots,e_n]C
ε1,ε2,,εn\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n是规范正交基的充分必要条件是C为正交矩阵

第四章 线性方程组

1 克拉默法则

克拉默法则 若n个方程n个未知量构成的非齐次线性方程组
{a11x1+a12x2++a1nxn=b1,a21x1+a22x2++a2nxn=b2,an1x1+an2x2++annxn=bn\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1,\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2,\\ \cdots\\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=b_n \end{cases}
的系数行列式A0|A|\neq 0,则方程组有唯一解,且
xi=AiA,i=1,2,,nx_i=\frac{A_i}{A},i=1,2,\cdots,n
其中Ai|A_i|A|A|中第i列元素(即xix_i的系数)替换成方程组右端的常数项b1,b2,,bnb_1,b_2,\cdots,b_n所构成的行列式

推论 若包含n个方程n个未知量的齐次线性方程组
{a11x1+a12x2++a1nxn=0,a21x1+a22x2++a2nxn=0,an1x1+an2x2++annxn=0\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0,\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0,\\ \cdots\\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=0 \end{cases}
的系数行列式A0|A|\neq 0的充要条件是方程组有唯一零解

反之,若齐次线性方程组有非零解,充要条件是其系数行列式A0|A|\neq 0

2 齐次线性方程组

齐次线性方程组的表达形式 n个未知量,m个方程组成的方程组
{a11x1+a12x2++a1nxn=0,a21x1+a22x2++a2nxn=0,am1x1+am2x2++amnxn=0\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=0,\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=0,\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=0 \end{cases}
称为齐次线性方程组,上式称为齐次线性方程组的一般形式

方程组写成向量形式,则是
α1x1+α2x2++αnxn=0\bm{\alpha}_1 x_1+\bm{\alpha}_2 x_2+\cdots+\bm{\alpha}_n x_n=\bm{0}
其中αj=[a1j,a2j,,amj]T, j=1,2,,n, 0=[0,0,,0]T\bm{\alpha}_j=[a_{1j},a_{2j},\cdots,a_{mj}]^T,\ j=1,2,\cdots,n,\ \bm{0}=[0,0,\cdots,0]^T

写成矩阵形式,则是
Am×nx=0\bm{A}_{m\times n}\bm{x}=\bm{0}

其中
A=[a11a12a1na21a22a2nam1am2amn], x=[x1x2xn], 0=[000]\bm{A}=\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn}\end{bmatrix},\ \bm{x}=\begin{bmatrix}x_1\\x_2\\ \vdots\\x_n\end{bmatrix},\ \bm{0}=\begin{bmatrix}0\\0\\ \vdots\\0\end{bmatrix}

齐次线性方程组的解 若将有序数组c1,c2,,cnc_1,c_2,\cdots,c_n代入方程组的未知量x1,x2,,xnx_1,x_2,\cdots,x_n,使每个方程等式成立,则称[c1,c2,,cn]T[c_1,c_2,\cdots,c_n]^T为方程组的一个解(或解向量),记成ξ=[c1,c2,,cn]T\bm{\xi}=[c_1,c_2,\cdots,c_n]^T,即α1c1+α2c2++αncn=0\alpha_1 c_1+\alpha_2 c_2+\cdots+\alpha_n c_n=\bm{0}Aξ=0\bm{A}\bm{\xi}=\bm{0},即齐次方程组的解是使A的列向量线性组合为零的线性组合系数

若方程组只有零解 等价于 α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n线性无关

齐次线性方程组的基础解系ξ1,ξ2,,ξnr\xi_1,\xi_2,\cdots,\xi_{n-r}Ax=0Ax=0的解向量,若满足

  1. ξ1,ξ2,,ξnr\xi_1,\xi_2,\cdots,\xi_{n-r}线性无关
  2. Ax=0Ax=0的任一解向量ξ\xi均可由ξ1,ξ2,,ξnr\xi_1,\xi_2,\cdots,\xi_{n-r}线性表出

则称向量组ξ1,ξ2,,ξnr\xi_1,\xi_2,\cdots,\xi_{n-r}Ax=0Ax=0的基础解系

条件2.等价于“加入任一解向量ξ\xi,使得ξ1,ξ2,,ξnr,ξ\xi_1,\xi_2,\cdots,\xi_{n-r},\xi线性相关”,等价于“r(A)=r”,即线性无关解向量的个数为n-r,满足r(A)+线性无关解的个数=n(n是未知量个数)

Ax=0的解的性质ξ1,ξ2\xi_1,\xi_2是齐次线性方程组Ax=0Ax=0的解,则k1ξ1,k1ξ1+k2ξ2k_1\xi_1,k_1\xi_1+k_2\xi_2仍是Ax=0Ax=0的解,其中k1,k2k_1,k_2是任意常数

同样,若ξ1,ξ2,,ξs\xi_1,\xi_2,\cdots,\xi_s均是Ax=0的解,则k1ξ1+k2ξ2++ksξsk_1\xi_1+k_2\xi_2+\cdots+k_s\xi_s仍是Ax=0的解,其中k1,k2,,ksk_1,k_2,\cdots,k_s均是任意常数

Ax=0的有解条件 齐次线性方程Ax=0一定有解,至少有零解

齐次线性方程组Am×nx=[α1,α2,,αn]x=α1x1+α2x2++αnxn=0A_{m\times n}x=[\alpha_1,\alpha_2,\cdots,\alpha_n]x=\alpha_1 x_1+\alpha_2 x_2+\cdots+\alpha_n x_n=0只有零解(有非零解)
等价于 α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n(方程组的列向量组,即A的列向量组)线性无关(线性相关)
等价于 r(α1,α2,,αn)=r(Am×n)=n(r(α1,α2,,αn)=r(Am×n)<n)r(\alpha_1,\alpha_2,\cdots,\alpha_n)=r(A_{m\times n})=n(r(\alpha_1,\alpha_2,\cdots,\alpha_n)=r(A_{m\times n})<n)

基础解系向量个数与r(A)的关系 若A是m×nm\times n矩阵,r(A)=r<n,则齐次线性方程组Ax=0存在基础解系,且基础解系有n-r个线性无关解向量组成。故
+r(A)=n()基础解系向量个数+r(A)=n(未知量个数)

Ax=0的通解ξ1,ξ2,,ξnr\xi_1,\xi_2,\cdots,\xi_{n-r}是Ax=0的基础解系,则
k1ξ1+k2ξ2++knrξnrk_1\xi_1+k_2\xi_2+\cdots+k_{n-r}\xi_{n-r}
是Ax=0的通解(或称一般解),其中k1,k2,,knrk_1,k_2,\cdots,k_{n-r}是任意常数

基础解系和通解的求法
利用初等行变换不改变线性方程组的解,将A作初等行变换化成阶梯形矩阵,可具体求得基础解系


A[c11c12c1rc1,r+1c1n0c22c2rc2,r+1c2n00crrcr,r+1crn0000000000]=BA\underrightarrow{初等行变换} \begin{bmatrix}c_{11}&c_{12}&\cdots&c_{1r}&c_{1,r+1}&\cdots&c_{1n}\\ 0&c_{22}&\cdots&c_{2r}&c_{2,r+1}&\cdots&c_{2n}\\ \vdots&\vdots& &\vdots&\vdots& &\vdots\\ 0&0&\cdots&c_{rr}&c_{r,r+1}&\cdots&c_{rn}\\ 0&0&\cdots&0&0&\cdots&0\\ \vdots&\vdots& &\vdots&\vdots& &\vdots\\ 0&0& &0&0& &0 \end{bmatrix}=B
得Ax=0的同解方程组Bx=0,即
c11x1+c12x2++c1rxr+c1,r+1xr+1++c1nxn=0c22x2++c2rxr+c2,r+1xr+1++c2nxn=0crrxr+cr,r+1xr+1++crnxn=0\begin{aligned} c_{11}x_1+c_{12}x_2+\cdots+c_{1r}x_r+c_{1,r+1}x_{r+1}+\cdots+c_{1n}x_n=0\\ c_{22}x_2+\cdots+c_{2r}x_r+c_{2,r+1}x_{r+1}+\cdots+c_{2n}x_n=0\\ \cdots\\ c_{rr}x_r+c_{r,r+1}x_{r+1}+\cdots+c_{rn}x_n=0 \end{aligned}
阶梯形方程的每行中第一个系数不为零的r个未知量x1,x2,,xrx_1,x_2,\cdots,x_r称为独立未知量,而后面的n-r个未知量xr+1,,xnx_{r+1},\cdots,x_n称为自由未知量,将自由未知量xr+1,,xnx_{r+1},\cdots,x_n分别赋下列n-r组值
[1,0,,0]T,[0,1,0,,0]T,,[0,0,,1]T[1,0,\cdots,0]^T,[0,1,0,\cdots,0]^T,\cdots,[0,0,\cdots,1]^T
代入方程,求出相应的独立未知量x1,x2,,xrx_1,x_2,\cdots,x_r并得到n-r个解
ξ1=[d11,d12,,d1r,1,00]Tξ2=[d21,d22,,d2r,0,1,0]T......ξnr=[dnr1,dnr2,dnrr,0,,0,1]T\begin{aligned} \xi_1 & =[d_{11},d_{12},\cdots,d_{1r},1,0\cdots 0]^T\\ \xi_2 & =[d_{21},d_{22},\cdots,d_{2r},0,1,\cdots 0]^T\\ ......\\ \xi_{n-r} & =[d_{n-r1},d_{n-r2},\cdots d_{n-rr},0,\cdots,0,1]^T \end{aligned}

可以证明,ξ1,ξ2,ξnr\xi_1,\xi_2,\cdots\xi_{n-r}即是方程组Ax=0Ax=0的基础解系所以方程组的通解为k1ξi+k2ξ2++knrξnrk_1\xi_i+k_2\xi_2+\cdots+k_{n-r}\xi_{n_r},其中ki(i=1,2,,nr)k_i(i=1,2,\cdots,n-r)是任意常数

注:初等行变换化阶梯形的过程不同,自由未知量的选择和赋值方法不同,基础解系不唯一,但所含线性无关解向量个数一样,全体解的解集合是一样的

3 非齐次线性方程组

非齐次线性方程组的表达形式 n个未知量、m个方程组组成的方程组
{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2\\ \cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m \end{cases}
称为非齐次线性方程组,上式称为非齐次线性方程组的一般形式,其中右端常数项b1,b2,,bmb_1,b_2,\cdots,b_m不全为零

方程组写成向量形式则是
α1x1+α2x2++αnxn=b\alpha_1 x_1+\alpha_2 x_2+\cdots+\alpha_n x_n=b
其中αj=[a1j,a2j,,amj]T,(j=1,2,,n),b=[b1,b2,,bm]T\alpha_j=[a_{1j},a_{2j},\cdots,a_{mj}]^T,(j=1,2,\cdots,n),b=[b_1,b_2,\cdots,b_m]^T

方程组写成矩阵形式则是
Am×nx=bA_{m\times n}x=b
其中
A=[a11a12a1na21a22a2nam1am2amn],x=[x1x2xn],b=[b1b2bm]A=\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn}\end{bmatrix}, x=\begin{bmatrix}x_1\\x_2\\ \vdots\\x_n\end{bmatrix}, b=\begin{bmatrix}b_1\\b_2\\ \vdots\\b_m\end{bmatrix}

非齐次线性方程组的解 若将有序数组c1,c2,,cnc_1,c_2,\cdots,c_n代入方程组的未知量x1,x2,,xnx_1,x_2,\cdots,x_n,使得每个方程等式成立,则称[c1,c2,,cn]T[c_1,c_2,\cdots,c_n]^T为方程组的一个解(或解向量),记成η=[c1,c2,,cn]T\eta=[c_1,c_2,\cdots,c_n]^T,即c1α1+c2α2++cnαn=bc_1\alpha_1+c_2\alpha_2+\cdots+c_n\alpha_n=bAη=bA\eta=b,即向量形式非齐次方程组的解是b可由A的列向量线性表出的表出系数

Ax=b的解的性质η1,η2\eta_1,\eta_2是Ax=b的两个解,ξ\xi是对应齐次方程组Ax=0的解,则
A(η1η2)=0,A(η1+kξ)=b(k)A(\eta_1-\eta_2)=0,A(\eta_1+k\xi)=b(其中看k是任意常数)

Ax=b的有解条件
Am×nx=bA_{m\times n}x=b无解\Leftrightarrowb不能由A的列向量组α1,α2,αn\alpha_1,\alpha_2,\cdots\alpha_n线性表出
r(A)r(Ab) (r(A)+1=r(Ab))\Leftrightarrow r(A)\neq r(A|b)\ (r(A)+1=r(A|b))

Am×nx=bA_{m\times n}x=b有解\Leftrightarrowb可由A的列向量组α1,α2,αn\alpha_1,\alpha_2,\cdots\alpha_n线性表出
r(A)=r(Ab)\Leftrightarrow r(A)= r(A|b),即r(a1,a2,,an)=r(a1,a2,,an,b)r(a_1,a_2,\cdots,a_n)=r(a_1,a_2,\cdots,a_n,b)
α1,α2,,αnα1,α2,,αn,b\Leftrightarrow {\alpha_1,\alpha_2,\cdots,\alpha_n}等价{\alpha_1,\alpha_2,\cdots,\alpha_n,b}

r(a1,a2,,an)=n=r(a1,a2,,an,b)α1,α2,,αnr(a_1,a_2,\cdots,a_n)=n=r(a_1,a_2,\cdots,a_n,b)\Leftrightarrow \alpha_1,\alpha_2,\cdots,\alpha_n线性无关,α1,α2,,αn.b\alpha_1,\alpha_2,\cdots,\alpha_n.b线性相关\Leftrightarrowb可由α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n线性表出,且表出法唯一\LeftrightarrowAx=b有唯一解

r(a1,a2,,an)=r(a1,a2,,an,b)=r<nα1,α2,,αnr(a_1,a_2,\cdots,a_n)=r(a_1,a_2,\cdots,a_n,b)=r<n\Leftrightarrow \alpha_1,\alpha_2,\cdots,\alpha_n线性相关,b可由α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n线性表出,且表出法不唯一\LeftrightarrowAx=b有无穷多解

Ax=b的通解结构Am×nx=bA_{m\times n}x=b有特解η\eta,对应的齐次线性方程组Ax=0有基础解系ξ1,ξ2,,ξnr\xi_1,\xi_2,\cdots,\xi_{n-r},则Ax=b的通解为
k1ξ1+k2ξ2++knrξnr+ηk_1\xi_1+k_2\xi_2+\cdots+k_{n-r}\xi_{n-r}+\eta
其中k1,k2,,knrk_1,k_2,\cdots,k_{n-r}是任意常数

非齐次线性方程组Ax=b通解的求法
用高斯消元法,将增广矩阵(A|b)作初等行变换化成阶梯形矩阵,先求出对应齐次线性方程组的基础解系ξ1,ξ2,ξnr(r(A)=r)\xi_1,\xi_2\cdots,\xi_{n-r}(r(A)=r),再求一个非齐次特解设为η\eta(求η\eta时,可取自由未知量为任意值,为计算简单,一般将自由未知量均取零值,代入方程,求得独立未知量,并得η\eta,则Ax=bAx=b的通解为
k1ξ1+k2ξ2++knrξnr+ηk_1\xi_1+k_2\xi_2+\cdots+k_{n-r}\xi_{n-r}+\eta
其中k1ξ1+k2ξ2++knrξnrk_1\xi_1+k_2\xi_2+\cdots+k_{n-r}\xi_{n-r}是对应齐次方程组的通解,k1,k2,,knrk_1,k_2,\cdots,k_{n-r}是任意常数

第五章 特征值、特征向量、相似矩阵

1 特征值、特征向量

一、特征值、特征向量

A是n阶方阵,如果对于数λ\lambda,存在非零向量α\alpha,使得
Aα=λα (α0)A\alpha=\lambda\alpha \ (\alpha\neq 0)
成立,则称λ\lambda是A的特征值α\alpha是A的对应于λ\lambda特征向量

二、特征方程、特征多项式、特征矩阵

由上式得,(λEA)α=0(\lambda E-A)\alpha=0,因α0\alpha\neq 0,故
λEA=λa11a12a1na21λa22a2nan1an2λann=0|\lambda E-A|=\begin{vmatrix} \lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{21}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots& &\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}=0
上式称为A的特征方程,是未知元素λ\lambda的n次方程,在复数域内有n个根,方程的左端多项式称为A的特征多项式,矩阵λEA\lambda E-A称为特征矩阵

三、特征值的性质

A=[aij]n×n,λi(i=1,2,,n)A=[a_{ij}]_{n\times n},\lambda_i(i=1,2,\cdots,n)是A的特征值,则

  1. i=1nλi=i=1naii\sum\limits^n_{i=1}\lambda_i=\sum\limits^n_{i=1}a_{ii}
  2. i=1nλi=A\prod\limits^n_{i=1}\lambda_i=|A|

四、求特征值、特征向量的方法

方法一

A=[aij]n×nA=[a_{ij}]_{n\times n},则由λEA=0|\lambda E-A|=0求出A的全部特征值λi\lambda_i,再由齐次线性方程组
(λiEA)x=0(\lambda_i E-A)x=0
求出A的对应于特征值λi\lambda_i的特征向量。基础解系即是A的对应于λi\lambda_i的线性无关特征向量,通解即是A的对应于λi\lambda_i的全体特征向量(除0向量)

*注:*例如,对角阵和上下三角矩阵的特征值,即是主对角元素

方法二

利用定义,凡满足关系式Aα=λαA\alpha=\lambda\alpha的数λ\lambda即是A的特征值,α(α0)\alpha(\alpha\neq 0)即是A的对应于λ\lambda的特征向量。一般用于抽象矩阵,或元素为文字的矩阵

*注:*例如,若齐次线性方程组Ax=0Ax=0有基础解系α1,α2,,αnr\alpha_1,\alpha_2,\cdots,\alpha_{n-r},因Aαi=0=0αi(i=1,2,,nr)A\alpha_i=\bm{0}=0\alpha_i(i=1,2,\cdots,n-r),故α1,α2,,αnr\alpha_1,\alpha_2,\cdots,\alpha_{n-r}是A的对应于λ=0\lambda=0的线性无关特征向量,故当A=0|A|=0时,A有特征值λ=0\lambda=0

2 相似矩阵、矩阵的相似对角化

一、相似矩阵

设A,B都是n阶矩阵,若存在可逆矩阵P,使得P1AP=BP^{-1}AP=B,则称A相似于B,记成ABA\sim B。若AΛA\sim\Lambda,其中Λ\Lambda是对角阵,则称A可相似对角化。Λ\Lambda是A的相似标准形

二、矩阵可相似对角化的充分必要条件

定理 5.1 n阶矩阵A可对角化\LeftrightarrowA有n个线性无关的特征向量

定理 5.2 λ1λ2\lambda_1\neq \lambda_2是A的特征值\LeftrightarrowA的对应于λ1,λ2\lambda_1,\lambda_2的特征向量α1,α2\alpha_1,\alpha_2线性无关

推论 n阶矩阵A有n个互不相同的特征值λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n\RightarrowA有n个线性无关特征向量α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n\LeftrightarrowA可相似于对角阵

P=[α1,α2,,αn]P=[\alpha_1,\alpha_2,\cdots,\alpha_n],则有P1AP=ΛP^{-1}AP=\Lambda,其中Λ=[λ1000λ2000λn]\Lambda=\begin{bmatrix}\lambda_1&0&\cdots&0\\0&\lambda_2&\cdots&0\\ \vdots&\vdots& &\vdots\\0&0&\cdots&\lambda_n\end{bmatrix},注意P中α1,α2,,αn\alpha_1,\alpha_2,\cdots,\alpha_n排列次序应与Λ\Lambdaλ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n的排列次序一致

定理 5.3 λi\lambda_i是n阶矩阵A的rir_i重特征值,则其对应的线性无关特征向量个数小于等于rir_i

推论 n阶矩阵A可相似对角化 等价于 A的每一个rir_i重特征值对应的线性无关特征向量个数等于该特征值的重数rir_i

当A的rir_i重特征值λi\lambda_i对应的线性无关特征向量个数少于特征值的重数rir_i时,A不能相似于对角阵

例如A=[1101],λEA=(λ1)2=0,λ=1A=\begin{bmatrix}1&1\\0&1\end{bmatrix},|\lambda E-A|=(\lambda-1)^2=0,\lambda=1是A的而重特征值,但由于r(EA)=r[0100]=1,(EA)x=0r(E-A)=r\begin{bmatrix}0&-1\\0&0\end{bmatrix}=1,(E-A)x=0只有一个线性无关解,即对应于λ=1\lambda=1(二重根)只有一个线性无关特征向量,故A=[1101]A=\begin{bmatrix}1&1\\0&1\end{bmatrix}不能与对角阵相似

三、相似矩阵的性质及相似矩阵的必要条件

1. 性质

  1. AAA\sim A,反身性
  2. ABBAA\sim B\Rightarrow B\sim A,对称性
  3. AB,BCACA\sim B,B\sim C\Rightarrow A\sim C,传递性

2. 两个矩阵A与B相似的必要条件

  1. λEA=λEB|\lambda E-A|=|\lambda E-B|
  2. r(A)=r(B)r(A)=r(B)
  3. A,B有相同的特征值
  4. A=B=i=1nλi|A|=|B|=\prod\limits^n_{i=1}\lambda_i
  5. i=1naii=i=1nbii=i=1nλi\sum\limits^n_{i=1}a_{ii}=\sum\limits^n_{i=1}b_{ii}=\sum\limits^n_{i=1}\lambda_{i}

3 实对称矩阵的相似对角化

一、实对称阵

元素aija_{ij}都是实数的对称矩阵称为实对称矩阵,aija_{ij}是实数aij=aˉij\Leftrightarrow a_{ij}=\bar{a}_{ij}aˉij\bar{a}_{ij}aija_{ij}的共轭)记Aˉ=[aˉij]\bar{A}=[\bar{a}_{ij}],则A是实对称阵AT=A\Leftrightarrow A^T=A,且Aˉ=A\bar{A}=A

二、实对称阵的特征值,特征向量及相似对角化

定理 5.4 实对称矩阵的特征值全部是实数
定理 5.5 实对称矩阵的属于不同特征值对应的特征向量相互正交
定理 5.6 实对称矩阵必相似于对角阵,即存在可逆阵P,使得P1AP=ΛP^{-1}AP=\Lambda,且存在正交阵Q,使得Q1AQ=QTAQ=ΛQ^{-1}AQ=Q^T AQ=\Lambda

三、实对称矩阵正交相似于对角阵的步骤

  1. 解特征方程λEA=0|\lambda E-A|=0,求出全部特征值:λ1,λ2,,λr\lambda_1,\lambda_2,\cdots,\lambda_r(均为实数)(若求得的是特征值的取值范围,则λ\lambda的取值范围应限于实数,去除复数)
  2. (λiEA)x=0(\lambda_i E-A)x=0的基础解系αi1,αi2,,αiki,i=1,2,,r\alpha_{i1},\alpha_{i2},\cdots,\alpha_{ik_i},i=1,2,\cdots,r,即是A的属于特征值λi\lambda_i的线性无关的特征向量。若λi\lambda_ikik_i重根,则必有kik_i个线性无关特征向量(若求解方程(λiEA)x=0(\lambda_i E-A)x=0的基础解系时,使αi1,αi2,,αiki\alpha_{i1},\alpha_{i2},\cdots,\alpha_{ik_i}能相互正交更好,可免去下一步将αi1,αi2,,αiki\alpha_{i1},\alpha_{i2},\cdots,\alpha_{ik_i}正交化的工作)
  3. 将每个属于λi\lambda_i的特征向量αi1,αi2,,αiki\alpha_{i1},\alpha_{i2},\cdots,\alpha_{ik_i}正交化(不同特征值对应的特征向量已相互正交)正交后的向量组记成βi1,βi2,,βiki\beta_{i1},\beta_{i2},\cdots,\beta_{ik_i}
  4. 将全部特征向量单位化。得标准正交向量组记成
    β11,β12,,β1k1,β21,β22,,β2k2,,βr1,βr2,,βrkr\beta_{11},\beta_{12},\cdots,\beta_{1k_1},\beta_{21},\beta_{22},\cdots,\beta_{2k_2},\cdots,\beta_{r1},\beta_{r2},\cdots,\beta_{rk_r}
  5. 将n个单位正交特征向量合并成正交矩阵,记成
    Q=[β11,β12,,β1k1,β21,β22,,β2k2,,βr1,βr2,,βrkr]Q=[\beta_{11},\beta_{12},\cdots,\beta_{1k_1},\beta_{21},\beta_{22},\cdots,\beta_{2k_2},\cdots,\beta_{r1},\beta_{r2},\cdots,\beta_{rk_r}]

此即是所求的正交阵,且有
Q1AQ=QTAQ=ΛQ^{-1}AQ=Q^T AQ=\Lambda
其中Λ\Lambda是A的全部特征值组成的对角阵(注意λi\lambda_iβiki\beta_{ik_i}的排列次序要求一致)

第六章 二次型

1 二次型的概念、矩阵表示

一、二次型概念

定义 6.1 n个变量的一个二次齐次多项式
f(x1,x2,,xn)=a11x12+2a12x1x2+2a13x1x3++2a1nx1xnf(x_1,x_2,\cdots,x_n)=a_{11}x^2_1+2a_{12}x_1x_2+2a_{13}x_1x_3+\cdots+2a_{1n}x_1x_n
+a22x22+2a23x2x3++2a2nx2xn+a_{22}x^2_2+2a_{23}x_2x_3+\cdots+2a_{2n}x_2x_n
++\cdots
+annxn2+a_{nn}x^2_n
称为n个变量的二次型,系数均为实数时,称为n元实二次型

例如:f(x1,x2,x3)=x12+2x1x2+4x1x3+2x22+6x2x3+x32f(x_1,x_2,x_3)=x^2_1+2x_1x_2+4x_1x_3+2x^2_2+6x_2x_3+x^2_3是一个三元二次齐次多项式,称为三元二次型

二、二次型的矩阵表示

首先将二次型表示成矩阵形式,因表示成矩阵形式,因xixj=xjxix_ix_j=x_jx_i,具有对称性,若令aij=aji,i<ja_{ij}=a_{ji},i<j,则2aijxixj=aijxixj+ajixjxi2a_{ij}x_ix_j=a_{ij}x_ix_j+a_{ji}x_jx_i,则二次型可以写成矩阵形式:
f(x1,x2,,xn)=i=1nj=1naijxixj=[x1,x2,,xn][a11a12a1na21a22a2nan1an2ann][x1x2xn]=xTAx\begin{aligned} f(x_1,x_2,\cdots,x_n) &= \sum^n_{i=1}\sum^n_{j=1}a_{ij}x_ix_j\\ &= [x_1,x_2,\cdots,x_n] \begin{bmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}\end{bmatrix} \begin{bmatrix}x_1\\x_2\\ \vdots\\x_n\end{bmatrix}=\bm{x}^T \bm{Ax}\end{aligned}
其中AT=AA^T=A是对称矩阵,称为二次型f的对应矩阵

例如:
f(x1,x2,x3)=x12+2x1x2+4x1x3+2x22+6x2x3+x32=[x1,x2,x3][11222323][x1x2x3]=xTAx\begin{aligned} f(x_1,x_2,x_3) &= x^2_1+2x_1x_2+4x_1x_3+2x^2_2+6x_2x_3+x^2_3\\ &=[x_1,x_2,x_3] \begin{bmatrix} 1&1&2\\ 2&2&3\\ 2&3& \end{bmatrix} \begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\bm{x^TAx} \end{aligned}

2 化二次型为标准型、规范性 合同二次型

一、二次型的标准形,规范形

定义 6.2 若二次型f(x1,x2,,xn)f(x_1,x_2,\cdots,x_n)只有平方项,没有混合项(即混合项的系数全为零),即
f(x1,x2,,xn)=xTAx=d1x12++dpxp2dp+1xp+12dp+qxp+q2\begin{aligned} f(x_1,x_2,\cdots,x_n)&=\bm{x^TAx}\\ &=d_1x^2_1+\cdots+d_px^2_p-d_{p+1}x^2_{p+1}-\cdots-d_{p+q}x^2_{p+q}\end{aligned}
其中di>0,i=1,2,,p+q p+q=rnd_i>0,i=1,2,\cdots,p+q\ p+q=r\leq n
则称二次型为标准形(又称平方和)

在二次型的标准形中,若平方项的系数did_i只是1,-1,0,即
f(x1,x2,,xn)=xTAx=x12+x22++xp2xp+12xp+q2f(x_1,x_2,\cdots,x_n)=\bm{x}^T\bm{Ax}=x^2_1+x^2_2+\cdots+x^2_p-x^2_{p+1}-\cdots-x^2_{p+q}
则称为二次型的规范形

二、化二次型为标准形,规范形

定理 6.1 对任意一个n元二次型f(x1,x2,,xn)=xTAxf(x_1,x_2,\cdots,x_n)=\bm{x}^T\bm{Ax},必存在正交变换x=Qy\bm{x}=\bm{Qy},其中Q是正交阵,化二次型为标准形,即
f(x1,x2,,xn)=xTAx=yTQTAQy=λ1y12+λ2y22++λnyn2f(x_1,x_2,\cdots,x_n)=\bm{x}^T\bm{Ax}=\bm{y}^T\bm{Q}^T\bm{AQy}=\lambda_1y^2_1+\lambda_2y^2_2+\cdots+\lambda_ny^2_n
其中λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n是A的n个特征值

用矩阵的语言表达,即

对任意一个n阶实对称阵A,必存在正交阵Q,使得
Q1AQ=QTAQ=ΛQ^{-1}AQ=Q^TAQ=\Lambda
其中Λ=[λ1000λ2000λn],λi(i=1,2,,n)\Lambda=\begin{bmatrix}\lambda_1&0&\cdots&0\\0&\lambda_2&\cdots&0\\ \vdots&\vdots& &\vdots\\0&0&\cdots&\lambda_n\end{bmatrix},\lambda_i(i=1,2,\cdots,n)是A的特征值,即A必既相似又合同于对角阵

定理 6.2 任一个n元二次型f(x1,x2,,xn)=xTAxf(x_1,x_2,\cdots,x_n)=\bm{x}^T\bm{Ax},都可以通过(配方法)可逆线性变换x=Cyx=Cy,其中C是可逆阵,化成标准形,即
f(x1,x2,,xn)=xTAx=yTCTACy=d1y12+d2y22++dnyn2f(x_1,x_2,\cdots,x_n)=x^TAx=y^TC^TACy=d_1y^2_1+d_2y^2_2+\cdots+d_ny^2_n
用矩阵的语言表达,即
对任意一个n阶实对称阵A,一定存在可逆阵C,使得CTAC=ΛC^TAC=\Lambda,其中
Λ=[d1000d2000dn]\Lambda=\begin{bmatrix} d_1&0&\cdots&0\\ 0&d_2&\cdots&0\\ \vdots&\vdots& &\vdots\\ 0&0&\cdots&d_n\end{bmatrix}
即实对称阵必合同于对角阵

三、合同矩阵,合同二次型

定义 6.3(合同) 设A,B是两个n阶方阵,,若存在可逆阵C,使得CTAC=BC^TAC=B,则称A合同于B

合同矩阵有如下性质

一个二次型f=xTAxf=x^TAx,经过可逆线性变换x=Cyx=Cy,其中C是可逆阵,得
f(x1,x2,,xn)=xTAx=(Cy)TACy=yTCTACyf(x_1,x_2,\cdots,x_n)=x^TAx=(Cy)^TACy=y^TC^TACy
记作yTByy^TBy,还可记作g(y1,y2,,yn)g(y_1,y_2,\cdots,y_n)
其中B=CTACB=C^TAC,且B仍是对称阵

此时称A和B是合同矩阵,二次型f和g称为合同二次型。显然合同局长(合同二次型)有相同的秩

定理 6.3(惯性定理) 对于一个二次型,作可逆线性变换化成标准形(或规范形)。所作的可逆线性变换不唯一,标准形也不唯一,但其标准形中正平方项的项数p,负平方项的项数q都是由所给二次型唯一确定的

正平方项的项数p称为正惯性指数,赋平方项的项数q称为负惯性指数,p+q=r是二次型对应矩阵的,p-q称为符号差

定理 6.4 实对称阵A合同于B xTAx\Leftrightarrow x^TAxxTBxx^TBx有相同的正、负惯性指数,
A合同于Br(A)=r(B)\Rightarrow r(A)=r(B)

3 正定二次型、正定矩阵

定义 6.4(正定) 若对于任意的非零向量x=[x1,x2,,xn]T\bm{x}=[x_1,x_2,\cdots,x_n]^T,恒有
f(x1,x2,,xn)=i=1nj=1naijxixj=xTAx>0f(x_1,x_2,\cdots,x_n)=\sum^n_{i=1}\sum^n_{j=1}a_{ij}x_ix_j=\bm{x}^T\bm{Ax}>0
则称二次型f为正定二次型,对应矩阵为正定矩阵

例如:f(x1,x2,,xn)=d1x12+d2x22++dnxn2f(x_1,x_2,\cdots,x_n)=d_1x^2_1+d_2x^2_2+\cdots+d_nx^2_n,其中di>0,i=1,2,,nd_i>0,i=1,2,\cdots,n。因其对任意的非零向量x=[x1,x2,,xn]T0\bm{x}=[x_1,x_2,\cdots,x_n]^T\neq \bm{0},均有
f(x1,x2,,xn)=d1x12+d2x22++xn2f(x_1,x_2,\cdots,x_n)=d_1x^2_1+d_2x^2_2+\cdots+x^2_n
(规范形中系数都是1,没有0和-1)也是正定二次型

反之,只有平方项的二次型正定,则其系数di>0,i=1,2,,nd_i>0,i=1,2,\cdots,n,故
f(x1,x2,,xn)=d1x12+d2x22++dnxn2f(x_1,x_2,\cdots,x_n)=d_1x^2_1+d_2x^2_2+\cdots+d_nx^2_n正定di>0,i=1,2,,n\Leftrightarrow d_i>0,i=1,2,\cdots,n,即正惯性指数p=r=n

定理 6.5 可逆线性变换不改变二次型的正定性
由定理可知,对一般的二次型(或对称阵)应设法做可逆线性变换化成标准形(或规范形),看did_i是否均大于零来判别其正定性

定理 6.6 f正定的充要条件
f(x1,x2,,xn)=xTAxf(x_1,x_2,\cdots,x_n)=\bm{x}^T\bm{Ax}正定\LeftrightarrowA的正惯性指数p=r=n(r是A的秩,n是未知量个数)\LeftrightarrowA合同于E,即存在可逆阵C,使得CTAC=EA=DTD\bm{C}^T\bm{AC}=E\Leftrightarrow \bm{A}=\bm{D}^T\bm{D},其中D是可逆阵\LeftrightarrowA的全部特征值λi>0,i=1,2,,n\lambda_i>0,i=1,2,\cdots,n \LeftrightarrowA的全部顺序主子式大于零,即
A=[a11a12a1na12a22a2na1na2nann]a11>0,a11a12a12a22>0,,A>0A=\begin{bmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{12}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{1n}&a_{2n}&\cdots&a_{nn}\end{bmatrix}正定\Leftrightarrow a_{11}>0, \begin{vmatrix}a_{11}&a_{12}\\a_{12}&a_{22}\end{vmatrix}>0,\cdots,|A|>0

定理 6.7 f=xTAxf=x^TAx正定的必要条件
若二次型f(x1,x2,,xn)=xTAxf(x_1,x_2,\cdots,x_n)=\bm{x}^T\bm{Ax}正定,则

  1. A的主对角元素aii>0a_{ii}>0
  2. A的行列式A>0|A|>0