人工智能数学基础之线性代数(持续更新)

前言

本文只会记录人工智能中所用到的线性代数知识,并不会记录大学线性代数教材中的所有知识。

标量

只有大小没有方向的量称为标量。

单个数字就是标量。

向量

所谓的向量就是一组数字,可以用v来表示
v = \left[\begin{matrix}1 \\2 \\3 \end{matrix} \right]v = [1 ~ 2 ~ 3]

当两个向量大小相等、方向相同时,说这两个向量相等。

这里由3个数组成,叫做3维向量,相应的,由n个数组成的称为n维向量。

左边排成一列的形式叫做列向量;右边叫做行向量

v_i表示向量中的第i个元素,本例中v_1 =1,v_2 = 2,v_3 = 3

在这里插入图片描述

3维向量可以在3维空间中表示出来。

向量的长度

n维向量\alpha = (a_1,a_2,...,a_n),数值\sqrt{a_1^2 + a_2^2 + ... + a_n^2}称为向量\alpha的长度或,记为\left \| \alpha \right \|

\left \| \alpha \right \| = 1\alpha单位向量

向量的运算

向量的加法

在这里插入图片描述

向量的减法

在这里插入图片描述

注意\vec{a} - \vec{b}得到的向量为\vec{b}指向\vec{a}

向量的乘法

在这里插入图片描述

\vec{a} \cdot \vec{b} = | \vec{a} | \cdot |\vec{b}| \cos \theta

相当于向量\vec{b}在向量\vec{a}的方向的投影与向量| \vec{a} |相乘

向量的范数

向量的1-范数\left \| X \right \|_1 = |x_1| +|x_2| + ... + |x_n| ;各元素的绝对值之和
向量的2-范数\left \| X \right \| = \sqrt{x_1^2 + x_2^2 + ... + x_n^2} ; 每个元素的平方和再开方,也就是n维向量的长度;
向量的无穷范数\left \| X \right \|_\infty = \max(|x_1|,|x_2|,...,|x_n|) ;分量绝对值的最大者
向量的p-范数\left \| X \right \|_p = (\sum_{i=1}^n |x_i| ^ p)^{\frac{1}{p}} , (1 \leq p \leq n)

对于2-范数有: ||x|| + ||y|| \geq || x + y||

||\vec{x}||0||\vec{y}||0 时,称
\theta = \arccos \frac{ \vec{a} \cdot \vec{y}}{||\vec{x}|| || \vec{y}||}
为向量\vec{x}\vec{y}的夹角。

向量的内积

设有n维向量
\vec{x} = \left[ \begin{matrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{matrix} \right], \vec{y} = \left[ \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{matrix} \right],

[\vec{x},\vec{y}] = \sum_{i=1}^n x_i y_i = x_1y_1 + x_2y_2 + \cdots+ x_ny_n
上式称为向量的内积,内积的结果是一个标量。

这里要求一维向量\vec{x}和向量\vec{y}的行列数相同。

[\vec{x},\vec{y}] = 0时,称向量\vec{x}和向量\vec{y}正交。

一组两两相交的非零向量,称为正交向量组

向量组

若干个同维的列向量(行向量)所组成的集合称为向量组
\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}

\left[ \begin{matrix} a_{11} & a_{21} & \cdots & a_{m1}\\ a_{12} & a_{22} & \cdots & a_{m2} \\ \vdots & \vdots & \ddots & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{mn} \end{matrix} \right]

向量组的线性组合
对于向量组\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n},如果有一组数k_1,k_2,\cdots,k_n,使
\vec{\beta} = k_1 \vec{a_1} + k_2\vec{a_2} + \cdots + k_n\vec{a_n},
则称向量\vec{\beta}是向量组\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}的一个线性组合,或称\vec{\beta}可由向量组\vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n}线性表示。

向量组的线性相关

给定向量组A= \vec{a_1},\vec{a_2},\vec{a_3},\cdots,\vec{a_n},如果存在不全为零的数k_1,k_2,\cdots,k_n使
k_1\vec{a_1} + k_2\vec{a_2} + \cdots + k_n\vec{a_n} = 0

则称向量组A线性相关的,否则称它为线性无关。

对于任一向量组,不是线性无关就是线性相关。

向量空间

Vn维实向量构成的集合,对于向量的加法运算及数乘运算满足:

  1. 任意\alpha \in V,\beta \in V,有\alpha + \beta \in V
  2. 任意\alpha \in V, k \in R,有k\alpha \in V

则称集合VR上的实向量空间,简称向量空间。

已知V_1,V_2是向量空间,若V_1 \in V_2,则称V_1V_2的子空间。

向量集合的张成

定义v_1,v_2,\cdots,v_n为向量空间V中的向量。\alpha_1 v_1 + \alpha_2 v_2 + \cdots + \alpha_n v_n (其中\alpha_1,\alpha_2,\cdots,\alpha_n为标量)称为向量v_1,v_2,\cdots,v_n的线性组合。

向量v_1,v_2,\cdots,v_n的所有线性组合构成的集合,称为v_1,v_2,\cdots,v_n张成(Span)。向量v_1,v_2,\cdots,v_n的张成记为\text{Span}(v_1,v_2,\cdots,v_n)

向量空间的基

V是一个向量空间,如果存在一组向量\alpha_1,\alpha_2,\cdots,\alpha_r \in V,满足:

  1. \alpha_1,\alpha_2,\cdots,\alpha_r线性无关;
  2. V任意一组向量都可以由该向量组线性表示,则称\alpha_1,\alpha_2,\cdots,\alpha_r为向量空间V的一组基;

线性无关:如果向量空间V中的向量v_1,v_2,\cdots,v_n满足
c_1 v_1 + c_2 v_2 + \cdots + c_n v_n = 0
就可以推出所有标量c_1,\cdots,c_n必为0,则称它们为线性无关的。

标准基

集合\{e_1,e_2,e_3\}R^3的标准基。之所以称这个基为标准基,使用因为使用这个基表示向量空间R^3最自然。更一般地,R^n的标准基集为集合\{e_1,e_2,\cdots,e_n\}

其中单位矩阵I的第j列向量的记为e_j。具体可见下面单位矩阵的定义。

行列式

行列式的引入

用消元法解二元线性方程组
\begin{cases} a_{11}x_1 + a_{12}x_2 = b_1, \\ a_{21}x_1 + a_{22}x_2 = b_2. \end{cases} \tag{1}
为消去未知数x_2,以a_{22}a_{12}分别乘上列两方程的两端,然后两个方程相减,得
a_{11}a_{22}x_1 + \bcancel{a_{12}a_{22}x_2} - a_{12}a_{21}x_1 - \bcancel{a_{12}a_{22}x_2} = b_1a_{22} - a_{12}b_2 \\ (a_{11}a_{22}-a_{12}a_{21})x_1 = b_1a_{22} - a_{12}b_2
类似地,消去x_1,得
(a_{11}a_{22} - a_{12}a_{21})x_2 = a_{11}b_2 - b_1a_{21}
a_{11}a_{22} - a_{12}a_{21} \neq 0时,求得方程组(1)的解为
x_1 = \frac{b_1a_{22}-a_{12}b_2 }{a_{11}a_{22} - a_{12}a_{21}}, \quad x_2 = \frac{a_{11}b_2 - b_1a_{21}}{a_{11}a_{22} - a_{12}a_{21}} \tag{2}
其中分母是由方程组(1)的四个系数确定的,把这四个数按它们在方程组中的位置,排列成二行二列的数表
\begin{matrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{matrix}, \tag{3}
表达式a_{11}a_{22} - a_{12}a_{21}称为数表(3)所确定的\color{blue}{二阶行列式},并记作
\begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}. \tag{4}
a_{ij}(i=1,2;j=1,2)称为行列式(4)的元素或元。位于第i行第j列的元素称为行列式(4)(i,j)元。

二阶行列式的定义,可以用对角线法则来记忆,比如写一个字母``X,先写`,为主对角线;再写/,为副对角线。二阶行列式就是主对角线上的两元素之积减去副对角线两元素之积。

利用二阶行列式的概念,(2)式中x_1,x_2的分子也可以写成二阶行列式,即
b_1a_{22} -a_{12}b_2 =\begin{vmatrix} b_1 & a_{12} \\ b_2 & a_{22} \end{vmatrix},\quad a_{11}b_2 -b_1a_{21} =\begin{vmatrix} a_{11} & b_1 \\ a_{21} & b_2 \end{vmatrix}.
若记
D = \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}, \quad D_1 = \begin{vmatrix} b_1 & a_{12} \\ b_2 & a_{22} \end{vmatrix}, \quad D_2 = \begin{vmatrix} a_{11} & b_1 \\ a_{21} & b_2 \end{vmatrix},
那么(2)式可写成
x_1 = \frac{D_1}{D} = \frac{\begin{vmatrix} b_1 & a_{12} \\ b_2 & a_{22} \end{vmatrix}}{\begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}},\quad x_2 = \frac{D_2}{D} = \frac{\begin{vmatrix} a_{11} & b_1 \\ a_{21} & b_2 \end{vmatrix}}{\begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}}

这里的分母D是由方程组(1)的系数所确定的二阶行列式,x_1的分子D_1是用常数项b_1,b_2替换Dx_1的系数a_{11},a_{21}所得的二阶行列式;

x_2的分子D_2是用b_1,b_2替换Dx_2的系数a_{12},a_{22}所得的二阶行列式。

定义 设有9个数排成3行3列的数表
\begin{matrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{matrix}, \tag{5}

\begin{vmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{vmatrix} = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} +a_{13}a_{21}a_{32} \\ \qquad\qquad\qquad\qquad- a_{11}a_{23}a_{32} - a_{12}a_{21}a_{33} - a_{13}a_{22}a_{31} \tag{6}
(6)称为数表(5)所确定的三阶行列式。

上述定义表面三阶行列式含6项,每项均为不同行不同列的三个元素的乘积再冠以正负号。

虽然三阶行列式也适用于对角线法则,为了研究四阶及更高阶行列式,下面先介绍有关全排列的知识。

逆序数

对于n个不同的元素,在这n个元素的任一排列中,当某两个元素的先后次序与标准次序(比如可规定由小到大为标准次序)不同时,就说有1个逆序。 一个排列中所有逆序的总数叫做这个排列的逆序数。

逆序数为技术的排列叫做奇排列,逆序数为偶数的排列叫做偶排列。

n个元素为1nn个自然数,并规定由小到大为标准次序。设
p_1p_2\cdots p_n
为这n个自然数的一个排列,考虑元素p_i(i=1,2,\cdots,n),如果比p_i大的且排在p_i前面的元素有t_i个,就说p_i这个元素的逆序数是t_i。全体元素的逆序数之总和
t = t_1 + t_2 + \cdots + t_n = \sum_{t=1}^n t_i,
即使这个排列的逆序数。

来看一个例子理解。

求排列32514的逆序数

在排列32514中:

  • 3排在首位,逆序数为0

  • 2的前面比2大的数有一个(3),逆序数为1

  • 5是最大数,逆序数为0

  • 1的前面比1大的数有三个(3,2,5),逆序数为3

  • 4的前面比4大的数有一个(5),逆序数为1,于是这个排列的逆序数为
    t = 0 + 1 + 0 +3 + 1 =5

n阶行列式的定义

为了给出n阶行列式的定义,先来研究三阶行列式的结构。三阶行列式定义为
\begin{vmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{vmatrix} = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} +a_{13}a_{21}a_{32} \\ \qquad\qquad\qquad\qquad- a_{11}a_{23}a_{32} - a_{12}a_{21}a_{33} - a_{13}a_{22}a_{31}

容易看出:

  1. 上式右边的每一项都恰是三个元素的乘积,这三个元素位于不同的行、不同列。因此,上式右端的任一项除正负号外可以写成a_{1p_1}a_{2p_2}a_{3p_3}。这里第一个下标(行标)排成标准次序123,而第二下标(列标)排成p_1p_2p_3,它是1,2,3三个数的某个排列。这样的排列共有6中,对应上式右端共有6项。
  2. 各项的正负号与列标的排列对照
    • 带正号的三项列标排列是123,231,312
    • 带负号的三项列标排列是132,213,321

经计算可知前三个排列都是偶排列,后三个排列都是奇排列。因此各项所带的正负号可以表示为(-1)^t,其中t为列标排列的逆序数。

总之,三阶行列式可以写成
\begin{vmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\\ \end{vmatrix} = \sum (-1)^t a_{1p_1}a_{2p_2}a_{3p_3},
其中t为排列p_1p_2p_3的逆序数,\sum表示对1,2,3三个数的所有排列p_1p_2p_3去和。

仿此,可以把行列式推广到一般情形。

定义 设有n^2个数,排成nn列的数表
\begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \cdots &\cdots & \cdots & \cdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix},
作出表中位于不同行不同列的n个数的乘积,并冠以符号(-1)^t,得到形如
(-1)^t a_{1p_1}a_{2p_2}\cdots a_{np_n} \tag{7}
的项,其中p_1p_2\cdots p_n为自然数1,2,\cdots,n的一个排列,t为这个排列的逆序数。

由于这样的排列共有n!个,因为形如(7)式的项共有n!个。所有这n!项的代数和
\sum (-1)^t a_{1p_1}a_{2p_2} \cdots a_{np_n}
称为n阶行列式,记作
D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \cdots &\cdots & \cdots & \cdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix},
简记作det(a_{ij}),其中数a_{ij}为行列式D(i,j)元。

例5 证明n阶行列式
\begin{vmatrix} \lambda_1 & & & \\ & \lambda2 && \\ & & \ddots & \\ & & & \lambda_n\\ \end{vmatrix} = \lambda_1\lambda_2 \cdots \lambda_n, \\ \begin{vmatrix} & & &\lambda_1 \\ & &\lambda2& \\ & \cdots & & \\ \lambda_n & & & \\ \end{vmatrix} = (-1)^{\frac{n(n-1)}{2}} \lambda_1\lambda_2 \cdots \lambda_n

其中为写出的元素都是0。

第一式左端称为对角行列式,只能取不同行不同列,我们只考虑非零的情况。第1行只能取第1列,第二行只能取第2列,\cdots,第n行只能取第n列,最终结果很显然。

第二式第1行只能取第n列,对应的是a_{1n},第2行只能取第n-1列,对应a_{2n-1}\cdots,第n行只能取第1列,对应a_{n1}

列标的排列为
n(n-1)\cdots 2\,1
所以,逆序数t
t = 0 + 1 + 2 + \cdots + (n-1) = \frac{n(n-1)}{2}
例6 证明下三角形行列式
D = \begin{vmatrix} a_{11} & & & 0 \\ a_{21} & a_{22} && \\ \vdots & \vdots & \ddots & \\ a_{n1} & a_{n2} &\cdots & a_{nn}\\ \end{vmatrix} = a_{11}a_{22}\cdots a_{nn}.
1行只能取第1列,第二行只能取第2列,\cdots,第n行只能取第n列,并且列标是
12 \cdots n
逆序数为0(-1)^0=1

所以结果就是其主对角线上的元素之积。

行列式的性质


D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \vdots &\vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix}, \quad D^T = \begin{vmatrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots &\vdots & & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{vmatrix}
行列式D^T称为行列式D的转置行列式。

性质1 行列式与它的转置行列式相等

性质2 互换行列式的两行(列),行列式变号

推论 如果行列式有两行(列)完全相同,则此行列式等于零

性质3 行列式的某一行(列)中所有的元素都乘以同一数k,等于用数k乘此行列式

推论 行列式中某一行(列)的所有元素的公因子可以提到行列式记号的外面

性质4 行列式中如果有两行(列)元素成比例,则此行列式等于零

性质5 若行列式的某一列(行)的元素都是两数之和,例如第i列的元素都是两数之和:
D= \begin{vmatrix} a_{11} & a_{12} & \cdots & (a_{1i} + a_{1i}^\prime)& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & (a_{2i} + a_{2i}^\prime)& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & (a_{ni} + a_{ni}^\prime)& \cdots &a_{nn}\\ \end{vmatrix},
D等于下列两个行列式之和:
D= \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i} & \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}& \cdots &a_{nn}\\ \end{vmatrix} + \\ \qquad \qquad \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}^\prime& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i}^\prime& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}^\prime& \cdots &a_{nn}\\ \end{vmatrix}.
性质6 把行列式的某一列(行)的各元素乘以同一数然后加到另一列(行)对应的元素上去,行列式不变。

例如以数k乘第j列加到第i列上(记作c_i + kc_j),有
\begin{vmatrix} a_{11} & \cdots& a_{1i} & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& a_{2i} & \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& a_{ni} & \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} \\ \overset{c_i + kc_j}{=} \begin{vmatrix} a_{11} & \cdots& (a_{1i} + ka_{1j}) & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& (a_{2i} + ka_{2j})& \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& (a_{ni} + ka_{nj})& \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} (i \neq j)
(以数k乘第j行加到第i行上,记作r_i + kr_j)

行列式按行(列)展开

一般来说,低阶行列式的计算比高阶行列式的计算要简便,于是,我们自然地考虑用低阶行列式来表示高阶行列式的问题。为此,先引入余子式和代数余子式的概念。

n阶行列式中,把(i,j)a_{ij}所在的第i行和第j列划去后,留下来的n-1阶行列式叫作(i,j)a_{ij}的余子式,记作M_{ij};记
A_{ij} = (-1)^{i+j}M_{ij},
A_{ij}叫做(i,j)a_{ij}的代数余子式。

例如四阶行列式
D = \begin{vmatrix} a_{11} & a_{12} & a_{13} & a_{14}\\ a_{21} & a_{22} & a_{23} & a_{24}\\ a_{31} & a_{32} & a_{33} & a_{34}\\ a_{41} & a_{42} & a_{43} & a_{44}\\ \end{vmatrix}
(3,2)a_{32}的余子式和代数余子式分别为
M_{32} = \begin{vmatrix} a_{11} & a_{13} & a_{14}\\ a_{21} & a_{23} & a_{24}\\ a_{41} & a_{43} & a_{44}\\ \end{vmatrix}, \\ A_{32} = (-1)^{3+2} M_{32} = -M_{32}.
引理 一个n阶行列式,如果其中第i行所有元素除(i,j)a_{ij}外都为零,那么这行列式等于a_{ij}与它的代数余子式的乘积,即
D = a_{ij}A_{ij}.
定理3 行列式等于它的任一行(列)的各元素与其对应的代数余子式乘积之和,即
D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n),\\ D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n)

D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots\\ a_{i1} + 0 + \cdots + 0& 0 + a_{i2} + \cdots + 0 &\cdots & 0 + \cdots +0 + a_{in}\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix} \\ = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ a_{i1} & 0 &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & a_{i2} &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \cdots + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & 0 &\cdots & a_{in} \\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix},
根据引理,即得
D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n)
类似地,若按列证明,可得
D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n).
这个定理叫做行列式按行(列)展开法则。利用这一法则并结合行列式的性质,可以简化行列式的计算。

推论 行列式的某一行(列)的元素与另一行(列)的对应元素的代数余子式乘积之和等于零。即
a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j,\\ a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j.
把行列式D=det(a_{ij})按第j行展开,有
a_{j1}A_{j1} + a_{j2}A_{j2} + \cdots+ a_{jn}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}\\ \vdots & & \vdots \\ a_{j1} & \cdots & a_{jn}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix},
在上式中把a_{jk}换成a_{ik}(k=1,\cdots,n),可得
a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in} (i\text{行})\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}(j\text{行})\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix}
i\neq j时,上式右端行列式中有两行对应元素相同,故行列式为零,即得
a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j.
上述证法如按列进行,可得
a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j.

克拉默法则

又译为克莱姆法则。

含有n个未知数x_1,x_2,\cdots,x_nn个线性方程的方程组
\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= b_2, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= b_n, \\ \end{cases} \tag{8}
与二、三元线性方程组类似,它的解可以用n阶行列式表示,即有

克拉默法则 如果线性方程组(8)的系数行列式不等于零,即
D =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix} \neq 0,
那么,方程组(11)有唯一解
x_1 = \frac{D_1}{D}, \quad x_2 = \frac{D_2}{D}, \quad x_n = \frac{D_n}{D}, \tag{9}
其中D_j(j=1,2,\cdots,n)是把系数行列式D中第j列的元素用方程组右端的常数项代替后得到的n阶行列式,即
D_j =\begin{vmatrix} a_{11} &\cdots &a_{1,j-1}& b_1 & a_{1,j+1}&\cdots & a_{1n}\\ \vdots & &\vdots& \vdots & \vdots& & \vdots\\ a_{n1} &\cdots &a_{n,j-1}& b_n & a_{n,j+1}&\cdots & a_{nn} \end{vmatrix}.
定理4 如果线性方程组(8)的系数行列式D \neq 0,则(8)一定有解,且解是唯一的。

该定理的逆否定理为
定理4' 如果线性方程组(8)无解或有两个不同的解,则它的系数行列式比为零。

线性方程组(8)右端的常数项b_1,b_2,\cdots,b_n全为零时,线性方程组(8)叫做 齐次线性方程组。

对于齐次线性方程组
\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= 0, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= 0, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= 0, \\ \end{cases} \tag{10}
x_1=x_2=\cdots = x_n =0一定是它的解,这个解叫做齐次线性方程组的零解。

如果一组不全为零的数是(10)的解,则它叫做齐次线性方程组(10)的非零解。

定理5 如果齐次线性方程组(10)的系数行列式D \neq 0,则齐次线性方程组(10)没有非零解。

定理5' 如果齐次线性方程组(10)有非零解,则它的系数行列式必为零。

矩阵

矩阵是一个按照长方阵列排列的复数或实数集合。
m × n个数组成的一个mn列的矩形表格。如图所示:

A = \left[ \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{matrix} \right]

称为mn列矩阵,简称m \times n矩阵。

这个m \times n个数称为矩阵A的元素,简称为元,数a_{ij}位于矩阵A的第i行第j列,称为矩阵A(i,j)元。

以数a_{ij}(i,j)元的矩阵可简记作(a_{ij})(a_{ij})_{m \times n}m \times n矩阵A也记作A_{m \times n}

行数与列数都等于n的矩阵称为n阶矩阵或n阶方阵。

元素都是零的矩阵称为零矩阵,记作O

n个变量x_1,x_2,\cdots,x_nm个变量y_1,y_2,\cdots,y_m之间的关系式
\begin{cases} y_1= a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n, \\ y_2= a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n, \\ \cdots \\ y_m= a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n \\ \end{cases} \tag{2}
表示从一个变量x_1,x_2,\cdots,x_n与到变量y_1,y_2,\cdots,y_m的线性变换,其中a_{ij}为常数。线性变换(2)的系数a_{ij}构成矩阵A = (a_{ij})_{m \times n},称为系数矩阵。

矩阵的基本运算

两个矩阵的行数和列数分别相等,称它们为同型矩阵

加法

矩阵的加法只能在两个同型矩阵之间进行,两个矩阵相加时,对应元素进行相加。

如:

\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 7 \end{matrix} \right] + \left[ \begin{matrix} 0 & 0 & 2\\ 2 & 1 & 3 \end{matrix} \right] = \left[ \begin{matrix} 1 & 2 & 5\\ 6 & 6 & 10 \end{matrix} \right]

数乘

\lambda与矩阵A的乘积记作\lambda AA\lambda,规定为

\lambda A = A\lambda = \left[ \begin{matrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1n}\\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \lambda a_{m1} & \lambda a_{m2} & \cdots & \lambda a_{mn} \end{matrix} \right]

乘法

必须满足矩阵A的列数与矩阵B的行数相等,或者矩阵A的行数与矩阵B的列数相等。

C=AB,矩阵C的第i行第j列的元素等于矩阵A的第i行的所有元素与矩阵B的第j列的对应元素的乘积之和,即:
C_{ij} = \sum_{k=1}^na_{ik}b_{kj}
如:

\left[ \begin{matrix} 1 & 2 & 3 \end{matrix} \right] _{1×3} \left[ \begin{matrix} 4 \\ 5 \\6 \end{matrix} \right]_{3×1} = 1×4 + 2×5 + 3×6 =32

\left[ \begin{matrix} 1 \\ 2 \\3 \end{matrix} \right]_{3×1} \left[ \begin{matrix} 4 & 5 & 6 \end{matrix} \right] _{1×3} = \left[ \begin{matrix} 4 & 5 & 6\\ 8 & 10 & 12\\12 & 15 & 18 \end{matrix} \right]_{3×3}

矩阵的乘法不满足交换律,但仍然满足结合律和分配律:

  1. (AB)C = A(BC)

  2. \lambda (AB) = (\lambda A)B = A(\lambda B) \quad (其中\lambda为实数)

  3. A(B+C) = AB + AC,\quad (B+C)A = BA +CA

转置

矩阵A的转置矩阵,记作A^T,是将A的行列互换后所得矩阵,如果A是一个m ×n阶矩阵,A^T是一个n×m阶矩阵。

A = \left[ \begin{matrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{matrix} \right] A^T = \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{matrix} \right]

矩阵的转置的性质

  1. (A^T)^T = A
  2. (A+B)^T = A^T +B^T
  3. (\lambda A)^T=\lambda A^T
  4. (AB)^T = B^TA^T

对称矩阵

定义 一个n \times n的矩阵A,若满足A^T =A,则称A对称矩阵(symmetric matrix),简称对称阵。其特点为:它的元素以对角线为对称轴对应相等。

设列矩阵X=(x_1,x_2,\cdots,x_n)^T满足X^TX=1En阶单位阵,H = E - 2XX^T,证明H是对称阵,且HH^T=E

注意:X^TX = x_1^2 + x_2^2 + \cdots + x_n^2是一阶方阵,也就是一个数,而XX^Tn阶方阵。


\begin{aligned} H^T &= (E - 2XX^T)^T \\ &=E^T -2(XX^T)^T \\ &= E - 2XX^T = H \end{aligned}
所以H是对称阵。
\begin{aligned} HH^T &= H^2 = (E -2XX^T)^2 \\ &= E - 4XX^T + 4(XX^T)(XX^T) \\ &= E - 4XX^T + 4X(X^TX)X^T \\ &= E - 4XX^T + 4XX^T = E \end{aligned}

单位矩阵

如同数1位实数乘法中的单位元一样,也存在一个特殊矩阵E是矩阵乘法中的单位元,即
EA = AE = A
对任意n \times n的矩阵A都成立。

定义 n \times n的单位矩阵为矩阵E = (\delta_{ij}),其中
\delta_{ij} = \left\{ \begin{array}{lr} 1 & 当 \,\, i =j\\ 0 & 当 \,\, i \neq j \end{array} \right.

即主对角元素均为1,其他元素均为0n \times n矩阵。

一般地,若B为任一m \times n矩阵,且C为任一n \times r矩阵,则
BE = B \,\,\,\, \text{且} \,\,\,\, EC = C

n \times n单位矩阵E的列向量为用于定义n维欧几里得坐标空间的标准向量。E的第j列向量的标准记号为e_j。因此,n \times n单位矩阵可写为
E = (e_1,e_2,\cdots,e_n)

矩阵的迹

n阶方阵A的迹(trace)记作tr(A),是对角元素之和:
tr(A) = a_{11} + a_{22} + \cdots + a_{nn} = \sum_{i=1}^n a_{ii}

性质::

  1. 迹是所有特征值的和
  2. tr(AB)=tr(BA)
  3. 若矩阵A与矩阵B相似,则tr(A)=tr(B)

共轭矩阵

首先回顾下复数的概念,复数是实数的延伸,它使任意多项式方程都有跟。复数当中有个虚数单位i,它是-1的一个平方根,即i^2=-1

任一复数都可以表达为a+bi,其中ab皆为实数,分别称为复数的实部和虚部。

复数z = a+bi的模为|z| = \sqrt{a^2 +b^2}

z = a+bi的共轭复数定义为z = a-bi,即两个实部相等,虚部互为相反数。记作\overline{z}。有

  • \overline{z+w} = \overline{z} + \overline{w}
  • \overline{zw}=\overline{z}\cdot \overline{w}
  • \overline{\left( \frac{z}{w} \right)}=\frac{\overline{z}}{\overline{w}}
  • \overline{\overline{z}}=z
  • \overline{z} =z \quad 当且仅当z是实数
  • |z|^2 = z \overline{z}

当虚部不为零时,共轭复数就是实部相等,虚部相反;

如果虚部为零,其共轭复数就是自身。即实数的共轭复数就是自身。

A=(a_{ij})为复矩阵时,用\overline{a}_{ij}表示a_{ij}的共轭复数,记
\overline{A} = (\overline{a}_{ij}),
\overline{A}称为A的共轭矩阵。

共轭矩阵满足下述运算规律(A,B为复矩阵,\lambda为复数):

  1. \overline{A+B}=\overline{A} + \overline{B}
  2. \overline{\lambda A} = \overline{\lambda} \overline{A}
  3. \overline{AB}=\overline{A}\overline{B}

埃尔米特矩阵

A的共轭矩阵\overline{A}的转置记为A^H

定义 若一个矩阵A满足A =A^H,则称它为埃尔米特矩阵(Hermitian)。

矩阵的逆

方阵的行列式

定义6n阶方阵A的元素所构成的行列式,称为方阵A的行列式,记作|A|det A

A确定|A|的这个运算满足下述运算规律(设A,Bn阶方阵,\lambda为数):

  1. |A^T|=|A| (行列式性质1)
  2. |\lambda A| = \lambda^n |A|
  3. |AB| = |A||B|

行列式|A|的各个元素的代数余子式A_{ij}所构成的如下的矩阵(注意是转置排法)
A^* =\begin{pmatrix} A_{11} &A_{21} & \cdots & A_{n1}\\ A_{12} &A_{22} & \cdots & A_{n2}\\ \vdots &\vdots && \vdots \\ A_{1n} &A_{2n} & \cdots & A_{nn}\\ \end{pmatrix} ,
称为矩阵A的伴随矩阵,简称伴随阵。

试证
AA^* = A^*A = |A|E

AA^* =\begin{pmatrix} a_{11} &a_{12} & \cdots & a_{1n}\\ a_{21} &a_{22} & \cdots & a_{2n}\\ \vdots &\vdots && \vdots \\ a_{n1} &a_{n2} & \cdots & a_{nn}\\ \end{pmatrix} \begin{pmatrix} A_{11} &A_{21} & \cdots & A_{n1}\\ A_{12} &A_{22} & \cdots & A_{n2}\\ \vdots &\vdots && \vdots \\ A_{1n} &A_{2n} & \cdots & A_{nn}\\ \end{pmatrix} = \begin{pmatrix} |A| & & & \\ &|A| & & \\ & &\ddots& \\ & & & |A|\\ \end{pmatrix} = |A| E

逆矩阵

An阶方阵(n×n),若存在n阶方阵B使得:AB=BA=E,则称A是可逆的(或==非奇异的==)且矩阵B是矩阵A的逆矩阵,记为A^{-1} = B
矩阵B称为A的逆矩阵,简称逆阵。

BC均为A的逆矩阵,则
B = BE= B(AC) = (BA)C = EC = C
因此一个矩阵最多有一个逆矩阵。

定理1 若矩阵A可逆,则|A| \neq 0

A可逆,即有A^{-1},使AA^{-1}=E。故|A|\cdot |A^{-1}| = |E| =1,所以|A| \neq 0

定理2|A| \neq 0,则矩阵A可逆,且
A^{-1} = \frac{1}{|A|}A^* \tag{1}
其中A^*为矩阵A的伴随阵。

我们已知
AA^* = A^*A = |A|E
因为|A| \neq 0,(等式两边同时乘以\frac{1}{|A|})故有
A\frac{1}{|A|} A^* = \frac{1}{|A|}A^*A =E,
所以,按逆矩阵的定义,即知A可逆,且
A^{-1}= \frac{1}{|A|}A^*.

|A|=0时,A称为奇异矩阵,否则称非奇异矩阵。由上面两定理可知:A是可逆矩阵的充分必要条件是|A| \neq 0,即可逆矩阵就是非奇异矩阵。

由定理2,可得下述推论。

推论AB=E(或BA=E),则B=A^{-1}

|A|\cdot |B| =|E| = 1,故|A| \neq 0,因而A^{-1}存在,于是
B = EB = (A^{-1}A)B = A^{-1}(AB) = A^{-1}E = A^{-1}。
方阵的逆阵满足下述运算规律:

  1. A可逆,则A^{-1}亦可逆,且(A^{-1})^{-1}=A

  2. A可逆,数\lambda \neq 0,则\lambda A可逆,且(\lambda A)^{-1}= \frac{1}{\lambda}A^{-1}

  3. A,B为同阶矩阵且均可逆,则AB亦可逆,且
    (AB)^{-1} = B^{-1}A^{-1}
    (AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1}=AA^{-1} =E ,即有(AB)^{-1}=B^{-1}A^{-1}

  4. A可逆,则A^T亦可逆,且(A^T)^{-1}= (A^{-1})^T

    A^T(A^{-1})^T=(A^{-1}A)^T=E^T=E

矩阵的秩

矩阵的初等变换

为了引进矩阵的初等变换,先来分析用消元法解线性方程组的例子。

引例 求解线性方程组

image-20210713135745673
image-20210713135801187

在上述消元过程中,始终把方程组看作一个整体。其中用到三种变换,即:交换方程次序(如(B_1)\text{中}①\leftrightarrow ②);以不等于0的数乘某个方程(如(B_3)中②\times \frac{1}{2});一个方程加上另一个方程的k倍(如(B_2)中③-2①)。

由于这三种变换都是可逆的,因此变换前的方程组与变换后的方程组是同解的。

在上述变换过程中,实际上只对方程组的系数和常数进行运算,未知数并未参与运算。因此,若记方程组(1)的增广矩阵为
B =(A,b) =\begin{pmatrix} 2 &-1 & -1 & 1 &2\\ 1 &1 & -2 & 1 &4\\ 4 &-6 &2& -2 &4 \\ 3 &6 & -9 & 7 & 9\\ \end{pmatrix},
那么上述对方程组的变换完全可以转换为对矩阵B的变换。把方程组的上述三种同解变换移植到矩阵上,就得到句子的三种初等变换。

定义1 下面三种变换称为矩阵的初等行变换:

  1. 对调两行(对调i,j两行,记作r_i \leftrightarrow r_j)
  2. 以数k \neq0乘某一行中的所有元素(第i行乘k,记作r_i \times k)
  3. 把某一行所有元素的k倍加到另一行对应的元素上去(第j行的k倍加到第i行上,记作r_i+kr_j)

把定义中的“行”换成“列”,即得矩阵的初等列变换的定义。

矩阵的初等行变换与初等列变换,统称为初等变换。

显然,三种初等变换都是可逆的(操作),且其逆变换是同一类型的初等变换;

  • 变换r_i \leftrightarrow r_j的逆变换就是其本身;
  • 变换r_i \times k的逆变换为r_i \times \left(\frac{1}{k}\right)(或记作r_i \div k)
  • 变换r_i + kr_j的逆变换为r_i + (-k)r_j(或记作r_i - kr_j)

如果矩阵A经过有限次初等行变换变成矩阵B,就称矩阵AB行等价,记作A\overset{r}{\sim}B

如果矩阵A经过有限次初等列变换变成矩阵B,就称矩阵AB列等价,记作A\overset{c}{\sim}B

如果矩阵A经过有限次初等变换变成矩阵B,就称为矩阵AB等价,记作A \sim B

矩阵之间的等价关系具有下列性质:

  1. 反身性 A \sim A
  2. 对称性 若A \sim B,则B \sim A
  3. 传递性 若A \sim B, B \sim C,则A \sim C

下面用矩阵的初等行变换来解方程组(1),其过程可与方程组(1)的消元过程一一对照。

image-20210713143030393
image-20210713143040851
image-20210713143056557

矩阵B_4B_5都称为行阶梯形矩阵,其特点是:

可画出一条阶梯线,线的下方全为0;

每个台阶只有一行,台阶数即使非零行的行数;

阶梯线的竖线后面的一个元素为非零元,也就是非零行的第一个非零元;

行阶梯形矩阵B_5还称为行最简形矩阵,其特点是:非零行的第一个非零元为1,且这些非零元所在的列的其他元素都为0

对于任何矩阵A_{m \times n},总可经过有限次初等行变换把它变为行阶梯形矩阵和行最简形矩阵。

对行最简形矩阵再施以初等列变换,可变成一种形状更简单的矩阵,称为标准形,例如:

image-20210713143608931

矩阵F称为矩阵B的标准形,其特点是:F的左上角是一个单位矩阵,其余元素全为0

对于m \times n矩阵A,总可经过初等变换(行变换或列变换)把它化为标准形
F = \begin{pmatrix} E_r & O \\ O & O \\ \end{pmatrix} _{m \times n}

此标准形由m,n,r三个数完全确定,其中r就是行阶梯形矩阵中非零行的行数。

定理1ABm \times n矩阵,那么:

  1. A \overset{r}{\sim} B的充要条件是存在m阶可逆矩阵P;使PA=B;
  2. A \overset{c}{\sim} B的充要条件是存在n阶可逆矩阵Q;使AQ=B;
  3. A \sim B的充要条件是存在m阶可逆矩阵Pn阶可逆矩阵Q,使PAQ=B

为了证明这个定理,我们引进初等矩阵的知识。

定义2 由单位阵E经过一次初等变换得到的矩阵称为初等矩阵。

三种初等变换对应有三种初等矩阵。

(1) 把单位阵中第i,j两行对调(或两列对调),得初等矩阵

image-20210713151049997

m阶初等矩阵E_m(i,j)左乘矩阵A=(a_{ij})_{m \times n},得

image-20210713151314992

其结果相当于对矩阵A施行第一种初等行变换。

|E(i,j)| = -1 \neq 0,所以是可逆的。因为|E|=1,对E交换两行或两列,行列式变号。

(2)以数k \neq 0乘单位阵的第i行(或第i列),得初等矩阵

image-20210713151532486

可以验知:以E_m(i(k))左乘矩阵A,其结果相当于以数kA的第i(r_i \times k)

行列式某行乘以某个数k,等于用k乘以此行列式,所以行列式不为零,可逆。

或因此矩阵是对角矩阵,行列式为1 \times 1 \cdots \times k \cdots \times 1 = k

(3) 以kE的第j行加到第i行上或以kE的第i列加到第j列上,得初等矩阵

image-20210713151729864

可以验知:以E_m(ij(k))左乘矩阵A,其结果相当于把A的第j行乘k加到第i(r_i+kr_j)

得到的矩阵的行列式还是为1 \neq 0,所以可逆。

归纳上面的讨论,可得

性质1A是一个m \times n矩阵,对A施行一次初等行变换,相当于在A的左边乘以相应的m阶初等矩阵;对A施行一次初等列变换,相当于在A的右边乘以相应的n阶初等矩阵。

性质2 方阵A可逆的充要条件是存在有限个初等矩阵P_1,P_2,\cdots,P_l,使A = P_1P_2\cdots P_l

先证充分性。设A = P_1P_2\cdots P_l,因初等矩阵可逆,有限个可逆矩阵的乘积仍可逆,故A可逆。

再证必要性 设n阶方阵A可逆,且A的标准形矩阵为F,由于F \sim A,知F经过有限次初等变换可化为A,即有初等矩阵P_1,P_2,\cdots,P_l,使
A = P_1 \cdots P_s FP_{s+1}\cdots P_l,
因为A可逆,所以|A| = |P_1|\cdot |P_2| \cdot \cdots |P_l| \neq 0,所以|P_1| ,|P_2|,\cdots,|P_l|都不等于零。

所以P_1,\cdots,P_l也都可逆,故标准形矩阵F可逆。假设
F = \begin{pmatrix} E_r & O \\ O & O \\ \end{pmatrix} _{n \times n}
中的r < n,则|F| =0,与F可逆矛盾,因此必有r=n,即F=E,从而
A=P_1P_2\cdots P_l.

下面应用初等矩阵的知识来证明定理1。

定理1的证明

  1. 依据A\overset{r}{\sim}B的定义和初等矩阵的性质,有
    \begin{aligned} A\overset{r}{\sim}B &\Leftrightarrow A经过有限次初等行变换变成B \\ &\Leftrightarrow 存在有限个m阶初等矩阵P_1,P_2,\cdots,P_l,使P_l\cdots P_2P_1A=B\\ &\Leftrightarrow 存在m阶可逆矩阵P,使PA=B. \end{aligned}

类似可证明2. 3.

推论 方阵A可逆的充分必要条件是A\overset{r}{\sim}E

A可逆 \Leftrightarrow 存可逆阵P(即A的逆阵),使PA=E,所以A\overset{r}{\sim}E

定理1表明,如果A\overset{r}{\sim}B,即A经过一系列初等变换可以变为B,则有可逆矩阵P,使PA=B。那么,如何求出这个可逆矩阵P

由于
PA=B \Leftrightarrow \begin{cases} PA = B, \\ PE=P \end{cases} \Leftrightarrow P(A,E) = (B,P) \Leftrightarrow (A,E) \overset{r}{\sim} (B,P)
因此,如果对矩阵(A,E)作初等行变换,那么,当把A变为B时,E就变为P

于是就得到了求逆矩阵的一种新方法。

矩阵的秩

定义m \times n的矩阵A中,任取k行与k列,位于这些行列交叉处的k^2个元素,不改变它们在A中所处的位置次序而得的k阶行列式,称为矩阵Ak阶子式。

m \times n矩阵Ak阶子式共有C_m^k \cdot C_n^k个。

定义 设在矩阵A中有一个不等于0的r阶子式D,且所有r+1阶子式(如果存在的话)全等于0,那么D称为矩阵A的最高阶非零子式,数r称为矩阵A的秩,记作R(A)。并规定零矩阵的秩等于0。

比如,我们上面知道,一个m \times n矩阵A,它的标准形
\begin{pmatrix} E_r & O \\ O & O \\ \end{pmatrix} _{m \times n}
由数r完全确定,这个数就是A的行阶梯形中非零行的行数,也就是矩阵A的秩。

显然,若Am \times n矩阵,则0 \leq R(A) \leq \min\{m,n\}

由于行列式与其转置行列式相等,因此A^T的子式与A的子式对应相等,从而R(A^T) = R(A)

对于n阶矩阵A,由于An阶子式只有一个|A|,故当|A| \neq 0R(A)=n
|A| =0R(A) < n

可见可逆矩阵的秩等于矩阵的阶数,不可逆矩阵的秩小于矩阵的阶数。因此,可逆矩阵又称为满秩矩阵,不可逆矩阵(奇异矩阵)又称为降秩矩阵。

定理2A \sim B,则R(A) = R(B)
推论 若可逆矩阵P,Q使PAQ = B,则R(A) = R(B)

秩的性质

  1. 0 \leq R(A_{m \times n}) \leq \min |m,n|
  2. R(A^T) = R(A)
  3. A \sim B,则R(A) = R(B)
  4. PQ可逆,则R(PAQ) = R(A)
  5. \max \{R(A),R(B)\} \leq R(A,B) \leq R(A) + R(B)
    • 特别第,当B=b为非零列向量时,有
      R(A) \leq R(A,b) \leq R(A) +1
  6. R(A+B) \leq R(A) + R(B)
  7. R(AB) \leq \min \{R(A),R(B) \}
  8. A_{m \times n}B_{n \times l} = O,则R(A) + R(B) \leq n

线性方程组的解

设有n个未知数m个方程的线性方程组
\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= b_2, \\ \cdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n= b_m, \\ \end{cases} \tag{3}

(3)式可以写成以向量x为未知元的向量方程
Ax = b,

定理3 n元线性方程组Ax=b

  1. 无解的充分必要条件是R(A) < R(A,b) (即出现了0 = b的情况,其中b \neq 0)
  2. 有唯一解的充分必要条件是R(A) = R(A,b) = n
  3. 有无限多解的充分必要条件是R(A) = R(A,b) < n

这里的n是未知数的个数。

定理4 n元齐次线性方程组Ax =0有非零解的充分必要条件是R(A) < n
定理5 线性方程组Ax =b有解的充分必要条件是R(A) = R(A,b)

用克拉默法则来看的话,
如果A是方阵,Ax=0有非零解的条件是,|A| =0,即R(A) < n

我们知道
逆矩阵存在 \Leftrightarrow |A| \neq 0 \Leftrightarrow R(A) =n

正交性

标量积

两个R^n中的向量xy可以看成是n \times 1矩阵。构造矩阵乘积x^Ty。这个乘积为一个1\times 1矩阵,可看成是一个R^1中的向量,或一个实数(标量)。

乘积x^Ty称为xy的标量积(scalar product)或内积。

x^Ty = ||x||\,\, ||y|| \, cos \theta = \sum_{i=1}^n x_i y_i = \langle x,y \rangle
如果x^Ty=0,则称向量xy为正交的。

内积空间

一个向量空间V上的内积为V上的运算,它将V中的向量xy与一个实数\langle x,y \rangle关联,并满足下列条件:

  1. \langle x,y \rangle \geq 0,等号成立的充要条件是x=0
  2. V中所有的xy,有 \langle x,y \rangle = \langle y,x \rangle
  3. V中所有的x,y,z及所有的标量\alpha,\beta,有 \langle \alpha x + \beta y,z \rangle = \alpha \langle x,z \rangle + \beta \langle y,z \rangle

一个定义了内积的向量空间V称为内积空间。

正交集

定义v_1,v_2,\cdots,v_n为一内积空间V中的非零向量。若i \neq j时有\langle v_i, v_j \rangle = 0,则\{v_1,v_2,\cdots,v_n\}称为向量的==正交集==。

定理\langle v_i, v_j \rangle = 0,则\{v_1,v_2,\cdots,v_n\}为一内积空间V中非零向量的正交集,则v_1,v_2,\cdots,v_n是线性无关的。

规范正交

定义 ==规范正交==的向量集合是单位向量的正交集。

集合\{u_1,u_2,\cdots, u_n\}是规范正交集的充要条件为
\langle u_i, u_j \rangle = \delta_{ij}
其中
\delta_{ij} = \left\{ \begin{array}{lr} 1 & 当 \,\, i =j\\ 0 & 当 \,\, i \neq j \end{array} \right.

说的是集合中任意两个向量做内积结果为0

规范正交基

B=\{u_1,u_2,\cdots, u_k\}为一个内积空间V中的规范正交集,则B为子空间S=\text{Span}(u_1,u_2,\cdots, u_k)的一组基。我们称BS的一组==规范正交基==。

正交矩阵

定义 若一个n \times n矩阵Q的列向量构成R^n中的一组规范正交基,则称Q为==正交矩阵==。

定理 一个n \times n矩阵Q是正交矩阵的充要条件为Q^TQ=I
由定理可得,若Q为一正交矩阵,则Q可逆,且Q^{-1}=Q^T

性质Q为一个n \times n的正交矩阵,则:

  1. Q的列向量构成了R^n的一组规范正交基
  2. Q^TQ=I
  3. Q^T=Q^{-1}
  4. \langle Qx, Qy \rangle = \langle x, y \rangle
  5. ||Qx||_2 = ||x||_2

相似矩阵

向量的内积

定义1 设有n为向量

x = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}, \, y=\begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix}


[x,y] =x_1y_1 + x_2y_2 + \cdots x_ny_n,
[x,y]称为向量xy的内积(内积也叫点积,也可表示为\langle x,y \rangle)。

内积是两个向量之间的一种运算,其结果是一个实数,用矩阵记号表示,当xy都是列向量时,有
[x,y] = x^Ty = y^T x

内积具有下列性质(其中x,y,zn维向量,\lambda为实数):

  1. [x,y] = [y,x]
  2. [\lambda x,y] = \lambda[x,y]
  3. [x+y,z] = [x,z] + [y,z]
  4. x=0时,[x,x]=0;当x \neq 0时,[x,x] >0

可以得到柯西不等式
[x,y]^2 \leq [x,x][y,y]

定义2
||x|| =\sqrt{[x,]} = \sqrt{x_1^2 + x_2^2 + \cdots + x_n^2}
||x||称为n维向量x的长度(或范数)。

||x|| =1时,称x为单位向量。

向量的长度具有以下性质:

  1. 非负性 当x \neq 0时,||x|| >0;当x =0时,||x|| =0
  2. 齐次性 ||\lambda x|| = |\lambda| ||x||
  3. 三角不等式 ||x+y|| \leq ||x|| +||y||

[x,y]=0时,称向量xy正交。显然,若x=0,则x与任何向量都正交。

定理1n维向量a_1,a_2,\cdots, a_r是一组两两正交的非零向量,则a_1,a_2,\cdots, a_r线性无关。

若向量a_1,a_2,a_3线性无关,则它们互相不能用其他向量线性表示。

设有\lambda_1,\lambda_2,\cdots,\lambda_r使
\lambda_1a_1 + \lambda_1a_2 + \cdots + \lambda_ra_r = 0,
我们要证明\lambda_1 =\lambda_2 = \cdots \lambda_r = 0。以a_1^T左乘上式两端,当i \geq 2时,a_1^T a_i =0,要使上式等于零,所以
\lambda_1 a_1^T a_1 = 0
因为a_1 \neq 0,所以a_1^T a_1 \neq 0,从而只能\lambda_1=0,类似可以证明\lambda_2 =0,\cdots, \lambda_r =0

于是向量组a_1,a_2,\cdots, a_r线性无关。

定义3n维向量e_1,e_2,\cdots,e_r是向量空间V的一个基,如果e_1,e_2,\cdots,e_r两两正交,且都是单位向量,则称e_1,e_2,\cdots,e_rV的一个规范正交基。

e_1,e_2,\cdots,e_rV的一个规范正交基,那么V中任意向量a都能由e_1,e_2,\cdots,e_r线性表示,设表示为

a = \lambda_1 e_1 + \lambda_ 2e_2 + \cdots + \lambda_r e_r

定义4 如果n阶矩阵A满足
A^TA = E \qquad (\text{即}A^{-1}=A^T)
那么称A为正交矩阵,简称正交阵。

A^TA=E \Rightarrow |A^T||A|=1 \Rightarrow A\text{可逆} \Rightarrow A^{-1}=A^T

上式用A的列向量表示,即是
\begin{pmatrix} a_1^T \\ a_2^T \\ \vdots \\ a_n^T \end{pmatrix} (a_1,a_2,\cdots, a_n) =E,
因为A^TA=EAA^T=E等价,所以上述结论对A的行向量亦成立。

由此可见,n阶正交阵An个列(行)向量构成向量空间R^n的一个规范正交基。

方阵的特征值与特征向量

定义6An阶矩阵,如果数\lambdan维非零列向量x使关系式
Ax =\lambda x \tag{1}
成立,那么,这样的数\lambda称为矩阵A的特征值,非零向量x称为A的对应于特征值\lambda的特征向量。

(1)式也可以写成
(A - \lambda E)x = 0
这是n个未知数n个方程的齐次线性方程组,它有非零解的充分必要条件是系数行列式
|A - \lambda E| = 0,

\begin{vmatrix} a_{11} - \lambda & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} -\lambda & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} - \lambda\\ \end{vmatrix}= 0

R(A) = R(A,b) < n 无穷解

上式是以\lambda为未知数的一元n次方程,称为矩阵A的特征方程。其左端|A - \lambda E|\lambdan次多项式,记作f(\lambda),称为矩阵A的特征多项式。

n阶矩阵A = (a_{ij})的特征值为\lambda_1,\lambda_2,\cdots, \lambda_n,有以下性质:

  1. \lambda_1 + \lambda_2 +\cdots + \lambda_n = a_{11} + a_{22} + \cdots +a_{nn}
  2. \lambda_1\lambda_2 \cdots \lambda_n =|A|

\lambda = \lambda_i为矩阵A的一个特征值,则由方程
(A - \lambda_iE)x = 0
可求得非零解x = p_i,那么p_i便是A的对应于特征值\lambda_i的特征向量。

\lambda是方阵A的特征值,证明

  1. \lambda^2A^2的特征值
  2. A可逆时,\frac{1}{\lambda}A^{-1}的特征值。

\lambdaA的特征值,故有x \neq 0使Ax= \lambda x。于是
(1) A^2 x = A(Ax) = A(\lambda x) = \lambda(A x) = \lambda^2 x,
所以\lambda^2A^2的特征值。
依此类推,不难证明:若\lambdaA的特征值,则\lambda^kA^k的特征值。
(2) 当A可逆时,由A x = \lambda x,有x = \lambda A^{-1} x,因x \neq 0,知\lambda \neq 0,故
A^{-1} x = \frac{1}{\lambda} x,
所以\frac{1}{\lambda}A^{-1}的特征值。

定理2\lambda_1,\lambda_2,\cdots, \lambda_m是方阵Am个特征值,p_1,p_2,\cdots, p_m依次是与之对应的特征向量,如果\lambda_1,\lambda_2,\cdots, \lambda_m各不相等,则p_1,p_2,\cdots, p_m线性无关。

相似矩阵

定义7A,B都是n阶矩阵,若有可逆矩阵P,使
P^{-1}AP = B
则称BA的相似矩阵,或说矩阵AB相似。对A进行运算P^{-1}A称为对A进行相似变换。可逆矩阵P称为把A变成B的相似变换矩阵。

定理3n阶矩阵AB相似,则AB的特征多项式相同,从而AB的特征值亦相同。
AB相似,即有可逆矩阵P,使P^{-1}AP=B,故
\begin{aligned} |B -\lambda E| &= |P^{-1}AP - \lambda P^{-1}P| \\ &=|P^{-1}(A-\lambda E)P| \\ &= |P^{-1}| \cdot |A - \lambda E|\cdot |P| \\ &= |A - \lambda E| \end{aligned}

推论n阶矩阵A与对角阵
\Lambda= \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & & \lambda_n\\ \end{bmatrix}
相似,则\lambda_1,\lambda_2,\cdots,\lambda_n即是An个特征值。

下面我们要讨论的主要问题是:对n阶矩阵A,寻求相似变换矩阵P,使P^{-1}AP = \Lambda为对角阵,这就称为把矩阵A对角化。

假设已经找到可逆矩阵P,使P^{-1}AP=\Lambda为对角阵,我们来讨论P应满足什么关系。

P用其列向量表示为
P=(p_1,p_2,\cdots,p_n),
P^{-1}AP=\Lambda,得AP=P\Lambda,即
\begin{aligned} A(p_1,p_2,\cdots,p_n) &= (p_1,p_2,\cdots,p_n)\begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & & \lambda_n\\ \end{bmatrix} \\ &= (\lambda_1p_1,\lambda_2p_2,\cdots, \lambda_np_n), \end{aligned}
于是有
Ap_i = \lambda_ip_i\qquad(i=1,2,\cdots,n).
可见\lambda_iA的特征值,而P的列向量p_i就是A的对应于特征值\lambda_i的特征向量。

定理4 n阶矩阵A与对角阵相似(即A能对角化)的充分必要条件是An个线性无关的特征向量。

联系定理2,得

对称矩阵的对角化

定理5 对称阵的特征值为实数

设复数\lambda为对称阵A的特征值,复向量x为对应的特征向量,即Ax=\lambda x,x \neq 0

\overline{\lambda}表示\lambda的共轭复数,\overline{x}表示x的共轭复向量,而A为实矩阵,有A = \overline{A},故

A\overline{x} = \overline{A}\overline{x} = (\overline{Ax}) = (\overline{\lambda x}) = \overline{\lambda}\overline{x}。于是有
\overline{x}^TAx = \overline{x}^T(Ax)=\overline{x}^T \lambda x=\lambda \overline{x}^T x,


\overline{x}^TAx = (\overline{x}^TA^T)x=(A\overline{x})^Tx=(\overline{\lambda}\overline{x})^Tx=\overline{\lambda}\overline{x}^Tx,
两式相减,得
(\lambda - \overline{\lambda})\overline{x}^Tx = 0,
x \neq 0,所以
\overline{x}^Tx=\sum_{i=1}\overline{x}_i x_i = \sum_{i=1} |x_i|^2 \neq 0,
\lambda -\overline{\lambda} =0,即\lambda = \overline{\lambda},说明\lambda是实数。

定理6\lambda_1,\lambda_2是对称阵A的两个特征值,p_1,p_2是对应的特征向量。若\lambda_1 \neq \lambda_2,则p_1,p_2正交。

\lambda_1p_1 = Ap_1,\lambda_2p_2 = Ap_2,\lambda_1 \neq \lambda_2

A对称,故\lambda_1p_1^T=(\lambda_1p_1)^T=(Ap_1)^T=p_1^TA^T=p_1^TA,于是
\lambda_1p_1^Tp_2 = p_1^TAp_2=p_1^T(\lambda_2p_2)=\lambda_2p_1^Tp_2,

(\lambda_1 -\lambda_2)p_1^Tp_2 = 0.
因为\lambda_1 \neq \lambda_2,故p_1^Tp_2=0,即p_1,p_2正交。

定理7An阶对称阵,则必有正交阵P,使P^{-1}AP=P^TAP=\Lambda,其中\Lambda是以An个特征值为对角元的对角阵。

推论An阶对称阵,\lambdaA的特征方程的k重根,则矩阵A -\lambda E的秩R(A -\lambda E)= n -k,从而对应特征值\lambda恰有k个线性无关的特征向量。

二次型及其标准形

image-20210714170331942
image-20210714171542756

使二次型只含平方项,也就是用(7)带入(5),能使
f = k_1y^2_1 + k_2y_2^2 + \cdots + k_ny_n^2,
这种只含平方项的二次型,称为二次型的标形型(或法式)。

如果标准形的系数k_1,k_2,\cdots,k_n只在1,-1,0三个数中取值,也就是用(7)代入(5),能使
f = y_1^2 + \cdots + y_p^2 - y^2_{p+1} - \cdots - y^2_r,
则称上式为二次型的规范形。

image-20210714171630813

则二次型可记作
f = x^TAx, \tag{8}
其中A为对称阵。

image-20210714171827882
image-20210714174147905

如果f(x) \geq 0,则是半正定。

更新记录

  • 2021-05-25 补充单位矩阵、奇异矩阵
  • 2021-05-26 新增标准基、正交性
  • 2021-05-27 新增特征值
  • 2021-06-05 新增实对称矩阵定理
  • 2021-06-19 新值行列式

参考

  1. 《线性代数》 利昂著
  2. 《线性代数》 同济大学第五版
  3. 维基百科
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,175评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,674评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,151评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,597评论 1 269
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,505评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,969评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,455评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,118评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,227评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,213评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,214评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,928评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,512评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,616评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,848评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,228评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,772评论 2 339

推荐阅读更多精彩内容