MIT线性代数总结笔记——特征值与特征向量

特征值和特征向量的意义

假设给定矩阵A,作用在向量x上,结果就得到了向量Ax(此时矩阵A就像一个函数f(x)),其中,我们会得到Ax中的很多向量,在这些向量中,我们感兴趣的是那些线性变换前后方向保持一致的向量,这些向量是特殊的。因为对于多数向量而言,线性变换后的Axx是在方向上会发生改变。对于那些特定的向量能使得Ax平行于x的,我们称之为特征向量(Eigenvectors)

那么平行意味着什么?我们可以用方程来表达这样的关系,即Ax=\lambda xx表示特征向量,\lambda作为向量x的系数,可以为负数表示平行且方向相反,也可以取0,甚至可以为复数(实数构成的矩阵可能会出现虚数特征值)。这里的\lambda称为特征值(Eigenvalues)

我们现在并不知道该如何求矩阵的特征向量和特征值,但我们可以先来考虑以下几个问题:

(1)当特征值为0时,意味着什么?根据我们前文所学的知识,当特征值为0时,有Ax=\lambda x \Rightarrow Ax=0,即特征值为0的特征向量应该位于A的零空间中。也就是说,如果矩阵A是不可逆矩阵,那么它将会有一个特征值为\lambda = 0

(2)我们再来看投影矩阵P = A(A^TA)^{-1}A^T的特征值和特征向量。

  • 当向量b处于投影平面(A的列空间)中时,Pbb是同向的,此时b投影前后不变,即Pb=1·b。即在投影平面中的所有向量都是投影矩阵的特征向量,而它们的特征值均为1
  • 当向量b为投影平面的法向量时,此时b也就是误差向量e。我们知道误差向量e垂直于列空间C(A),因此我们可以得到Pe=0·e,即特征向量e的特征值为0。
  • 因此投影矩阵的特征值为1,0

(3)如何求二阶置换矩阵A=\left[\begin{matrix} 0 & 1 \\ 1 & 0\end{matrix}\right]的特征值和特征向量。观察矩阵我们会知道,经过置换矩阵处理过的向量,其元素会发生交换,那么就有经过矩阵交换元素前后不变的情况和方向相反的情况,分别为特征值为1的特征向量\left[\begin{matrix} 1 \\ 1\end{matrix}\right]和特征值为-1时的特征向量\left[\begin{matrix} 1 \\ -1 \end{matrix}\right]

对于一个n×n的矩阵,将会有n个特征值,特征值与该矩阵对角线上的元素的和相同,即\sum_{i=1}^n \lambda_i = \sum_{i=1}^n a_{ii}。我们把矩阵对角线上的元素称为矩阵的迹(Trace)。在上文二阶置换矩阵的例子中,如果我们求得了一个特征值1,我们可以直接利用迹来求出另一特征值\lambda_2 = 0+0-1=-1

特征值和特征向量的求解

我们的问题是如何找到特征值和特征向量,这不是一个Ax=b的求解问题,因此不能使用消元法,我们需要一个更巧妙的方法来求解它们。

观察等式Ax=\lambda x,这个等式难解是因为其中有两个未知量(\lambdax),我们的目标是将等式化成仅有一个未知量的方程,因此我们需要对其进行变形,\lambda可以看作是\lambda I,这样就有

Ax=\lambda x \Rightarrow Ax = \lambda Ix \Rightarrow (A-\lambda I)x = 0

如果对于不为零向量的x该等式成立,那么意味着矩阵(A-\lambda I)为奇异矩阵(否则向量x必为零向量或零矩阵)。那么我们知道奇异矩阵的判定方法是其行列式为零,即

|A-\lambda I| = 0

这样等式中就不含未知量x了,该方程仅含未知量\lambda,该方程称为特征方程特征值方程。我们可以通过特征方程来求解出\lambda,当然\lambda可能有多个不同的值,也可能有重复的值,重复的\lambda是难点所在。

得到\lambda后,我们可以继续求解向量x,此时使用消元法,我们已知(A-\lambda I)是个奇异矩阵,寻找其零空间,利用消元法找出主列,给自由变量赋值即可。下面我们以一个示例来具体阐述求解的步骤。

例 求A=\left[\begin{matrix} 3 & 1 \\ 1 & 3\end{matrix}\right]的特征值和特征向量

观察矩阵A,我们发现这是一个对称矩阵,对称矩阵意味着其特征值必为实数(这在后面的篇幅中会证明)。我们先来求(A-\lambda I)的行列式,有

det(A-\lambda I)= \begin{vmatrix} 3-\lambda & 1 \\ 1 & 3-\lambda\end{vmatrix} = (3-\lambda)^2 -1 = \lambda^2-6\lambda + 8=(\lambda-4)(\lambda -2)=0

求解过程中我们发现(A-\lambda I)的行列式最后化成了一元二次方程,我们可以轻松求解出\lambda_1 = 4, \lambda_2 = 2。在继续求解下去之前,对于二维的矩阵,我们可以观察到在一元二次方程展开后,一次项的系数其实就是矩阵A的迹的相反数(3+3=6),而常数项则为矩阵A的行列式(det(A) = 3×3-1 = 8),根据因式分解的特点,我们可以进一步得出,特征值之和就等于矩阵的迹,特征值之积等于矩阵的行列式,即

\sum_{i=1}^n \lambda_i = \sum_{i=1}^n a_{ii}, \quad \prod_{i=1}^n \lambda_i = det(A)

然后再来看特征向量,我们已经得到了两个特征值,现在只需要分别将两个特征值代入去求解特征向量,

  • \lambda = 4时,有A-4I = \left[\begin{matrix} 3-4 & 1 \\ 1 & 3-4\end{matrix}\right] = \left[\begin{matrix} -1 & 1 \\ 1 & -1\end{matrix}\right],这个矩阵是奇异的,代入到(A-\lambda I)x = 0,有\left[\begin{matrix} -1 & 1 \\ 1 & -1\end{matrix}\right]\left[\begin{matrix} x_1 \\ x_2\end{matrix}\right] = \left[\begin{matrix} 0 \\ 0\end{matrix}\right],得x_1=\left[\begin{matrix} 1 \\ 1\end{matrix}\right]

  • \lambda = 2时,有A-2I = \left[\begin{matrix} 3-2 & 1 \\ 1 & 3-2\end{matrix}\right] = \left[\begin{matrix} 1 & 1 \\ 1 & 1\end{matrix}\right],这个矩阵是奇异的,代入到(A-\lambda I)x = 0,有\left[\begin{matrix} 1 & 1 \\ 1 & 1\end{matrix}\right]\left[\begin{matrix} x_1 \\ x_2\end{matrix}\right] = \left[\begin{matrix} 0 \\ 0\end{matrix}\right],得x_2=\left[\begin{matrix} -1 \\ 1\end{matrix}\right]

至此我们完成了对矩阵A的特征值和特征向量的求解,并且我们还发现两特征向量满足正交关系。

观察A=\left[\begin{matrix} 3 & 1 \\ 1 & 3\end{matrix}\right]得到的特征向量,与第一节中的置换矩阵A=\left[\begin{matrix} 0 & 1 \\ 1 & 0\end{matrix}\right]刚好相同,它们的特征值不相同,前者为42,后者为1-1。但是我们发现,两个矩阵之间的关系可以看作\left[\begin{matrix} 3 & 1 \\ 1 & 3\end{matrix}\right] = \left[\begin{matrix} 0 & 1 \\ 1 & 0\end{matrix}\right]+3I,其特征值的关系为4=1+3,2=-1+3,那么两矩阵相加时,得到的矩阵的特征值之和是否等于两矩阵特征值之和?

我们设Ax=\lambda x,Bx=\alpha x,只需验证(A+B)x=(\lambda+\alpha)x是否成立。

B=3I时,在上述例子中我们知道,该等式是成立的,但是如果矩阵B为任意矩阵,则等式不一定成立。因为这两个式子中的特征向量x不一定相同,所以等式应该写成Ax=\lambda x,By=\alpha y,显然加和的等式无法成立。因此A+B的特征值并不一定等于A的特征值和B的特征值之和,仅当B为单位矩阵的倍数时成立。

复数特征值的情况

上文中还有个问题是,为什么实数构成的矩阵可能会出现虚数特征值?

例 旋转矩阵Q可以使得空间中的向量旋转90°Q=\left[\begin{matrix} cos90° & -sin90° \\ sin90° & cos90° \end{matrix}\right] = \left[\begin{matrix} 0 & -1 \\ 1 & 0 \end{matrix}\right],用Q表示是因为旋转矩阵是正交矩阵。

我们观察矩阵Q的迹和行列式发现

\begin{cases} \lambda_1+\lambda_2 = 0(矩阵的迹) \\ \lambda_1·\lambda_2=1(矩阵的行列式)\end{cases}

从几何角度上,可以想象,哪些向量发生90°旋转后还是它自身,显然对于实向量是不存在的。如果我们求解(Q-\lambda I)的行列式有

det(Q-\lambda I) = \left[\begin{matrix} -\lambda & -1 \\ 1 & -\lambda\end{matrix}\right] = \lambda^2+1=0

解得\lambda_1 = i, \lambda_2=-i。两个特征值均为复数,因此我们说即使矩阵全是由实数构成的,其特征值也可能不是实数。有一个结论是:如果矩阵越接近对称,那么其特征值就是实数,相反,如果矩阵越不对称,那么其特征值就越可能有虚数存在。对于反对称矩阵Q^T=-Q,是一个极端情况,于是我们得到了纯虚数的特征值,通常我们见到的矩阵是介于对称与反对称之间的。

特征值相同的情况

例 求A = \left[\begin{matrix} 3 & 1 \\ 0 & 3\end{matrix}\right]的特征值和特征向量

首先观察矩阵A发现这是一个三角矩阵,三角矩阵的特征值就在其对角线元素上,因为在行列式的计算中,对角线两侧的元素不影响其行列式的值,有

det(A-\lambda I) = \begin{vmatrix} 3-\lambda & 1 \\ 0 & 3-\lambda\end{vmatrix} = (3-\lambda)^2 = 0

解得\lambda_1 = \lambda_2= 3。下面代入特征值计算特征向量,有

(A-\lambda I)x=\left[\begin{matrix} -1 & 1 \\ 1 & -1\end{matrix}\right]\left[\begin{matrix} x_1 \\ x_2\end{matrix}\right] = \left[\begin{matrix} 0 \\ 0\end{matrix}\right]

因为两个特征值都为3,因此我们只能求出一个特征向量,即x_2,我们无法得出另一个与x_1线性无关的特征向量了。本例中,矩阵A是一个退化矩阵,重复的特征值在特殊情况下可能导致特征向量的短缺。

特征值与特征向量的应用

在了解了什么是特征值与特征向量及它们的求解方法后,我们来讨论它们的应用问题。

对角化(Diagonalization)

首先给出对角化矩阵公式:S^{-1}AS=\Lambda

其中,矩阵S是矩阵A的特征向量按列组成的,S称为特征向量矩阵(Eigenvector Matrices),矩阵\Lambda称为对角特征值矩阵,其对角线上的元素为矩阵A的特征值,其余元素全部为0

推导过程:

  • 根据Ax_n=\lambda_n x_n,我们将AS展开得到

    AS = A\left[\begin{matrix} x_1 & x_2 & \cdots & x_n\end{matrix}\right] = \left[\begin{matrix} \lambda_1x_1 & \lambda_2x_2 & \cdots & \lambda_nx_n\end{matrix}\right]

  • 将其写成矩阵形式

    AS = \left[\begin{matrix} \lambda_1x_1 & \lambda_2x_2 & \cdots & \lambda_nx_n\end{matrix}\right] = \left[\begin{matrix} x_1 & x_2 & \cdots & x_n\end{matrix}\right]\left[\begin{matrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & & \vdots \\ \vdots & & \ddots & 0 \\ 0 & \cdots & 0&\lambda_n\end{matrix}\right]=S\Lambda

  • 由于矩阵S中的列向量线性无关,因此矩阵S^{-1}必然存在,我们可以在矩阵两侧左乘逆矩阵得到

    AS = S\Lambda \Rightarrow S^{-1}AS=\Lambda \Rightarrow A = S\Lambda S^{-1}

因此我们得到了一种新的矩阵分解方式:A = S\Lambda S^{-1}。它可以将矩阵A分解为特征向量矩阵、对称特征值矩阵与

特征向量矩阵的逆的乘积。我们将这一过程称为矩阵A的对角化。它的作用使得求解矩阵的幂变得更为方便。

矩阵的幂

矩阵A的对角化对求解矩阵的幂有着至关重要的作用。我们先来探讨一个问题:A^2的特征值和特征向量会有什么变化?

考虑A^2的特征向量和特征值,我们依然从Ax=\lambda x开始,我们将等式两侧同乘A

A^2x=\lambda Ax = \lambda^2x

这说明A^2A得特征向量相同,而特征值为\lambda^2,写成对角化形式有

A^2 = S\Lambda S^{-1}S\Lambda S^{-1} = S\Lambda^2S^{-1}

将其以此类推可知

A^k = S\Lambda^kS^{-1}

即矩阵A^k与矩阵A的特征向量相同,特征值为\lambda^k。这就启示我们:如果要求一个矩阵Ak次幂,我们可以先对矩阵A进行对角化分解,再求其对角特征值矩阵的k次幂即可。

因此我们可以推出一个结论:如果矩阵A具有n个线性无关的特征向量,如果所有特征值均满足|\lambda_i|<1,则当k \rightarrow \infty时,A^k \rightarrow 0

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容