本章主要围绕以下几个问题展开:
1、什么是李群和李代数
2、李群和李代数的关系
3、怎么对李代数进行求导
接下来我们分别对这几个主题作阐述。
1、什么是李群和李代数
李群首先是一个群,是由一种集合加上一种运算的代数结构。
1.1群
群可以记为:G=
满足以下四个条件的即为群
1.封闭性:
2.结合律:
3.幺元:
4.逆:
可以几位“封结幺逆”(封结妖孽)
1.2李群
具有光滑性质的就称为李群
1.3李代数
1.3.1李代数的引出
对于正交群S0(3),即所谓的旋转矩阵,有如下性质:
由于R表示的是某个相机的旋转,所以R是随着时间变动的,因此(1)式可以写为
对矩阵求导:
整理得
这是一个反对称矩阵,因此可以与一个向量对应:
两边同时右乘,有
这是一个矩阵微分方程组,令初始条件,根据矩阵分析知识:
解得
其中,是时取到的,由上面的推导可以看到,一个对应一个,就是上的李代数
1.3.2李代数的定义
每个李群都有与之对应的李代数。李代数描述了李群的局部性质。通用的李代数定义如下:
李代数由一个集合,一个数域和一个二元运算组成,如果它们满足以下几条性质,则称为一个李代数,记作。
1.封闭性.
2.双线性
3.自反性
4.雅可比性,可看作旋转对换。
记忆:饱经风霜,独自优雅
1.3.3李代数
之前提到的事实上是一种李代数。SO(3)对应的李代数是定义在上的向量,我们记作.根据前面的推导,每个都可以生成一个反对称矩阵:
在此定义下,两个向量。
1.3.4李代数
对于,它也有对应的李代数。为了节省篇幅,这里就不介绍如何引出了。与相似,位于空间中:
我们把每个元素记作;它是一个六维向量。前三维为平移,记作后三维为旋转,记作,实质上是元素。同时我们扩展了符号的意义,将六维向量转换成四维矩阵,但这里不再表示反对称:
我们可以把理解成“由一个平移加上一个元素构成的向量”。同样,李代数也有类似于的李括号:
2、李群和李代数的关系
上一节中我们了解了什么是李代数,现在要了解李代数和李群的关系。
2.1由李代数到李群:指数映射
由上一节的内容我们可以看到,在给定t的情况下,公式
描述了如何由变换到R,但是如何计算又成了问题。为了计算,我们首先提出三个公式:
对于一个矩阵A:
任意是一个三维向量,我们可以定义它的模长和方向,分别记作和,对于
有了以上三个方程,我们有:
,这其实就是罗德里格斯公式
2.2由李群到李代数:对数映射以及特征方程
由公式2.0自然可以想到,李群到李代数的转换可以通过对数运算做到。于是有
但是,我们通常不用泰勒展开去计算对数映射。
由公式2.0,对两边同时取迹(trace),有:
因此
关于转轴a,由于旋转轴上的向量在旋转后不发生改变,说明
2.3上的指数映射与对数映射
设矩阵
上的指数映射如下:
对于矩阵,我们也可以用上一节的内容求得:
这样我们就结局的了如何从到的问题,李群到李代数和上节的内容有相似之处,旋转矩阵计算旋转向量,满足:
3.对李代数求导
使用李代数的动机是优化,而在优化过程中的导数是非常必要的信息。我们已经了解了李群和李代数的关系,但是,当中完成矩阵乘法时,李代数中的发生了什么变化呢,反过来说,当上做两个李代数的加法时,上是否对应着两个矩阵的乘积?很遗憾,李群的矩阵乘法和李代数的加法没有直接对应关系。由BCH公式,可以近似地得到对应关系
3.1李群乘法和李代数加法的对应关系
雅可比矩阵:并且
乘法
和加法
3.2李代数求导
使用李代数解决求导问题的思路分为两种:
1.用李代数表示姿态,然后根据李代数加法来对李代数求导
2.对李群左乘或者右乘微小扰动,然后对扰动求导,称为左扰动和右扰动模型
3.2.1利用李代数加法来对李代数求导
由于李群没有加法,所以不能在李群上直接求导,我们转而去求李代数的导数。
不过这里的比较复杂,我们不希望计算它。
3.2.2扰动模型(左乘)
另一种求导方式,是对进行一次扰动。这个扰动可以乘在左边也可以乘在右边,最后结果会有一点微小的差异。