以下的内容是关于多元函数知识,也是最优化理论的基础,仅仅是需要《数学分析》的知识。
1、梯度与黑塞矩阵
定义1:设元函数对自变量各自分量的一阶偏导数为
那么称向量
为函数在处的一阶导数或梯度
定义2:设元函数对自变量各自分量的二阶偏导数为
那么称矩阵
为函数在处的二阶导数矩阵或矩阵
定义3:如果梯度的所有分量函数在都连续,则称在连续可微;如果的矩阵的各个分量函数都连续,则在二阶连续可微。
定义4:如果在开集上每一点都连续可微,则称在上一阶连续可微;如果如果在开集上每一点上二阶连续可微,则称在上二阶连续可微
注:(1)、定义4中之所以选择开集,而不是闭集,是因为闭集的边界不可微
(2)、如果在二阶连续可微,则
即表明是一个对称矩阵
例1:设,,求二次函数
在的梯度和矩阵
解:由于
则时
故
和上面的分析类似,我们可以证明
2、方向导数
定义5:设在开集上连续可微,对于,则在点关于方向的方向导数定义为
上述定义的方向导数等于,其中表示在处的梯度,为方向.
注:(1)、显然方向导数是偏导数的推广,偏导数刻画的函数沿着特定方向的微商,而方向导数是任意方向的微商
(2)、就是关于这里方向导数的定义,采用的我后面参考的几本书上其中的定义,不过我当时一看觉得有问题,我当时认为方向导数应该这样定义
上面的范数我们就取欧式范数,或者原始的定义方向选取的是单位方向。后来在维基百科发现方向导数的定义,它认为两者都可以,仔细一想,才是我狭隘了。如果有人留意此贴,希望大家思考一下。
3、多元函数的泰勒公式
定义6:若在上一阶连续可微,对任何则有
定义7:若在上二阶连续可微,对任何则有
证明:因为这个不是很显然
我们利用一元函数的泰勒展开证明,令
则,,由知
4、两个普通公式的证明
此处是我临时起意加上的,肯定很多书上也找不到,主要的是
定义8:若在上二阶连续可微,对任何则有
这个公式我们在上面的证明中用到,但是看起来却不是那么显然,我来证明一下:
证明:
此次内容参考书籍:
[1]、倪勤:最优化方法与程序设计
[2]、袁亚湘,孙文瑜:最优化理论与方法