以下的内容是关于多元函数知识,也是最优化理论的基础,仅仅是需要《数学分析》的知识。
1、梯度与黑塞矩阵
定义1:设元函数
对自变量
各自分量
的一阶偏导数为
那么称向量
为函数在
处的一阶导数或梯度
定义2:设元函数
对自变量
各自分量
的二阶偏导数为
那么称矩阵
为函数在
处的二阶导数矩阵或
矩阵
定义3:如果梯度的所有分量函数在
都连续,则称
在
连续可微;如果
的
矩阵的各个分量函数都连续,则
在
二阶连续可微。
定义4:如果在开集
上每一点都连续可微,则称
在
上一阶连续可微;如果如果
在开集
上每一点上二阶连续可微,则称
在
上二阶连续可微
注:(1)、定义4中之所以选择开集,而不是闭集,是因为闭集的边界不可微
(2)、如果在
二阶连续可微,则
即表明是一个对称矩阵
例1:设,
,求二次函数
在的梯度和
矩阵
解:由于
则时
故
和上面的分析类似,我们可以证明
2、方向导数
定义5:设在开集
上连续可微,对于
,则
在点
关于方向
的方向导数定义为
上述定义的方向导数等于,其中
表示
在
处的梯度,
为方向.
注:(1)、显然方向导数是偏导数的推广,偏导数刻画的函数沿着特定方向的微商,而方向导数是任意方向的微商
(2)、就是关于这里方向导数的定义,采用的我后面参考的几本书上其中的定义,不过我当时一看觉得有问题,我当时认为方向导数应该这样定义
上面的范数我们就取欧式范数,或者原始的定义方向选取的是单位方向。后来在维基百科发现方向导数的定义,它认为两者都可以,仔细一想,才是我狭隘了。如果有人留意此贴,希望大家思考一下。
3、多元函数的泰勒公式
定义6:若在
上一阶连续可微,对任何
则有
定义7:若在
上二阶连续可微,对任何
则有
证明:因为这个不是很显然
我们利用一元函数的泰勒展开证明,令
则,
,由
知
4、两个普通公式的证明
此处是我临时起意加上的,肯定很多书上也找不到,主要的是
定义8:若在
上二阶连续可微,对任何
则有
这个公式我们在上面的证明中用到,但是看起来却不是那么显然,我来证明一下:
证明:
此次内容参考书籍:
[1]、倪勤:最优化方法与程序设计
[2]、袁亚湘,孙文瑜:最优化理论与方法