这篇文章同样出于戴彧虹 和 袁亚湘 老师之手,我个人感觉证明很巧妙。本文主要进一步分析 DY 共轭梯度法,在不特别给定线搜索和函数凸性的情况下,给出了 DY 共轭梯度法的内在性质,即是充分下降性对于大多数点列都成立。
1、介绍
共轭梯度法是解决无约束优化问题的常用方法之一,问题如下
求解此问题,一般采取线搜索技巧,其基本迭代格式形如
其中是迭代点
处的梯度,
是搜素步长,
是搜素方向,
为共轭参数。
不同的参数决定不同的共轭梯度法。在前一篇文章,我们主要介绍了由 戴彧虹 和 袁亚湘 提出的 DY 共轭梯度法,其
的参数形式如下
表明了其它标准 Wolfe 线搜索下能够建立全局收敛性,进一步,如果在强 Wolfe 线搜索下能够保证其充分下降性。我们还讨论了如果函数为严格凸函数(一致凸函数),能够保证下降性(充分下降性)。
在此,我想表明的是,通过以上对 DY 算法的认识还远远不够,我们应该更加深入讨论 DY 共轭梯度法的内在性质,这些性质并不依赖于线搜索的选择和函数的凸性。最后我们利用这些性质,构造出几种特殊的线搜索来建立全局收敛性。
2、DY 共轭梯度法的内在性质
为了严谨,我们都是假定
否则,稳定点我们已经得到,迭代算法就会终止。
其次,我们定义两个后面会用到的两个量
其中可看成一个反映方向
长度的量,
则反映
的下降程度。实际上,若
,则
是下降方向,若
对某常数
成立,则式
表明
是下降方向。
下面的这些东西,其实在上一篇文章的证明过程中也出现过,在此我们还是叙述一下
当时,
,两端与
做内积。
当时,
,两端取模平方并移项,可得
将上式除以,并利用
得
利用和
的定义,则有
因此若,则式
式右端的第二项将使
增加,第三项将使得
的值减小,它们关于
的量级分别为一阶和二阶。同时考虑这两项,不难看出当且仅当
时,
增加;而当
趋于零时,
将显著减少。由于对所有的
,都有
,我们便可以对
的下界进行估计。
我们先给出如下假定,存在正常数和
使得
**
定理1: 考虑方法和
,其中
由
计算,
满足
。若
成立,则存在常数
,
和
,使得下述关系式
对所有 都成立.
证明: 利用,对
式求和,得
因为,上式表明
利用、
及关系
即得
从上式及,不难证得
因此对对
,注意到
以及
即对关系式和
中的
和
也成立。
**注1****: 在上面的定理中,关系式并不表明充分下降在每一步都成立。虽然如此,我们可以证明 DY 共轭梯度法的充分下降性质对大部分点列都成立。
定理 2: 考虑方法和
,其中
由
计算,
满足
,若
成立,则对任意的
,存在正常数
,
,
,使得对所有的
,关系式
以及
对中至少
个
成立
证明: 对任意的,我们选取
,使其满足
对此和任意的
,定义集合
并记为
中元素的个数,利用
、
以及
,不难看出
于是,由,
以及
的定义可得
其中由
给出,上式和
表明了
故对任意的,如果选取
满足
、
,
,则从
,
,
和
知,关系式
至少对
个
都成立。
注2:上述证明证明过程,本人看了很久,奈何水平有限,感觉理解不了。比如式的定义,
和
的推导,就不明白,如果有人了解,还望不吝赐教。
3、DY 共轭梯度法在一般线搜索条件下的全局收敛性
现在设线搜索满足如下较为一般的条件
其中为常数,而
由
式给出。因为对标准 Wolfe 线搜索可证明
对标准 Armijo 线搜索 ,满足下式
则有下式成立
对另一种 Armijo 型 线搜索,满足下式
则有下式成立
其上:
注:上面的其实是标准 Wolfe 显然得出的结论,或许有对 Armijo 型线搜索不熟悉,可以私信交流
和
。以上的分析只是想说明,我们给出的线搜索
t条件很好满足而已。
定理3: 设目标函数有下界,导函数
是
连续,考虑方法
和
,其中
由
计算,
满足
,而步长因子
满足
,如果存在常数
,使得
则方法在下述意义下是全局收敛的:
证明: 对式求和,并注意到
有下界,得
现用反证法,假设不成立,即存在常数
,使得
由 定理2 可知,关系式和
对某正常数
和
成立,此外,在
中应用
和
,得
上式及表明了
于是利用、
和
,得到
上式和相矛盾,则表明
式成立。
4、结束语
其实上面的过程我也看了很久,也有一些不懂的地方,也都用 注 进行标记,之所以还要写出来,也希望遇见一个研究无约束优化特别是共轭梯度法的朋友,能够相互探讨,相互学习吧。
上面的内容参考 戴彧虹 的文章
[1] New properties of a nonlinear conjugate gradient method. Numerische Matheematik, 89, 83-98.
11、DY 共轭梯度法的内在性质
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 在前面,我们介绍了 FR 共轭梯度法在精确线搜索,强 Wolfe 线搜索和推广的 Wolfe 线搜索下的收敛性...