16、PRP 共轭梯度法与 Grippo-Lucidi 线搜索

  在~(15)~节,我们证明了~\rm{PRP}^{+}~方法的收敛性。然而,即使~f(x)~是一致凸函数,参数~\beta_k^{PRP}~也可能非负。在~(14)~节,我们知道采取精确线搜索的~\rm{PRP}~方法对于一致凸函数的全局收敛性。于是,\rm{Grippo}~~\rm{Lucidi}^{[1]}~致力于寻找这样的一种线搜索,以确保原始~\rm{PRP}~方法的收敛性。他们提出了一种~\rm{Armijo}~线搜索,并证明了在该线搜索下,原始~\rm{PRP}~方法对一般非凸函数的收敛性。

1、引言

  PRP 共轭梯度法是由 Polak 和 Ribiere 和 Polyak 在 1969 年独立提出的一种非线性共轭梯度法,这种方法具有如下形式:
x_{k+1}=x_k+\alpha_k d_k,\tag{1}
d_k=\begin{cases} -g_k,\quad & k=1,\\ -g_k+\beta_k d_k, &k\ge 2,\end{cases}\tag{2}
其中参数~\beta_k~由以下公式计算:
\beta_k^{PRP}=\frac{g_k^T(g_k-g_{k-1})}{\Vert g_{k-1}\Vert^2}.\tag{3}
  \rm{Grippo}~~\rm{Lucidi}~提出的线搜索与下述条件密切相关:
f(x_{k+1})\le f(x_k)-\rho\alpha_k^2\Vert d_k\Vert^2,\tag{4}
其中~\rho>0~为常数。线搜索条件~(4)~~\rm{Leone}~等学者在考虑无约束优化的无导数方法时引入的,详见文献{[2]},与下式相比
f(x_{k+1})\le f(x_k)+\rho\alpha_k g_k^T d_k,\tag{5}
相比,(4)~\alpha\Vert d_k\Vert~大时,要求目标函数有较大的下降量,而当~\alpha\Vert d_k\Vert~小时,(4)(5) 更容易满足。
  具体地,给定常数~\tau>0,\lambda\in(0,1)~\rm{Grippo}\rm{Lucidi} 的线搜索的基本思想是计算
\alpha_k=\max\left\{\lambda^j\frac{\tau\vert g_k^T d_k\vert}{\Vert d_k\Vert^2};j=0,1,\dots\right\},\tag{6}
使得~x_{k+1}=x_k+\alpha_k d_k~~d_{k+1}=-g_{k+1}+\beta_k^{PRP}d_k~满足 (4) 以及
-c_2\Vert g_{k+1}^T d_{k+1}\Vert^2\le g_{k+1}^Td_{k+1}\le -c_1\Vert g_{k+1}\Vert^2,\tag{7}
其中~0<c_1<1<c_2~为事先给定的常数。下述引理表明,当~f(x)~满足一定条件时,确实存在这样的步长因子~\alpha_k~,使得 (4)(7) 成立,而且这样的步长因子~\alpha_k~不会太小。

2、收敛性分析

引理 1: 设函数~f(x)~ 下方有界,导数~\rm{Lipschitz}~连续可微。考虑~\rm{PRP}~方法~(1)-(3)~,其中步长因子~\alpha_k~\rm{Grippo}\rm{Lucidi} 线搜索确定。则对于每个~k~,必存在这样的~\alpha_k>0~,使得线搜索条件 (4)(7) 成立。进一步地,存在常数~c>0~,使得
\alpha_k\ge c\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}\tag{8}
对所有~k\ge 1~成立。
\color{red}{此处我们想对上式给出两种证明方法}

\color{red}{证法~ 1:}因为~d_1=-g_1~,故
-c_2\Vert g_k\Vert^2\le g_k^T d_k\le-c_1\Vert g_k\Vert^2.\tag{9}
~k=1~成立。设~(9)~对某~k\ge 1~成立。对任意的~\alpha_k~,定义~x_{k+1}=x_k+\alpha_k d_k~~d_{k+1}=-g_{k+1}+\beta_k^{PRP}d_k~,记
c_3=\frac{\min(1-c_1,c_2-1)}{L c_2}>0\tag{10}
利用~\rm{Lipschitz}~连续和归纳假设,对任意的~\alpha_k\in (0,c_3\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2})~
\begin{align}\vert g_{k+1}^T d_{k+1}+\Vert g_{k+1}\Vert^2\vert&\le\vert \beta_{k+1}^{PRP}\vert\vert g_{k+1}^T d_k\vert\\ &\le\Vert g_{k+1}\Vert^2\frac{\Vert g_{k+1}-g_k\Vert\Vert d_k\Vert}{\Vert g_k\Vert^2}\\ &\le\Vert g_{k+1}\Vert^2\frac{L\alpha_k \Vert d_k\Vert^2}{\Vert g_k\Vert^2}\\ &\le\min\left\{1-c_1,c_2-1\right\}\Vert g_{k+1}\Vert^2 \end{align}\tag{11}
故有
-c_2\Vert g_{k+}\Vert^2\le g_{k+}^T d_{k+1}\le-c_1\Vert g_{k+1}\Vert^2,
\forall~\alpha_k\in(0,c_3\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2})\tag{12}
另一方面,由中值定理及导数的~\rm{Lipschitz}~连续性知
\begin{align}f(x_{k+1})-f(x_k)&=\int_0^1g(x_k+t\alpha_k d_k)^T(\alpha_k d_k)\rm{d}\\ &=\alpha_k g_k^T d_k+\int_0^1[g(x_k+t\alpha_k d_k)-g_k]^T(\alpha_k d_k)\rm{dt}\\ &\le\alpha_k g_k^T d_k+\frac{1}{2}L\alpha_k^2\Vert d_k\Vert^2\end{align}\tag{13}
于是
f(x_{k+1})-f(x_k)\le-\rho\alpha_k^2\Vert d_k\Vert^2,~~\forall~\alpha_k\in(0,\frac{2}{L+2\rho}\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}).\tag{14}
~(13)~~(14)~知,存在这样的~\alpha_k~,使得~(4)~~(7)~成立,而且~(8)~
c=\left\{\tau,c_3,\frac{2}{L+2\rho}\right\}\tag{15}
成立。由归纳法,(8)~对所有的~k\ge 1~成立。

\color{red}{证法~ 2:}首先分两种情况:\alpha_k=\tau\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}\alpha_k<\tau\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}
第一种情况易得
\alpha_k\ge c\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}\tag{16}
现设~\alpha_k<\tau\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}~,因此~\frac{\alpha_k}{\lambda}~不满足~(4)~~(7)~。首先,假设~\frac{\alpha_k}{\lambda}~不满足线搜索条件~(4)~,则
f(x_k+\frac{\alpha_k}{\lambda})>f(x_k)-\rho\alpha_k^2\Vert d_k\Vert^2.\tag{17}
另一方面,由中值定理及导数的~\rm{Lipschitz}~连续性知
\begin{align}f(x_{k}+\frac{\alpha_k}{\lambda}d_k)-f(x_k)&=f(x_k)+\frac{\alpha_k}{\lambda}g(z_k)^T d_k\\ &=f(x_k)+\frac{\alpha_k}{\lambda}g_k^T d_k+\frac{\alpha_k}{\lambda}(g(z_k)^T d_k-g_k^Td_k)\\ &\le f(x_k)+\frac{\alpha_k}{\lambda} g_k^T d_k+(\frac{\alpha_k}{\lambda})^2L\Vert d_k\Vert^2 \end{align}\tag{18}
其中~z_k=x_k+\lambda_k\frac{\alpha_k}{\lambda}d_k,~\lambda_k\in(0,1)~,由~(17)~~(18)~
\alpha_k>\frac{\rho}{\rho+L}\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}.\tag{19}
另外,假设~\frac{\alpha_k}{\lambda}~不满足线搜索条件~(7)~,则下面的不等式至少有一个成立
g(w_k)^T(-g(w_k)+\beta_{k+1}d_k)>-c_1\Vert g(w_k)\Vert^2.\tag{20}
g(w_k)^T(-g(w_k)+\beta_{k+1}d_k)<-c_2\Vert g(w_k)\Vert^2.\tag{21}
其中~w_k=x_k+\frac{\alpha_k}{\lambda}d_k~
~(20)~~\rm{Lipschitz}~
\begin{align}-c_1\Vert g(w_k)\Vert^2&<-\Vert g(w_k)\Vert^2+\vert\beta_{k+1}\vert\vert g(w_k)^T d_k\vert\\ &\le-\Vert g(w_k)\Vert^2+\frac{\Vert g(w_k)\Vert\Vert g(w_k)-g_k\Vert}{\Vert g_k\Vert}\vert g(w-k)^T d_k\vert\\ &\le-\Vert g(w_k)\Vert^2+\Vert g(w_k)\Vert^2\frac{\Vert g(w_k)-g_k\Vert}{\Vert g_k\Vert^2}\Vert d_k\Vert\\ &\le -\Vert g(w_k)\Vert^2+\frac{L\frac{\alpha_k}{\lambda}\Vert d_k\Vert^2}{\Vert g_k\Vert^2}\Vert g(w_k)\Vert^2\end{align}\tag{22}
~(23)~可得
\alpha_k\ge\frac{\lambda(1-c_1)\Vert g_k\Vert^2}{L\Vert d_k\Vert^2}\tag{23}
~(21)~~\rm{Lipschitz}~
\begin{align}-c_2\Vert g(w_k)\Vert^2&>-\Vert g(w_k)\Vert^2+\vert\beta_{k+1}\vert\vert g(w_k)^T d_k\vert\\ &\ge-\Vert g(w_k)\Vert^2-\frac{\Vert g(w_k)\Vert\Vert g(w_k)-g_k\Vert}{\Vert g_k\Vert}\vert g(w_k)^T d_k\vert\\ &\ge-\Vert g(w_k)\Vert^2-\Vert g(w_k)\Vert^2\frac{\Vert g(w_k)-g_k\Vert}{\Vert g_k\Vert^2}\Vert d_k\Vert\\ &\ge -\Vert g(w_k)\Vert^2-\frac{L\frac{\alpha_k}{\lambda}\Vert d_k\Vert^2}{\Vert g_k\Vert^2}\Vert g(w_k)\Vert^2\end{align}\tag{24}
~(24)~可得
\alpha_k\ge\frac{\lambda(c_2-1)\Vert g_k\Vert^2}{L\Vert d_k\Vert^2}\tag{25}
\color{red}{其实最开始我们应该按照数学归纳法证明一下,假定下式成立}
-c_2\Vert g_k\Vert^2\le g_k^T d_k\le -c_1\Vert g_k\Vert^2\tag{26}
即有
\vert g_k^T d_k\vert\le c_2\Vert g_k\Vert^2\tag{27}
~(23)~进一步有
\alpha_k\ge \frac{\lambda (1-c_1)\vert g_k^T d_k\vert}{Lc_2\Vert d_k\Vert^2}\tag{28}
~(25)~进一步有
\alpha_k\ge \frac{\lambda (c_2-1)\vert g_k^T d_k\vert}{Lc_2\Vert d_k\Vert^2}\tag{29}
结合~(6)~~(19)~~(28)~~(29)~,我们可令
c=\min\left\{\tau,\frac{\rho}{\rho + L},\frac{\lambda(1-c_1)}{L c_2},\frac{\lambda(c_2-1)}{L c_2}\right\}\tag{30}
\color{red}{从而引理得证}

  利用~(4)~~(8)~两式可知,每步的函数值下降量具有量级~\frac{(g_k^T d_k)^2}{\Vert d_k\Vert^2}~。因此,当目标函数~f(x)~有下界时,\rm{Zoutendijk}~条件成立。
\sum_{k\ge 1}\frac{(g_k^T d_k)^2}{\Vert d_k\Vert^2}<\infty\tag{31}
  利用~(31)~以及
\alpha_k\le\tau\frac{\vert g_k^T d_k\vert}{\Vert d_k\Vert^2}\tag{32}
可以证明原始~\rm{PRP}~方法在~\rm{Grippo-Lucidi}~的线搜索下全局收敛性,而且为强收敛。

定理 2:设目标函数~f(x)~下方有界,导数~\rm{Lipschitz}~连续可微。考虑~\rm{PRP}~方法~(1)-(3)~,其中步长因子~\alpha_k~~\rm{Grippo-Lucidi}~的线搜索确定,则方法在下述意义下全局收敛:
\lim_{k\rightarrow\infty}\Vert g_k\Vert=0\tag{33}
证明:用直接法:由~(2),(3),(7),(32)~和 导数的~\rm{Lipschitz}~连续性、知
\begin{align}\Vert d_k\Vert&\le\Vert g_k\Vert+\vert \beta_k^{PRP}\vert\Vert d_{k-1}\Vert\\ &\le\Vert g_k\Vert(1+\frac{\Vert g_k-g_{k-1}\Vert\Vert d_{k-1}\Vert}{\Vert g_{k-1}\Vert^2})\\ &\le\Vert g_k\Vert(1+\frac{L \alpha_{k-1}\Vert d_{k-1}\Vert^2}{\Vert g_{k-1}\Vert^2})\\ &\le\Vert g_k\Vert(1+\frac{\tau L \vert g_{k-1}^T d_{k-1}\vert}{\Vert g_{k-1}\Vert^2})\\ &\le(1+c_2\tau L)\Vert g_k\Vert\end{align}\tag{33}
于是,利用~(7),(31),(33)~
\infty>\sum_{k\ge 1}\frac{(g_k^T d_k)^2}{\Vert d_k\Vert^2}\ge c_1^2(1+c_2\tau L)^{-2}\sum_{k\ge 1}\Vert g_k\Vert^2,\tag{34}
从而~(33)~成立。

  (33) 表明,由~\rm{PRP}~方法产生的点列~\left\{x_k\right\}~的任意聚点都是目标函数的稳定点。这一结果比以前获得的收敛性结果都要强。在某种程度上,这一结果的取得归因于当~\Vert s_{k-1}\Vert~趋于零时,~\rm{PRP}~方法给出的方向~d_k~靠近于负梯度方向~-g_k~

3、参考文献

  \color{red}{有事,很忙,参考文献以后再写。}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,509评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,806评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,875评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,441评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,488评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,365评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,190评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,062评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,500评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,706评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,834评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,559评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,167评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,779评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,912评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,958评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,779评论 2 354

推荐阅读更多精彩内容