模拟退火算法

->点击访问个人博客,相互交流学习<-

一、技术论述

1.随机方法

学习在构造模式分类器中起着中心的作用。一个通常的做法是先假设一个单參数或多參数的模型,然后根据训练样本来预计各參数的取值。

当模型相当简单而且低维时,能够採用解析的方法。如求函数导数,来显式求解方程以获得最优參数。

假设模型相对复杂一些,则能够通过计算局部的导数而採用梯度下降算法来解,如人工神经网络或其它一些最大似然方法。而对于更复杂的模型,经常会出现很多局部极值,上述方法的效果往往不尽人意。

假设一个问题越复杂,或者先验知识和训练样本越少,我们对能够自己主动搜索可行解的复杂搜索算法的依赖性就越强,如基于參数搜索的随即方法。

一个通常的做法是使搜索朝着预期最优解的区域前进,同一时候同意一定程度的随机扰动,以发现更好的解。

2.随机搜索

这里主要研究在多个候选解中搜索最优解的方法。假设给定多个变量si,i=1,2,…,N。当中每一个变量的数值都取两个离散值之中的一个(如-1和1)。

优化问题是这样描写叙述的:确定N个si的合适取值。时下述能量函数(又称为代价函数)最小:

[图片上传失败...(image-3b20c9-1548250450228)]

当中w_ij是一个实对称矩阵,取值可正可负。当中令到自身的反馈权为零(即w_ii=0),这是由于非零w_ii仅仅是在能量函数E上添加一个与si无关的常数,不影响问题的本质。这个优化问题能够用网络和节点的方式表示。例如以下图所看到的。当中节点之间的链接相应每一个权值w_ij。

[图片上传失败...(image-278229-1548250450228)]

3.贪心算法的局限性

如上所述。对于求解有N个变量si的能量E最小化问题,除非N的取值非常小,否则往往无法直接求解。由于其构型数目高达N^2。假设使用贪心算法搜索最优的构型,须要先随机选取每一个节点的起始状态,然后顺序考查每一个节点从而计算与之相联系的si=1状态和si=-1状态的能量,最后选取能够减少能量的状态迁移。

这样的推断仅仅用到了直接与之相连的具有非零权值的相邻节点。

这样的贪心搜索算法成功找到最优解的可能性非常小,由于系统经常会陷入局部能量最小值,或根本就不收敛。因此须要选择其它搜索方法。

4.模拟退火

在热力学中。固体的退火过程主要由下面三部分组成:

  1. 加温过程。其目的是增强粒子的热运动。使其偏离平衡位置。当温度足够高时,固体将熔解为液体。从而消除系统原先可能存在的非均匀态,使随后进行的冷却过程以某一平衡态为起点。

    熔解过程实际是系统的熵增过程,系统能量也随温度的升高而增大。

  2. 等温过程。物理学的知识告诉我们,对于与周围环境交换热量而温度不变的封闭系统。系统状态的自发变化总是朝自由能减少的方向进行,当自由能达到最小时。系统达到平衡态。

  3. 冷却过程。其目的是使粒子的热运动减弱并渐趋有序,系统能量逐渐下降,从而得到低能的晶体结构。

Metropolis等在1953年提出了重要性採样法,即以概率大小接受新状态。

详细而言,在温度T时, 由当前状态i产生新状态j,两者的能量分别为Ei和Ej,若Ej小于Ei。则接受新状态j为当前状态;否则。计算概率p(∆E):

[图片上传失败...(image-e5cd68-1548250450228)]

若p(∆E)大于[0,1]区间内的随机数。则仍旧接受新状态j为当前状态;若不成立则保留i为当前状态,当中k为玻尔兹曼常数。T为系统温度。上述重要性採样过程通常称为Metropolis准则:

  1. 在高温下可接受与当前状态能量差较大的新状态;
  2. 而在低温下基本仅仅接受与当前能量差较小的新状态。
  3. 且当温度趋于零时,就不能接受比当前状态能量高的新状态。

1983年Kirkpatrick 等意识到组合优化与物理退火的类似性。并受到Metropolis 准则的启迪,提出了模拟退火算法。模拟退火算法是基于Monte Carlo 迭代求解策略的一种随机寻优算法,其出发点是基于物理退火过程与组合优化之间的类似性,模拟退火方法由某一较高初温開始。利用具有概率突跳特性的Metropolis抽样策略在解空间中进行随机搜索,伴随温度的不断下降,反复抽样过程,终于得到问题的全局最优。对照贪心算法。模拟退火算法基本的优势在于它使系统有可能从局部最小处跳出。

对于一个优化问题:

把优化问题的求解过程与统计热力学的热平衡问题进行类比,通过模拟高温物体退火过程的方法。试图找到优化问题的全局最优或近似全局最优解。

同意随着參数的调整,目标函数能够偶尔向能量添加的方向发展(相应于能量有时上升)。以利于跳出局部极小的区域,随着假想温度的下降(相应于物体的退火),系统活动性减少,终于稳定在全局最小所在的区域。

5.两种模拟退火算法

两种模拟退火算法,即随机模拟退火和和确定性模拟退火算法的实现过程例如以下所看到的:

[图片上传失败...(image-90532c-1548250450228)]

随机模拟退火算法收敛非常慢,部分原因在于当中搜索的所有的构型空间的离散本质,即构型空间是一个N维超立方体。

每一次搜索轨迹都仅仅能沿着超立方体的一条边。状态仅仅能落在超立方体的顶点上,因此失去了完整的梯度信息。

而梯度信息是能够用超立方体内部的连续状态值提供的。一种更快的方法就是下面的确定性模拟退火算法:

[图片上传失败...(image-5cd2ff-1548250450228)]

二、实验结果讨论

构造一个6-单元全连接网络,能量函数使用公式:

[图片上传失败...(image-ea3108-1548250450228)]

当中网络的连接权值矩阵例如以下:

[图片上传失败...(image-28d6d3-1548250450227)]

设计步骤主要包含下面几个部分:
编敲代码[E, s_out] = RandomSimulatedAnnealing(T_max, time_max, c, s, w)。实现以上算法1所述的随机模拟退火算法。这里须要设定下面參数: T_max=10。T(m+1) =c*T(m),c=0.9,进行实验。能量随温度下降次数的变化曲线如图2所看到的(由于模拟退火算法所得到的结果有一定的随机性,因此下面步骤均执行四次算法进行观察)。四次所得到的终于构型s如图3所看到的。

改变參数:初始温度:T_max=5,T(m+1) =c*T(m),c=0.5,进行实验,能量随温度下降次数的变化曲线如图4所看到的。四次所得到的终于构型s如图5所看到的。

<ins data-ad-format="auto" class="adsbygoogle adsbygoogle-noablate" data-ad-client="ca-pub-9556148613641824" data-adsbygoogle-status="done" style="margin: auto; padding: 0px; display: block; background-color: transparent;"><ins id="aswift_1_expand" style="margin: 0px; padding: 0px; display: inline-table; border: none; height: 200px; position: relative; visibility: visible; width: 944px; background-color: transparent;"><ins id="aswift_1_anchor" style="margin: 0px; padding: 0px; display: block; border: none; height: 200px; position: relative; visibility: visible; width: 944px; background-color: transparent;"><iframe width="944" height="200" frameborder="0" marginwidth="0" marginheight="0" vspace="0" hspace="0" allowtransparency="true" scrolling="no" allowfullscreen="true" onload="var i=this.id,s=window.google_iframe_oncopy,H=s&&s.handlers,h=H&&H[i],w=this.contentWindow,d;try{d=w.document}catch(e){}if(h&&d&&(!d.body||!d.body.firstChild)){if(h.call){setTimeout(h,0)}else if(h.match){try{h=s.upd(h,i)}catch(e){}w.location.replace(h)}}" id="aswift_1" name="aswift_1" style="margin: 0px; padding: 0px; left: 0px; position: absolute; top: 0px; border: 0px; width: 944px; height: 200px;"></iframe></ins></ins></ins>

编敲代码[E, s_out] = DeterministicAnnealing(T_max, time_max, c, s, w),实现以上算法2所述的确定性模拟退火算法。

这里须要设定下面參数: T_max=10。T(m+1) =c*T(m),c=0.9,进行实验,能量随温度下降次数的变化曲线如图6所看到的,四次所得到的终于构型s如图7所看到的。

改变參数:初始温度:T_max=5,T(m+1) =c*T(m),c=0.5,进行实验,能量随温度下降次数的变化曲线如图8所看到的。四次所得到的终于构型s如图9所看到的。

结论:图2、3给出了多次随机模拟退火算法的执行结果,能够看到构型s不一定全然一样;能量函数E的波形在经过若干次逐渐递减的震荡后基本收敛到全局最小值-19。当改变T(1)=5,c=0.5时,从图4中可观察到能量函数E的波形极速下降,并达到较小的值,中间少了一个温度渐变和震荡调整的过程。

图6、7给出多次确定性模拟退火算法的执行结果,且每次得到的终于构型s均一致;能量函数E的波形在经过平缓递减后收敛到全局最小值-19。不出现随机模拟退火中剧烈震荡的情况。当改变T(1)=5,c=0.5时。从图8中可观察到能量函数E的波形相同呈现出极速下降的态势。并达到较小的值,中间少了一个温度渐变和调整的过程。

综合以上的实验结果。我们发现随机退火和确定性退火均能给出类似的终于解。但对于一些大规模的现实问题,随机模拟退火的执行速度非常慢,而相比之下确定性退火算法要快非常多,有时能够快2~3个数量级。

<ins data-ad-format="auto" class="adsbygoogle adsbygoogle-noablate" data-ad-client="ca-pub-9556148613641824" data-adsbygoogle-status="done" style="margin: auto; padding: 0px; display: block; background-color: transparent;"><ins id="aswift_2_expand" style="margin: 0px; padding: 0px; display: inline-table; border: none; height: 0px; position: relative; visibility: visible; width: 944px; background-color: transparent;"><ins id="aswift_2_anchor" style="margin: 0px; padding: 0px; display: block; border: none; height: 0px; position: relative; visibility: visible; width: 944px; background-color: transparent; overflow: hidden; opacity: 0;"><iframe width="944" height="200" frameborder="0" marginwidth="0" marginheight="0" vspace="0" hspace="0" allowtransparency="true" scrolling="no" allowfullscreen="true" onload="var i=this.id,s=window.google_iframe_oncopy,H=s&&s.handlers,h=H&&H[i],w=this.contentWindow,d;try{d=w.document}catch(e){}if(h&&d&&(!d.body||!d.body.firstChild)){if(h.call){setTimeout(h,0)}else if(h.match){try{h=s.upd(h,i)}catch(e){}w.location.replace(h)}}" id="aswift_2" name="aswift_2" style="margin: 0px; padding: 0px; left: 0px; position: absolute; top: 0px; border: 0px; width: 944px; height: 200px;"></iframe></ins></ins></ins>

另外,初温T(1)和温度下降系数c的选择对算法性能也有非常大影响。初温的确定应折衷考虑优化质量和优化效率。经常用法包含下面几种:

  • 均匀抽样一组状态,以各状态目标值的方差为初温。

  • 随机产生一组状态,确定两两状态间的最大目标值差|∆max|,然后根据差值。利用一定的函数确定初温。

    譬如T(1)=-∆/ln
    p_r。当中p_r为初始接受概率。

  • 利用经验公式给出。

模拟退火算法设计中包含三个重要的函数:状态产生函数、状态接受函数、温度更新函数。同一时候在程序设计时,需遵循内循环终止准则、外循环终止准则。这些环节的设计将决定模拟退火算法的优化性能。

三、实验结果

[图片上传失败...(image-edc323-1548250450226)]

[图片上传失败...(image-9e4c9e-1548250450226)]

[图片上传失败...(image-55beb3-1548250450226)]

[图片上传失败...(image-e91ce4-1548250450226)]

四、简单代码实现

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% 随机模拟退火函数
% 输入參数:
%   T_max:初始温度
%   time_max:最大迭代次数
%   c:温度下降比率
%   s:初始构型
%   w:权值矩阵
% 输出參数:
%   E:能量变化矩阵
%   s_out:经过算法计算后的构型
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
function [E, s_out] = RandomSimulatedAnnealing(T_max, time_max, c, s, w)

[x, y] = size(s);

time = 1;        % 迭代次数
T(time) = T_max; % 初始温度设置

while (time < (time_max + 1)) % (T(time) > T_min) 
    for i = 1:1000
        num = ceil(rand(1) * y); % 选择产生一个1到y之间的随机数
        for j = 1:y
            e(j) = w(num, j) * s(num) * s(j);
        end
        Ea(time) = -1 / 2 * sum(e);
        Eb(time) = -Ea(time);
        if Eb(time) < Ea(time)
            s(num) = -s(num);
        elseif (exp(-(Eb(time) - Ea(time)) / T(time)) > rand())
            s(num) = -s(num);
        else
            s(num) = s(num);
        end
    end
    % 计算能量E
    E(time) = 0;
    for it = 1:6
        for jt = 1:6
            E(time) = E(time) + w(it, jt) * s(it) * s(jt);
        end
    end
    E(time) = E(time) * (-0.5);
    s_out(time,:) = s;  % 每次形成的构型
    time = time + 1;
    T(time) = T(time - 1) * c;
end

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% 确定性模拟退火函数
% 输入參数:
%   T_max:初始温度
%   time_max:最大迭代次数
%   c:温度下降比率
%   s:初始构型
%   w:权值矩阵
% 中间函数:
%   tanh(l / T):响应函数,该函数有一个隐含的又一次规格化的作用
% 输出參数:
%   E:能量变化矩阵
%   s_out:经过算法计算后的构型
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
function [E, s_out] = DeterministicAnnealing(T_max, time_max, c, s, w)

[x, y] = size(s);

time = 1;        % 迭代次数
T(time) = T_max; % 初始温度设置

while (time < (time_max + 1))
    num = ceil(rand(1) * y); % 选择产生一个1到y之间的随机数
        for j = 1:y
            e(j) = w(num, j) * s(j);
        end
    l(time) = sum(e);
    s(num) = tanh(l(time) / T(time));
    % 计算能量E
    E(time) = 0;
    for it = 1:6
        for jt = 1:6
            E(time) = E(time) + w(it, jt) * s(it) * s(jt);
        end
    end
    E(time) = E(time) * (-0.5);
    s_out(time,:) = s; % 每次形成的构型
    time = time + 1;
    T(time) = T(time - 1) * c;
end

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%模拟退火算法实验
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
clear;
close all;

% 网络的连接权值矩阵
w = [ 0 5 -3 4 4 1;...
      5 0 -1 2 -3 1;...
     -3 -1 0 2 2 0;...
      4 2 2 0 3 -3;...
      4 -3 2 3 0 5;...
      1 1 0 -3 5 0];

num = 6; % 总共产生6个数 
s_in = rand(1,num); % 生成1和-1的随机序列 
s_in(s_in > 0.5) = 1; 
s_in(s_in < 0.5) = -1;
disp(['初始构型S为:',num2str(s_in)]);

% 下面是随机模拟退火算法
T_max = 10;        % 初始温度设置
time_max = 100;    % 最大迭代次数
c = 0.9;           % 温度变化比率
[E1, s_out1] = RandomSimulatedAnnealing(T_max, time_max, c, s_in, w);
subplot(221),plot(E1);grid on;
title(['T(1) = ',num2str(T_max),',c = ',num2str(c),',随机模拟退火算法能量变化曲线']);
disp(['T(1) = 10,c = 0.9,随机模拟退火算法终于构型S为:',num2str(s_out1(time_max,:))]);

T_max = 5;         % 初始温度设置
time_max = 100;    % 最大迭代次数
c = 0.5;           % 温度变化比率
[E2, s_out2] = RandomSimulatedAnnealing(T_max, time_max, c, s_in, w);
subplot(222),plot(E2);grid on;
title(['T(1) = ',num2str(T_max),',c = ',num2str(c),',随机模拟退火算法能量变化曲线']);
disp(['T(1) = 5,c = 0.5,随机模拟退火算法终于构型S为:',num2str(s_out2(time_max,:))]);

% 下面是确定性模拟退火算法
T_max = 10;        % 初始温度设置
time_max = 100;    % 最大迭代次数
c = 0.9;           % 温度变化比率
[E3, s_out3] = DeterministicAnnealing(T_max, time_max, c, s_in, w);
subplot(223),plot(E3);grid on;
title(['T(1) = ',num2str(T_max),',c = ',num2str(c),',确定性模拟退火算法能量变化曲线']);
disp(['T(1) = 10,c = 0.9,确定性模拟退火算法终于构型S为:',num2str(s_out3(time_max,:))]);

T_max = 5;         % 初始温度设置
time_max = 100;    % 最大迭代次数
c = 0.5;           % 温度变化比率
[E4, s_out4] = DeterministicAnnealing(T_max, time_max, c, s_in, w);
subplot(224),plot(E4);grid on;
title(['T(1) = ',num2str(T_max),',c = ',num2str(c),',确定性模拟退火算法能量变化曲线']);
disp(['T(1) = 5,c = 0.5,确定性模拟退火算法终于构型S为:',num2str(s_out4(time_max,:))]);

參考链接:http://www.cnblogs.com/growing/archive/2010/12/16/1908255.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,723评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,485评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,998评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,323评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,355评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,079评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,389评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,019评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,519评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,971评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,100评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,738评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,293评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,289评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,517评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,547评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,834评论 2 345

推荐阅读更多精彩内容

  • 1.概念 介绍模拟退火前,请先了解爬山算法。因为模拟退火算法是爬山算法的改进版,它在爬山算法的基础上引入了随机化。...
    木木与呆呆阅读 1,368评论 8 12
  • 算法背景 退火是指将固体加热到足够高的温度,使分子呈随机排列状态,然后逐步降温使之冷却,最后分子以低能状态排列,固...
    Muggle01阅读 2,661评论 0 0
  • 在算法里面有一类问题叫做最优化问题,这类问题通常的特点是问题的解空间很大,用传统的算法没有办法穷举。比如时间复杂度...
    DayDayUpppppp阅读 3,781评论 0 4
  • 算法思想 自然中的退火(不理解问题不大) 模拟退火算法的思想受启发于自然界中固体由高温到低温的过程中其内部分子状态...
    Cloud_J阅读 3,745评论 0 1
  • 脂肪肝正在成为现代社会的流行病!我也曾经患有脂肪肝。我的裤子最大腰围曾经是38(英)呎,现在已通过控制饮食稳定到3...
    宁静质远阅读 318评论 1 2