MCMC抽样法(学习笔记)

前言:

  • 后验分布种给出了每个参数值的可能性,但很难看出完整的分布,也无法用分析解决。于是我们需要MCMC法;

  • MCMC法有两大要素:蒙特卡罗模型和马尔可夫链


蒙特卡罗模型

  1. 蒙特卡罗模型:重复生成(大量)随机数来估计固定参数(仅给出一个参数的近似值但不能直接计算)

    • 举例:估算不规则区域面积


      image.png

    通过随机生成20个点来估计圆面积(\approx \frac{15}{20}*100=75

  2. 应用:

    1. 估算不规则区域面积
    2. 模拟复杂过程(预测天气、估计选举结果......)

马尔可夫链

  • 历史发展:


    image.png
    • 如图,钟形曲线被看作自然界中常见模式,但钟形线甚至大多数规律所描述的一系列事件,彼此都是完全独立的。因此,俄罗斯数学家和神学家帕维尔·涅克拉索夫(Pavel Nekrasov)认为:现实世界中的事物相互依存,不符合数学模型或分布!
    • 但是安德烈·马尔科夫(Andrey Markov)试图证明非独立事件也可能符合数学模型。马尔可夫链一个著名的应用案例是——从一部俄罗斯诗歌作品中输出数千个“两字母对”(two-character pairs)。利用这些对,计算每一字母的条件概率。也就是说,给定前面的字母或空格,就能预测下一个字母是A还是T,或是一个空格。利用这些概率,马尔可夫可以模拟任意长的字符序列,这就是马尔可夫链。当字符串一定长的时候,起始字母的选择对后续字母的影响可以忽略不计即字母的分布遵循一种模式。也就是说,相互依赖的时间,如果它们受到固定概率的影响,也将遵循平均水平模式!
  • 马尔可夫链有概率相关的序列组成,每一事件来自一组结果,每个结果根据一组固定的概率确定下一个结果。

  • 一种重要特征——无记忆:预测下一个时间所需要的所有信息都能从当前状态找到,从历史事件中找不到新的信息(类“蛇梯棋”)

    • 数学定义:

    p(E_i|E_i,...,E_1)=p(E_i|E_{i-1})

    • 一个形象的比喻:假如每天的天气是一个状态的话,那今天是不是晴天只依赖于昨天的天气而和前天的天气没有任何关系!

    • 非周期的马尔可夫链具有收敛性质:如果一个非周期的马尔可夫链有状态转移矩阵P,且它的任何两个状态是连通的,那么转移n次后的状态与初始状态无关!

      • [1]:对于如下图的股市模型:

        image.png

        共有三种状态,定义状态概率转化矩阵为P,且P(i,j)=P(j|i)(从状态i转化到状态j的概率):

        P= \begin{pmatrix} 0.9&0.075&0.025\\ 0.15&0.8&0.05\\ 0.25&0.25&0.5 \end{pmatrix}
        我们会发现,对于任意初始的股市概率,假设初始概率分布:[0.3,0.4,0.3],代入转移矩阵计算状态2,3,……,n次状态转移(本例中约为6次)会发现股市概率分布稳定在:[0.625,0.3125,0.0625]这组概率分布上(不论初始股市概率是什么)。


    • 利用MCMC模型估计后验分布形状

      利用MCMC方法,有效从后验分布种抽取样本,然后计算样本中的平均值

      • 步骤:

        输入选定的马尔可夫链状态转移矩阵Q,设定状态转移次数阈值n1 ,需要的样本个数n2 \longrightarrow 从任意简单概率分布取一个初始状态值x0(或自己给定)\longrightarrow 重复X步骤n1+n2 -1次 \longrightarrow获得需要的平稳分布对应的样本集(x_{n1}, x_{n_1+1},...,x_{n_!+n_2+-1})\longrightarrow 得到概率分布

        • X步骤:(t表示重复的次数):
          1. 从条件概率分布Q(x|xt)中取得样本x*
          2. 均匀分布采样u~uniform[0,1] (获得一个随机数u)
          3. 如果u<α(xt ,x*)(接受率,α(xt ,x~~)=\pi (x~)Q(x~, xt);若为M-H分布,则α(i,j)=min{\frac{\pi (j)Q(j,i)}{\pi (i)Q(i,j)},1},提高了采样效率),则接受转移xt \rightarrow x_*,即xt+1 =x~~
          4. 否则不接受转移,即x_{t+1}=x_t

利用MCMC模型估计后验分布形状

利用MCMC方法,有效从后验分布种抽取样本,然后计算样本中的平均值

  • 步骤:

    输入选定的马尔可夫链状态转移矩阵Q,设定状态转移次数阈值n1 ,需要的样本个数n2 \longrightarrow 从任意简单概率分布取一个初始状态值x0(或自己给定)\longrightarrow 重复X步骤n1+n2 -1次

    • X步骤:(t表示重复的次数)
    1. 从条件概率分布Q(x|xt)中取得样本x*
    2. 均匀分布采样u~uniform[0,1] (获得一个随机数u)
    3. 如果u<α(xt ,x*)(接受率,α(xt ,x~~)=\pi (x~)Q(x~, xt)),则接受转移xt \rightarrow x_*,即xt+1 =x~~
    4. 否则不接受转移,即x_{t+1}=x_t

    \longrightarrow 获得需要的平稳分布对应的样本集(x_{n1}, x_{n_1+1},...,x_{n_!+n_2+-1})\longrightarrow 得到概率分布

  • 例:MCMC单参数运用——估计人类平均身高

    1. 人类平均身高的后验分布同时受到观测曲线和先验分布的影响,假设人类平均身高的后验分布如图:


      image.png
    2. 对单参数(x轴上的数值),MCMC法沿x轴开始随机采样,在这里后验概率影响Q,则:


      image.png

      (集中的点垂直叠加,便于观察,事实上应该都是取在x轴上的)

    3. 做直方图,获取概率分布:


      image.png

REFERENCE

《告别数学公式,图文解读什么是马尔可夫链蒙特卡罗方法(MCMC)》:https://zhuanlan.zhihu.com/p/32982140
《MCMC(三)MCMC采样和M-H采样》:https://www.cnblogs.com/pinard/p/6638955.html


  1. 来自wiki

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,123评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,031评论 2 384
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,723评论 0 345
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,357评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,412评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,760评论 1 289
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,904评论 3 405
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,672评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,118评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,456评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,599评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,264评论 4 328
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,857评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,731评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,956评论 1 264
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,286评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,465评论 2 348