EM 算法的 9 重境界之第3重

之前写过一篇文章EM 算法的 9 重境界之前两重,里面讲述了em算法的过程,本文是对前一篇文章的补充。

em算法中关键的公式推导如下:

EM 算法的 9 重境界之第三重
EM 算法的 9 重境界之第三重
EM 算法的 9 重境界之第三重

绿色曲线是L的下界,我们每次先固定 θ(t)

θ(t),令q(z)=p(z|x,θ)

q(z)=p(z|x,θ),此时就是绿色曲线,此时我们再求下界绿色曲线的极值,求出此时的θ(t+1)

θ(t+1),将其带入kl散度,令此时q(z)=p(z|x,θ(t+1))

q(z)=p(z|x,θ(t+1)),得到一个新的下界,此时再求出新的θ

θ,不断重复这个过程。

简单回顾完上面的数学推导,我们通过例子来加深理解。

三个硬币

假设有三枚硬币A、B、C,每个硬币正面出现的概率是π、p、q。进行如下的掷硬币实验:先掷硬币A,正面向上选B,反面选C;然后掷选择的硬币,正面记1,反面记0。独立的进行10次实验,结果如下:1,1,0,1,0,0,1,0,1,1。假设只能观察最终的结果(0 or 1),而不能观测掷硬币的过程(不知道选的是B or C),问如何估计三硬币的正面出现的概率 π、p、q?

首先我们写出数据描述,

EM 算法的 9 重境界之第三重

此处θ=(π、p、q)

θ=(π、p、q),X={x1,x2,…xm},每次投掷彼此独立,因此

EM 算法的 9 重境界之第三重

上面针对每个数据(xi),就有求logp(x|θ)

logp(x|θ),针对上面的EM算法,我们来看下求解过程:

EM 算法的 9 重境界之第三重
EM 算法的 9 重境界之第三重
EM 算法的 9 重境界之第三重

需要注意的是,这里的μi+1通过E步的计算就已经是一个常数了,后面的求导不需要把这个式子代入。

M步:针对L函数求导,L函数的表达式是

EM 算法的 9 重境界之第三重

下面我们来对L分别对π、p、q求导,

EM 算法的 9 重境界之第三重

再令这个结果等于0,即获得

EM 算法的 9 重境界之第三重

另外两个参数p、q也可以通过求导求得。上面是通过数据公式推导求到的,下面我们换一种思路做。

EM 算法的 9 重境界之第三重

假设上面我们观察到的序列中,我们已经知道了每个结果是由红色(coin B)还是绿色(coin C)投掷出来,那么我们就可以估计 π、p、q了,

π = 红色个数 / 总个数

p = 红色H个数 / 红色个数

q = 绿色H个数 / 绿色个数

现在的情况是,我们不明确每个结果是由红色还是绿色投掷而来,但是我们可以估计出这个概率:

p(z=1|x,θ) = p(x,z=1|θ) / p(x|θ)

这个之前推导过,是:

EM 算法的 9 重境界之第三重

此时我们就可以得到硬币是红色的概率了:

EM 算法的 9 重境界之第三重

此时,针对每个硬币,我们都能计算出属于红色和属于绿色的概率,此时我们再来预估π、p、q:

EM 算法的 9 重境界之第三重

GMM模型

有了上面这个例子后,我们再来看GMM模型,高斯混合模型,混合模型即数据由多个分布组成,像上面三硬币例子,也是一个混合模型,先来描述下问题:

假设有数据D={x(1), … , x(m)} ,我们希望能够求出p(x(i), z(i))的联合分布,此处

p(x(i), z(i)) = p(x(i)|z(i))p(z(i))

z服从多项分布

EM 算法的 9 重境界之第三重

而xi服从高斯分布

EM 算法的 9 重境界之第三重

于是我们就能得到似然函数:

EM 算法的 9 重境界之第三重

根据EM算法的套路,我们先假设假设参数已知,来求隐变量z的后验分布:

EM 算法的 9 重境界之第三重

上面wji的意思是第i个数据属于第j个高斯的概率,具体计算就是:

EM 算法的 9 重境界之第三重

上面式子中

EM 算法的 9 重境界之第三重

是指x(i)在第j个高斯分布下的概率,

EM 算法的 9 重境界之第三重

则是隐变量z是第k个高斯的概率。

然后在M-step中,我们就可以更新:

EM 算法的 9 重境界之第三重

以上就是对于em算法例子的补充,本文最重要的概念就是隐变量z是一个分布,本文的两个例子,我们都假设z的先验分布是多项分布,后面我们会看到我们可以假设z是其他分布,此时又会新的变化,欢迎关注。

参考

【机器学习算法系列之一】EM算法实例分析

EM 算法的 9 重境界之前两重

cs229-notes7b

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容