概率图模型-表示|机器学习推导系列(十)

一、概述

  1. 基本规则

概率图模型使用图的形式表示概率分布,首先总结一下几个随机变量分布的一些规则:

Sum Rule:p(x_{1})=\int p(x_{1},x_{2})\mathrm{d}x_{2}
Product Rule:p(x_{1},x_{2})=p(x_{1}|x_{2})p(x_{2})
Chain Rule:p(x_{1},x_{2},\cdots ,x_{p})=\prod_{i=1}^{p}p(x_{i}|x_{i+1},x_{i+2},\cdots ,x_{p})
Bayesian Rule:P(x_{2}|x_{1})=\frac{P(x_{1},x_{2})}{P(x_{1})}=\frac{P(x_{1},x_{2})}{\int P(x_{1},x_{2})\mathrm{d}x_{2}}=\frac{P(x_{2})P(x_{1}|x_{2})}{\int P(x_{2})P(x_{1}|x_{2})\mathrm{d}x_{2}}

  1. 简化运算的假设

在链式规则中如果数据的维度过高,就会出现计算复杂的困境,因此我们需要对此做出一些简化,以下是一些例子:

①\; 相互独立的假设:P(x_{1},x_{2},\cdots ,x_{p})=\prod_{i=1}^{p}P(x_{i}),朴素贝叶斯中的条件独立性假设:P(x|y)=\prod_{i=1}^{p}P(x_{i}|y);\\ ②\; Markov\; Property:x_{j}\perp x_{i+1}| x_{i},j< i,HMM中的齐次Markov假设;\\ ③\; {\color{Red}{条件独立性假设}}:x_{A}\perp x_{B}|x_{C},x_{A}、x_{B}、x_{C}是集合,且不相交。

  1. 概率图模型的知识体系

概率图\left\{\begin{matrix} Representation(表示)\left\{\begin{matrix} 有向图\; Beyesian\; Network\\ 高斯图(连续)\left\{\begin{matrix} Gaussian\; BN\\ Gaussian\; MN \end{matrix}\right.\\ 无向图\; Markov\; Network \end{matrix}\right.\\ Inference(推断)\left\{\begin{matrix} 精确推断\\ 近似推断\left\{\begin{matrix} 确定性近似(变分推断)\\ 随机近似(MCMC) \end{matrix}\right. \end{matrix}\right.\\ Learning(学习)\left\{\begin{matrix} 参数学习\left\{\begin{matrix} 完备数据\left\{\begin{matrix} 有向\\ 无向 \end{matrix}\right.\\ 隐变量\rightarrow EM \end{matrix}\right.\\ 结构学习 \end{matrix}\right. \end{matrix}\right.

二、有向图-贝叶斯网络

  1. 基本结构

已知联合概率分布中各个随机变量的依赖关系,可以根据拓扑排序(依赖关系)得到一个有向图。而如果已知一个有向图,可以直接得到联合概率分布的因子分解:

P(x_{1},x_{2},\cdots ,x_{p})=\prod_{i=1}^{p}P(x_{i}|x_{parent(i)})

在局部的任何三个节点,可以有以下三种结构:

  • head to tail
head to tail

这种结构满足:

A\perp C|B\Leftrightarrow 若B被观测,则路径被阻塞。

阻塞也就是独立的意思。

通过因子分解和链式规则可以进行证明:

P(A,B,C)=\underset{因子分解}{\underbrace{P(A)P(B|A)P(C|B)}}=\underset{链式法则}{\underbrace{P(A)P(B|A)P(C|B,A)}}\\ \Rightarrow P(C|B)=P(C|B,A)\\ \Rightarrow P(C|B)P(A|B)=P(C|A,B)P(A|B)\\ \Rightarrow P(C|B)P(A|B)=P(C,A|B)\\ \Rightarrow C\perp A|B

  • tail to tail
tail to tail

这种结构满足:

A\perp C|B\Leftrightarrow 若B被观测,则路径被阻塞。

通过因子分解和链式规则可以进行证明:

P(A,B,C)=\underset{因子分解}{\underbrace{P(A|B)P(B)P(C|B)}}=\underset{链式法则}{\underbrace{P(B)P(A|B)P(C|A,B)}}\\ \Rightarrow P(C|B)=P(C|A,B)\\ \Rightarrow P(C|B)P(A|B)=P(C|A,B)P(C|B)\\ \Rightarrow P(C|B)P(A|B)=P(A,C|B)\\ \Rightarrow C\perp A|B

  • head to head
head to head

这种结构满足:

默认情况下,A\perp C,路径是阻塞的。
B被观测,则路径是通的。
如果B仍然有后继节点,则如果后继节点被观测,路径也是通的。

通过因子分解和链式规则可以进行证明:

P(A,B,C)=\underset{因子分解}{\underbrace{P(A)P(C)P(B|A,C)}}=\underset{链式法则}{\underbrace{P(A)P(C|A)P(B|A,C)}}\\ \Rightarrow P(C)=P(C|A)\\ \Rightarrow A\perp C

  1. D划分(D-Seperation)

对于3个集合A、B、C,判断其是否满足条件独立性假设(x_{A}\perp x_{B}|x_{C},x_{A}x_{B}x_{C}是集合,且不相交。)可以通过D划分这种方法。

D划分是一种判定的方式,其规则是对于上述head to tail以及tail to tail的关系,引入集合AB,那么满足x_{A}\perp x_{B}|x_{C}C集合中的元素与AB中的元素的关系满足head to tail或tail to tail的关系,而满足head to head关系的元素不在C中。下图展示了满足条件独立性的3个集合的有向图:

条件独立性
  1. 马尔可夫毯(Markov Blanket)

现在来看一下以下概率:

P(x_{i}|x_{-i})=\frac{P(x_{i},x_{-i})}{P(x_{-i})}=\frac{P(x)}{\int _{x_{-i}}P(x)\mathrm{d}x_{i}}=\frac{\prod_{j=1}^{p}P(x_{j}|x_{parent(j)})}{\int _{x_{i}}\prod_{j=1}^{p}P(x_{j}|x_{parent(j)}) \mathrm{d}x_{i}}

在上式中,x_{-i}指的是从x中剔除x_{i}剩下的部分。分子分母可以将与x_{i}无关的P(x_{j}|x_{parent(j)})提出来然后约掉,也就是说x_{i}x_{-i}的关系只与P(x_{i}|x_{parent(i)})P(x_{child(i)}|x_{i},x_{otherparent})有关,即只与x_{i}的父节点,x_{i}的子节点以及x_{i}子节点的其父节点有关,这些节点就叫做马尔可夫毯(Markov Blanket)。画图表示如下:

马尔可夫毯(Markov Blanket)
  1. 具体模型

实际应⽤的模型中,对这些条件独⽴性作出了假设,从单⼀到混合,从有限到⽆限(时间,空间)可以分为:

\left\{\begin{matrix} 单一:Naive Bayes\\ 混合:GMM\\ 时间:\left\{\begin{matrix} Markov\; Chain\\ Gaussian\; Process \end{matrix}\right.\\ 连续:Gaussian\; Bayesian\; Network \end{matrix}\right.

GMM 与时序结合的动态模型:

  • HMM(离散)
  • 线性动态系统 LDS(Kalman 滤波)
  • 粒⼦滤波(⾮⾼斯,⾮线性)

三、无向图-马尔可夫网络(马尔可夫随机场)

  1. 全局、局部、成对马尔可夫性

马尔可夫随机场的条件独立性体现在三个方面:
①全局马尔可夫性
②局部马尔可夫性
③成对马尔可夫性

全局、局部、成对马尔可夫性是相互等价的,也就是说可以相互推出来。

  • 全局马尔可夫性

在无向图中给定三个集合ABC,在无向图中如果满足给定x_C的条件下,x_Ax_B相互独立,即x_{A}\perp x_{B}|x_{C},则满足全局马尔可夫性。

在图中的判定方法为从A中节点到B中节点的任何路径上都至少有一个位于C中的节点:

全局马尔可夫性
  • 局部马尔可夫性

局部马尔可夫性是指给定一个变量x的所有邻接变量,则x独立于任何其他变量,即:

x\perp (X-Neighbor(x)-x)|Neighbor(x)

举例来说,在下图中,x\perp \left \{e,f\right \}|\left \{b,c,d\right \}

局部马尔可夫性
  • 成对马尔可夫性

成对马尔可夫性是指给定所有其他变量,两个非邻接变量条件独立,即:

x_{i}\perp x_{j}|x_{-i-j},i\neq j,x_{i}、x_{j}不相邻

  1. 因子分解

引入团的概念:

团,最大团:图中节点的集合,集合中的节点之间全部互相连接的叫做团,如果不能再添加任何节点,就叫做最大团。

最大团的概念可以参考数据结构中的极大连通子图

将概率无向图模型的联合概率分布表示为其最大团上的随机变量的函数的乘积形式的操作,称为概率无向图模型的因子分解

给定概率无向图模型,C_i,i=1,2,\cdots ,k为无向图模型上的最大团,则x的联合概率分布P(x)可以写为:

P(x)=\frac{1}{Z}\prod_{i=1}^{k}\psi (x_{C_{i}})\\ C_{i}:最大团\\ x_{C_{i}}:最大团随机变量集合\\ \psi (x_{C_{i}}):势函数,必须为正\\ Z=\sum _{x}\prod_{i=1}^{k}\psi (x_{C_{i}})=\sum _{x_{1}}\sum _{x_{2}}\cdots \sum _{x_{p}}\prod_{i=1}^{k}\psi (x_{C_{i}})

对于势函数,通常使用\psi (x_{C_{i}})=exp\left \{-E(x_{C_{i}})\right \},当使用这个势函数时,P(x)=\frac{1}{Z}\prod_{i=1}^{k}\psi (x_{C_{i}})就叫做吉布斯分布(Gibbs Distribution),或者玻尔兹曼分布(Boltzmann Distribution)。进一步观察一下这个分布:

P(x)=\frac{1}{Z}\prod_{i=1}^{k}\psi (x_{C_{i}})\\ =\frac{1}{Z}\prod_{i=1}^{k}exp\left \{-E(x_{C_{i}})\right \}\\ =\underset{指数族分布形式}{\underbrace{\frac{1}{Z}exp\left \{-\sum_{i=1}^{k}E(x_{C_i})\right \}}}

也就是说吉布斯分布满足指数族分布的形式,于是满足最大熵原理

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352