HMM隐马尔可夫模型简介

本篇为阅读<统计学习方法>(李航著),第10章马尔可夫模型,做的笔记。内容是本章节的部分,李大神的所有内容都很经典,我只是截取了工作中相关的理论部分进行了学习。还是用原书中的红白球的例子,后续如果有更实际的例子,会更新。哈哈,那些红白球,那些明亮的教室,朗朗的读书声,青葱的岁月,真的很令人怀念啊~

举个栗子~

略过拗口晦涩的名词解释,我们先看一个例子,还是那些熟悉的红白球~

假设有4个盒子,每个盒子里都装有红白两种颜色的球,盒子里的红白球由下表列出

盒子 1 2 3 4
红球数 5 3 6 8
白球数 5 7 4 2

抽球

开始:从盒子里以等概率随机选取一个盒子,从此盒子钟随机抽出一个球,记录颜色后,放回;
然后:从当前盒子转移到下个盒子。确定转移的盒子后,从这个盒子随机抽出一个球,记录后,放回;
转移规则:

    -  如果当前盒子是盒子1,那么下一个盒子一定是2 

    -  如果当前盒子是盒子2或盒子3, 那么分别以0.4 和 0.6 的概率,转移到左边或右边的盒子

    -  如果当前的盒子是盒子4,那么各以0.5的概率停留在盒子4或转移到盒子3.

如此下去,重复5次。

得到的观测序列记录为:

{红,红,白,白,红}

分析

  • 在上述例子钟,有两个随机序列,一个是盒子的序列(称之为状态序列,是隐藏的),一个是记录的球的颜色序列(称之为观测序列,是可观测的)。

  • 状态集合:盒子对应状态,那么此例中的状态集合为Q={盒子1, 盒子2, 盒子3, 盒子4}, N=4

  • 观测集合:球的颜色对应观测,观测集合为V={红,白},M=2

  • 观测记录为O={红,红,白,白,红},则状态序列和观测序列长度T=5

    初始时,是<等概率随机选取一个盒子>,所以初始概率分布为:

\pi =( 0.25,0.25,0.25,0.25)

​ 状态转移的概率的分布(对应转移规则, 脑补第一行的行标以及第一列的列标为{盒子1, 盒子2, 盒子3, 盒子4})为


A = \left[ \matrix{ 0 & 1 & 0 & 0\\ 0.4 & 0 & 0.6 & 0\\ 0 & 0.4 & 0 & 0.6\\ 0 & 0 & 0.5 & 0.5 } \right]

由每个盒子里的红球和白球数量,可得到观测矩阵为(行数为盒子数,列数为每个盒子里,观测到红球和白球的概率)
B = \left[ \matrix{ 0.5 & 0.5\\ 0.3 & 0.7\\ 0.6 & 0.4\\ 0.8 & 0.2 } \right]

哈哈哈,恭喜我们已经get到了HMM的三要素
(\pi, A, B)

预测算法

问题

盒子和球的模型
\lambda=(\pi, A, B)

其中

A = \left[ \matrix{ 0.5 & 0.2 & 0.3\\ 0.3 & 0.5 & 0.2\\ 0.2 & 0.3 & 0.5 } \right]

B = \left[ \matrix{ 0.5 & 0.5\\ 0.4 & 0.6\\ 0.7 & 0.3 } \right]

\pi=(0.2, 0.4, 0.4)

状态集合Q={1, 2, 3},观测集合V={红,白}

观测序列O(红,白, 红),那么最优状态序列是什么?

维特比算法

维特比算法用于隐马尔可夫模型HMM(hidden, markov model)的预测问题。

维特比算法:

输入:HMM模型和观测序列

输出:最优路径(最优状态序列)

寻找最优路径

(1)初始化

​ 在t=1时,求每一个状态观测到红球的概率
\delta(i)=\pi_ib_i(0_i)=\pi_ib_i(红)
带入实际数据:
\delta(1)=0.2*0.5=0.1, \delta(2)=0.4*0.4=0.16, \delta(3)= 0.4*0.7=0.28
(2)t=1为红球的条件下,t=2,在各个状态下,看到白球的概率。

记最大概率为
\delta_2(i)=max[\delta_1(j)a_{ji}]b_i(o_2)
记概率最大路径的前一个状态为j:
\psi_2(i)=arg max_{1\leqslant j\leqslant3 }[\delta_1(i)a_{ji}]
则:
\delta_2(1)=max_{j}(0.1*0.5, 0.16*0.3,0.28*0.2)*0.5=0.028, \psi_2(1)=3

\delta_2(2)=0.0504, \psi_2(2)=3

\delta_2(3)=0.042, \psi_2(3)=3

(3)在t=3时,和t=2时情况类型
\delta_3(1)=0.00756, \psi_3(1)=2

\delta_3(2)=0.01008, \psi_3(2)=2

\delta_3(3)=0.0147, \psi_3(3)=3

(4)以P表示最优路径的概率,则
P=max_{1\leqslant j\leqslant3}\delta_3(i)=0.0147
(5) 最优路径的终点
i=3
逆向找前面的节点:
\psi_3(3)=3

\psi_2(3)=3

所以最优状态序列为{3,3,3}


image.png

其他

马尔可夫性的两个假设:

(1)齐次马克可夫性

隐藏的马尔可夫链在任意时刻t的状态只依赖其前一时刻的状态,与其他时刻的状态无关

(2)观测独立性

任意时刻的观测只依赖于该时刻的马克可夫链的状态,与其他观测及状态无关

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,776评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,527评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,361评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,430评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,511评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,544评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,561评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,315评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,763评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,070评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,235评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,911评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,554评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,173评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,424评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,106评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,103评论 2 352