序列比对中的马尔可夫模型

空位状态与马尔可夫模型

在空位罚分里面,我们将一对残基之间可能的比对关系,称为三种不同的状态



如图所示,M表示两个碱基彼此对上,但不一定相等,X表示X残基某碱基对上Y残基的一个空位,Y表示Y残基某碱基对上X残基的一个空位



序列比对可视为在M,X,Y这三个状态之间来回转换的过程,X可视为在Y残基的gap extending,Y也可视为在X残基上的gap extending;X,Y向M转移可视为关闭gap,M向X,Y转移可视为开启gap
根据图上对M,X,Y的定义有:
其中M为:


M

X为:
X

Y为:


Y

引入马尔可夫模型:
其中马尔可夫模型本次状态仅与上次状态有关,与上次再以前的状态都无关,由状态和转移概率组成

我们设X向X转移,Y向Y转移的概率为ε(gap extending),M向X,Y转移的概率为δ(gap open);那么X,Y向M转移的概率为1-ε,M向M转移的概率为1-2δ(可以通过全概率公式计算)
有了右下角的表,我们可以计算任意状态的概率值

比方说XMMY这个状态

序列比对与HMM

上述模型仅考虑了空位状态的情况,并不代表所有的序列比对情况,也就是说我确定是M状态,其中M状态还包括match和mismatch,这两种情况的打分是不一样的,那么仅靠普通马尔可夫模型是么办法区分的,所以我们采用HMM来做模型
HMM相对于马尔可夫模型引入了符号的概念,即在状态转移链的基础上引入了可观察的符号项



除了有转移概率,还有生成概率



上半部分是状态转移,下半部分是观察概率
简而言之即:
公式

转移概率即状态之间转移到可能性,而观察概率就是具体为A,T,C,G四个碱基的概率
最终的概率值等于转移概率乘观察概率

示例
在M状态中,match为两个碱基S-S(匹配正确的),mismatch为两个碱基S-T(匹配错误的),因此这两个观察概率是不一样的


M状态的观察概率为pab(其中是指A-A,G-G,C-C,T-T这四种情况出现的概率);X,Y的观察概率为qa(即A,T,C,G四种碱基比对到空位的概率)
以上各种情况的概率可以做成一张表,类似于动态规划的得分表,当然pab,qa组成的表中,其数值需要进行训练

最终乘相应的转移概率和观察概率即可,最后利用动态规划的回溯来求解即可,类比动态规划算法,采用HMM模型也需要事先根据序列的先验信息规定P[M(1,1)],P[X(1,1)]和P[Y(1,1)]的值,然后根据上图的迭代公式进行回溯
这里的PM即pab,Px,Py即为qa

对比下传统的动态规划算法,采用概率计算可能速度更快


当然,这些转移矩阵概率和观察矩阵概率需要通过训练集来训练得到,一般情况下根据序列情况进行参数训练,训练好以后可用于预测测试集的序列比对情况
可参考://www.greatytc.com/p/866bfb75586a

参考:https://www.bilibili.com/video/BV1Et411p7FB?p=14

https://www.bilibili.com/video/BV1Et411p7FB?p=15

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,591评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,448评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,823评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,204评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,228评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,190评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,078评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,923评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,334评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,550评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,727评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,428评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,022评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,672评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,826评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,734评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,619评论 2 354

推荐阅读更多精彩内容