本节课主要内容HMM三个基本问题如何求解
首先明确两种observe有两种,离散/连续。语音识别中使用连续状态(MFCC特征值是连续的)。连续的比较复杂,需要用函数(GMM)拟合。离散的简单,用矩阵描述即可。
review三个基本问题
1. Evaluation
粗暴解法:遍历每一种可能的hidden state/observe组合,求加和求概率。
优化解法Forward:类似数学归纳法。找到n和n+1之间的关系,再计算第一项。避免重复计算。
2.decoding
backward:和forward相反
区别1:在时间t,beta看到的是t+1及以后的,必须从i隐状态出发,后面无所谓。alpha是已知0到t,求t+1
区别2:qt在alpha里是待计算概率,在beta里是条件
近似:假设B和A无关,也就是0-t和t+1以后无关
3. Train
EM算法,回头来补充