台大数位语音处理第四课part1

本节课主要内容HMM三个基本问题如何求解

首先明确两种observe有两种,离散/连续。语音识别中使用连续状态(MFCC特征值是连续的)。连续的比较复杂,需要用函数(GMM)拟合。离散的简单,用矩阵描述即可。


离散/连续状态

review三个基本问题


三个基本问题

1. Evaluation

粗暴解法:遍历每一种可能的hidden state/observe组合,求加和求概率。


粗暴解法

优化解法Forward:类似数学归纳法。找到n和n+1之间的关系,再计算第一项。避免重复计算。


image.png

2.decoding

backward:和forward相反


image.png

区别1:在时间t,beta看到的是t+1及以后的,必须从i隐状态出发,后面无所谓。alpha是已知0到t,求t+1
区别2:qt在alpha里是待计算概率,在beta里是条件

近似

近似:假设B和A无关,也就是0-t和t+1以后无关

3. Train

EM算法,回头来补充

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容