前面几篇文章在以iOS客户端为例的情况下,大致说了kaldi部署在服务端的在线识别,以及kaldi在iOS项目中的本地识别。因为所研究的东西最终都是要在实际的项目中或者产品中去使用,所以为了更好的看到自己所研究的东西的结果,我才做了前面的一些demo来实际的看到效果和使用情况。当然后面还有好玩的,我都会发出实际应用的demo出来。文章我还会继续更新,因为后面好玩的还有声纹识别,命令词唤醒。
在线识别
在线识别简单的理解就是将解码器放在服务端,以kaldi为环境来识别。解码这一块kaldi也提供了文件解码的例子,可以稍加改造用于实时流识别,当然我也将改造后的解码代码放在前面的文章中,有需要的可以参考。
参考demo:https://github.com/andyweiqiu/SpeechRecognition
本地识别
这里的本地识别是将kaldi源代码编译成库放到iOS或者Android项目中,以提供解码的环境。当然难点就是kaldi的编译。解码这一套都是通用的,不管是在线识别还是本地识别。我这里也提供了demo,有需要验证自己模型的,可以下载demo,在工程中直接替换模型文件,运行,不用管其他实现。在运行demo的过程中有任何问题可以直接联系我。