参考论文:Semi-Orthogonal Low-Rank Matrix Factorization for Deep Neural Networks(半正交低秩矩阵分解DN...
做完本地语音识别后,就开始研究语音评测,这方面的资料也是不全,所以进度也搞慢了一点。最近也算是做出了一点成果,效果也不错,所以想着跟大家分享一下。首先还得感谢https://...
前面几篇文章在以iOS客户端为例的情况下,大致说了kaldi部署在服务端的在线识别,以及kaldi在iOS项目中的本地识别。因为所研究的东西最终都是要在实际的项目中或者产品中...
由于最近一直在弄kaldi本地化,所以这系列文件一直来不及更新。 这篇主要是讲解librispeech运行的run.sh脚本 设置参数 下载100小时音频数据及语言模型相关资...
iOS在线识别:https://www.jianshu.com/u/3c2a0bd52ebc 前面部分讲的跟语音识别关系不大,这部分开始讲解语音识别相关的内容,首先接上部分内...
kaldi官方给出的解码命令是online2-wav-nnet3-latgen-faster,它的源码我在“基于kaldi的iOS语音识别(本地)+05+解码”已经贴出来了,...
下面是对kaldi音频文件解码的改造,用于实时流解码。
1. 背景 "Hey,Siri", 很好奇iPhone是如何从一堆嘈杂的声音中识别出这句对她的呼喊的?当然大的来说,这是个语音识别问题,但是完全按照NLP(Neuro-Lin...
iOS在线识别:https://www.jianshu.com/u/3c2a0bd52ebc 因为GStreamer的操作几乎都是在一个“黑盒”里面进行操作,所以它的这一套操...
iOS在线识别:https://www.jianshu.com/u/3c2a0bd52ebc kaldi静态库集成到项目中没问题后,现在就需要采集音频发送给解码器去解码。 我...
iOS在线识别:https://www.jianshu.com/u/3c2a0bd52ebc 集成kaldi是这里最关键的一步,这一步没成功,也就没有后续了。 编译 由于编译...
iOS在线识别:https://www.jianshu.com/u/3c2a0bd52ebc 该系列文章讲述的都是iOS本地语音识别。最近花了点时间将kaldi编译成iOS静...
训练:代码 #test tri1 model local/thchs-30_decode.sh --nj $n "steps/decode.sh" exp/tri1 data...