欢迎来到天天文库
浏览记录
ID:15849853
大小:187.00 KB
页数:4页
时间:2018-08-06
《有效提高语音识别速度的策略》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、有效提高连续语音识别速度的策略李军收稿日期:2004-12-18;审稿人:李从信;编辑:陆雅玲作者简介:李军(1969-),男,硕士,讲师,主要从事语音技术及其应用方面的研究,刘晓明,刘贤梅(大庆石油学院 计算机与信息技术学院,黑龙江 大庆,163318)摘要:连续语音识别的特点是数据量大且计算复杂,因此提高识别算法的效率是系统成败的关键之一。本文中以半连续HMM为例,分析了影响Viterbi算法效率的主要原因,探讨了提高该算法效率的3种实用策略,即码本剪枝、Beam剪枝及降低精度,在保证一定识别率的前提下,使得搜索处理
2、更加有效,提高了搜索的速度。文中给出了3种方法的实验对比数据,实验结果表明,所述方法可有效地提高Viterbi算法的效率。关键词:SCHMM;语音识别;码本;剪枝中图分类号:TN912.34文献标识码:A文章编号:0引言目前,连续语音识别系统主要使用基于隐含马尔科夫模型(HMM)[1]的统一框架,采用时间同步的Viterbi算法[2]进行解码。在实际应用中,Viterbi解码算法的计算代价相当可观,为此,有效提高其搜索速度显得非常重要。文中从改进算法的角度讨论了几种提高声学层搜索速度的方法,这些方法是基于半连续HMM框架
3、的,类似的思想也可以应用到其它类型的HMM。1Viterbi搜索算法分析对于一个语音识别系统,首先要采用B-W算法训练语音样本数据,得到语音模型参数,然后进行语音解码,解码的过程主要是利用已知语音模型参数计算一段特定语音的最大似然概率,以求得该语音样本属于哪些语音识别单位。Viterbi算法就是语音识别中常用的解码方法,其主要思想描述为假设识别系统的词汇表容量为V,其中每个词条表示为。设每一词条中包含个状态,记为。采用由左向右无跨越型SCHMM,转移概率记为,,词条内的状态产生输出矢量的概率密度记为:。现在假设一段连续语
4、音所对应的特征矢量序列是,其所经历的状态序列是。要根据给定的参数,和以及Y,求最佳的X,由X即可求得相应之词序列。求此X的步骤为⑴为每一帧的每个状态设置寄存器,和,用来保存当前帧所处状态的最大似然值,用来保存当前帧所处状态的转移路径,用来保存跳入当前帧所处状态的音节序号,在时序时,将按照下式计算所得的参数存入相应寄存器:(1)⑵在时序时,对于所有状态,用下列递推计算式来计算:(2)⑶在递推过程中按如下方法计算和:①如果,发生自身跳转。②如果并且,发生词间跳转。③如果并且,发生词内跳转。在上述递推计算完成后,得到最后一组系
5、数。由其中最大者可以得到最优状态路径的终点状态,然后利用,由求,由求等,这样在时间序列上可求得一条最优路径,将这条状态路径代入即可求出相应的词序列,从而完成解码任务。当把⑴~⑶步的Viterbi搜索算法用于SCHMM模型时,它的时间消耗是相当大的。这主要是:SCHMM模型使用了一组全局共享的码本,在计算某个状态在当前帧下产生的概率密度P时,要对相当多的高斯函数求值,这是导致Viterbi搜索算法速度较慢的主要原因。针对这个原因分析解决方法。2提高搜索速度的几个策略2.1码本剪枝策略表2对应状态码本号前10位权重排序码本号
6、权重码本号权重8392.33×10-1932.92×10-26511.88×10-13072.61×10-29689.87×10-29902.60×10-21487.77×10-28052.26×10-21103.55×10e-25221.86×10-2在基于SCHMM的连续语音识别中,较大的码本数被所有模型和所有状态共享,这样用来描述每个模型及状态的码本就相当多[3],实际上,对于一个状态而言,通常只要少量的码本就可以较精确地描述该状态的特性,去掉那些对状态贡献小的码本并不会造成大的精度损失,相反,由于减少了状态描述的
7、码本,可大大减少计算状态概率密度的复杂性,从而可提高搜索速度。表1某状态码本号为1~10的权重码本号权重码本号权重17.75×10-1964.71×10-22429.98×10-1671.15×10-7531.76×10-24585.30×10-1448.02×10-8697.23×10-451.59×10-60105.81×10-89表3码本剪枝实验码本数耗时/s识别率/%1024182871.451271171.425640871.412827971.46419371.4表1,2是一组关于码本对状态影响的实验结果。从
8、表1中的1~10号码本的权重可以看出,不同码本的权重差距相当大,例如:3号码本,它的权重比9号码本小10241倍,因而它对当前状态的影响远远低于9号码本。表2中是对当前状态贡献最大的前10个码本按权重从大到小的排序,可以看出,这些码本的权重同表1中某些码本相差很大,在指数域上相差几十到上百的数量级,因此忽略那些贡献小
此文档下载收益归作者所有