基于概率加权平均的Mel 子带特征重建算法

基于概率加权平均的Mel 子带特征重建算法

ID:38202253

大小:310.04 KB

页数:4页

时间:2019-05-25

基于概率加权平均的Mel 子带特征重建算法_第1页
基于概率加权平均的Mel 子带特征重建算法_第2页
基于概率加权平均的Mel 子带特征重建算法_第3页
基于概率加权平均的Mel 子带特征重建算法_第4页
资源描述:

《基于概率加权平均的Mel 子带特征重建算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第10期电子学报Vol.32No.102004年10月ACTAELECTRONICASINICAOct.2004基于概率加权平均的Mel子带特征重建算法罗宇,杜利民(中科院声学所语音交互技术研究中心,北京100080)摘要:本文提出基于概率加权平均的Mel子带特征数据重建算法.该算法选择K个最优重建结果的概率加权平均作为被加性噪声掩蔽的语音特征分量的估计.实验结果表明,基于概率加权平均的语音特征数据重建算法降低了重建误差,减少了帧间突变现象,增强了Mel子带特征的帧间连续性,从而显著提高了语音识别系统对加性噪声的鲁棒性能.关键词:缺失特征方法;数据重建

2、;语音识别中图分类号:TN912134文献标识码:A文章编号:037222112(2004)1021738204Probability2WeightedAverageAlgorithmforMel2FrequencyFilter2BankVectorReconstructionLUOYu,DULi2min(CenterofSpeechInteractionTechnologyResearch,InstituteofAcoustics,ChineseAcademyofSciences,Beijing100080,China)Abstract:Inthis

3、paper,probabilityweightedaverage(PWA)algorithmisproposedtoreconstructMel2frequencyfilter2bankvectors.Theprobability2weightedaverageofK2bestreconstructed/missing0componentsofMel2frequencyfilter2bankvectorsistakenastheestimationofcomponentsmaskedbyadditivenoise.Experimentalresults

4、showthatPWAalgorithmcanreducereconstructioner2ror,increasethecontinuitybetweenneighbormel2filterbankvectorsandgreatlyimproveautomaticspeechrecognition(ASR)system.srobustnessagainstadditivenoise.Keywords:missingdatamethod;datareconstruction;robustspeechrecognition;datareconstruct

5、ion重建算法在重建出完整语音特征的同时,产生了多种重建误1引言差.阻碍了语音识别系统性能的进一步提高.当语音受噪声干扰时,语音识别系统性能急剧下降.缺失本文提出了基于概率加权平均的语音特征数据重建算[1~3]特征方法是提高语音识别系统噪声鲁棒性的一种方法.法,通过对比试验研究了该算法对语音识别系统噪声鲁棒性该方法考虑到噪声和语音在时域和频域具有不同能量分布的能的改善效果.同时,本文研究了候选模型数K对基于概率特性,把含噪语音谱局部信噪比(LocalSNR)低于某个门限的加权平均的语音特征数据重建算法的影响.部分标记为/缺失0,即进行缺失分量估计(Mi

6、ssingComponents论文的第2部分分析了基于单高斯模型集的重建算法引Identification)或者掩蔽估计(MaskEstimation).经过缺失分量估起重建误差的原因;第3部分提出了基于概率加权平均的语计后,可以直接在高信噪比的/可靠0部分进行语音识别,即模音特征重建算法;第4部分通过实验,对比分析了基于概率加型边缘化方法;也可以先重建出语音特征的缺失分量,再进行权平均的语音特征重建算法对语音识别系统性能的影响;第语音识别,即数据重建方法.缺失特征方法没有对噪声特性进5部分研究了候选模型个数和语音识别系统性能之间的关行假设和限制,因此

7、能够适用于更多声学环境,特别是当噪声系;论文的第6部分给出了最后的结论.为不稳定噪声的时候,缺失特征方法具有更多潜在的优越性.2基于单高斯模型集的数据重建基于单高斯模型集的缺失特征数据重建算法能够根据/可靠0语音特征重建出/缺失0语音特征.重建后的语音特征本文语音特征重建算法所处理的对象是Mel子带特征矢较好的重现了原始纯净语音特征的形态和分布,提高了语音量.子带特征分析采用在Mel频率域均匀分布的26个三角滤识别系统对各类音子的正识率,增强了语音识别系统对加性波器,Mel子带特征矢量每一维分量都代表了语音信号在对噪声的鲁棒性.另一方面,基于单高斯模型

8、集的语音特征数据应Mel子带内的能量.收稿日期:2002207218;修回日期:2003211

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。