欢迎来到天天文库
浏览记录
ID:55399005
大小:720.96 KB
页数:5页
时间:2020-05-15
《基于发音特征的声效相关鲁棒语音识别算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、JournalofComputerApplicationsISSN10o1.90812015—01.1O计算机应用,2015,35(1):257—261CODENJYIIDUhttp://www.joca.ca文章编号:1001.9081(2015)01.0257.05doi:10.11772/j.issn.1001—9081.2015.01.0257基于发音特征的声效相关鲁棒语音识别算法晁浩’,宋成,彭维平(河南理工大学计算机科学与技术学院,河南焦作454000)($通信作者电子邮箱ehaohao@hpu.
2、edu.El1)摘要:针对声效(VE)相关的语音识别鲁棒性问题,提出了基于多模型框架的语音识别算法。首先,分析了不同声效模式下语音信号的声学特性以及声效变化对语音识别精度的影响;然后,提出了基于高斯混合模型(GMM)的声效模式检测方法;最后,根据声效检测的结果,训练专门的声学模型用于耳语音识别,而将发音特征与传统的谱特征一起用于其余4种声效模式的语音识别。基于孤立词识别的实验结果显示,采用所提方法后语音识别准确率有了明显的提高:与基线系统相比,所提方法5种声效的平均字错误率降低了26.69%;与声学模型混合语
3、料训练方法相比,平均字错误率降低了l4.51%;与最大似然线性回归(MLLR)自适应方法相比,平均字错误率降低了15.30%。实验结果表明:与传统谱特征相比发音特征对于声效变化更具鲁棒性,而多模型框架是解决声效相关的语音识别鲁棒性问题的有效方法。关键词:语音识别;声效;发音特征;多模型框架;孤立词中图分类号:TP391.42;TN912.34文献标志码:ARobustspeechrecognitionalgorithmbasedonarticulatoryfeaturesforvocalefortvariab
4、ilityCHA0Hao。.SONGCheng.PENGWeiping(CollegeofCompu~rScienceandTechnology,ttenanPolytechnicUniversity,JiaozuoHenan454000,China)Abstract:AimingattheproblemofrobustspeechrecognitionforVocalEffort(VE)variability,aspeechrecognitionalgorithmbasedonmuhi-modelframe
5、workwaspresented.Firstly,changesofacousticcharacteristicsunderdiferentVEmodes,aswella8influenceofthesechangesonspeechrecognition,wereanalyzed.Secondly,aVEdetectionmethodbasedonGaussianMixtureModel(GMM)Wasproposed.Finally,thespecialacousticmodelsweretrmnedto
6、recognizewhisperspeechiftheresultofVEdetectionWaswhispermode;otherwiseartieularotyfeatures,incompanywithspectrumfeatures,wereintroducedtorecognizespeechoftheremainingfourVEmodes.Theexperimentsconductedonisolated—wordrecognitionshowthatsignificantimprovement
7、ofrecognitionaccuracycanbeachievedwhenusingproposedmethod:comparedwiththebaselinesystem,themixedcorpustrainingmethodandtheMaximumLikelihoodLinearRegression(MLLR)adaptationmethod,theaveragecharacterelTorrateoffiveVEmodesisreducedby26.69%,14.51%and15.30%respe
8、ctively.TheseresultsprovethatarticularotyfeatureismorerobustthanthetraditionalspectrumfeaturewhenconfrontingVEvariability,andthemulti—modelframeworkisanefficientmethodforrobustspeechrecognitionrelatedt
此文档下载收益归作者所有