基于发音特征的声效相关鲁棒语音识别算法.pdf

基于发音特征的声效相关鲁棒语音识别算法.pdf

ID:55399005

大小:720.96 KB

页数:5页

时间:2020-05-15

基于发音特征的声效相关鲁棒语音识别算法.pdf_第1页
基于发音特征的声效相关鲁棒语音识别算法.pdf_第2页
基于发音特征的声效相关鲁棒语音识别算法.pdf_第3页
基于发音特征的声效相关鲁棒语音识别算法.pdf_第4页
基于发音特征的声效相关鲁棒语音识别算法.pdf_第5页
资源描述:

《基于发音特征的声效相关鲁棒语音识别算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、JournalofComputerApplicationsISSN10o1.90812015—01.1O计算机应用,2015,35(1):257—261CODENJYIIDUhttp://www.joca.ca文章编号:1001.9081(2015)01.0257.05doi:10.11772/j.issn.1001—9081.2015.01.0257基于发音特征的声效相关鲁棒语音识别算法晁浩’,宋成,彭维平(河南理工大学计算机科学与技术学院,河南焦作454000)($通信作者电子邮箱ehaohao@hpu.

2、edu.El1)摘要:针对声效(VE)相关的语音识别鲁棒性问题,提出了基于多模型框架的语音识别算法。首先,分析了不同声效模式下语音信号的声学特性以及声效变化对语音识别精度的影响;然后,提出了基于高斯混合模型(GMM)的声效模式检测方法;最后,根据声效检测的结果,训练专门的声学模型用于耳语音识别,而将发音特征与传统的谱特征一起用于其余4种声效模式的语音识别。基于孤立词识别的实验结果显示,采用所提方法后语音识别准确率有了明显的提高:与基线系统相比,所提方法5种声效的平均字错误率降低了26.69%;与声学模型混合语

3、料训练方法相比,平均字错误率降低了l4.51%;与最大似然线性回归(MLLR)自适应方法相比,平均字错误率降低了15.30%。实验结果表明:与传统谱特征相比发音特征对于声效变化更具鲁棒性,而多模型框架是解决声效相关的语音识别鲁棒性问题的有效方法。关键词:语音识别;声效;发音特征;多模型框架;孤立词中图分类号:TP391.42;TN912.34文献标志码:ARobustspeechrecognitionalgorithmbasedonarticulatoryfeaturesforvocalefortvariab

4、ilityCHA0Hao。.SONGCheng.PENGWeiping(CollegeofCompu~rScienceandTechnology,ttenanPolytechnicUniversity,JiaozuoHenan454000,China)Abstract:AimingattheproblemofrobustspeechrecognitionforVocalEffort(VE)variability,aspeechrecognitionalgorithmbasedonmuhi-modelframe

5、workwaspresented.Firstly,changesofacousticcharacteristicsunderdiferentVEmodes,aswella8influenceofthesechangesonspeechrecognition,wereanalyzed.Secondly,aVEdetectionmethodbasedonGaussianMixtureModel(GMM)Wasproposed.Finally,thespecialacousticmodelsweretrmnedto

6、recognizewhisperspeechiftheresultofVEdetectionWaswhispermode;otherwiseartieularotyfeatures,incompanywithspectrumfeatures,wereintroducedtorecognizespeechoftheremainingfourVEmodes.Theexperimentsconductedonisolated—wordrecognitionshowthatsignificantimprovement

7、ofrecognitionaccuracycanbeachievedwhenusingproposedmethod:comparedwiththebaselinesystem,themixedcorpustrainingmethodandtheMaximumLikelihoodLinearRegression(MLLR)adaptationmethod,theaveragecharacterelTorrateoffiveVEmodesisreducedby26.69%,14.51%and15.30%respe

8、ctively.TheseresultsprovethatarticularotyfeatureismorerobustthanthetraditionalspectrumfeaturewhenconfrontingVEvariability,andthemulti—modelframeworkisanefficientmethodforrobustspeechrecognitionrelatedt

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。