欢迎来到天天文库
浏览记录
ID:35062771
大小:6.80 MB
页数:68页
时间:2019-03-17
《基于回归神经网络的语音识别抗噪研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、夺留許掌满若大赛,UniversityofScienceandTechnologyofChina硕±学位论文戀论文题目基于巧於神经巧络的语音识别抗噪巧堯作者姓名对誓化学科专业应巧教孝导师姓名朽周化教投完成时间二〇—六年五月■夺函許每若来大赛硕±学位论文基于回归神经网络的语音识别抗噪研究作者姓名:时雪煌学科专业:应用数学导师姓名:杨周胚教授二Q—完成时间:六年五月UniversitfScienceandTe
2、chnoyologyofChina’Adissertationfo「mastersdegree一馨NoiseRobustSeechReconitionpgResearchbasedonReressiongDeeNeuralNetworkpAuthor:XueuShiySecialit;AliedMathematicspyppSuervisor:Prof.ZhouwanYanpggFinishedTime:May,2016中国科学技术大学学位
3、论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果,。除己特别加W标注和致谢的地方外论文中不包含任何他人己经发表或撰写过的研究成果一。与我同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名:旁4签字日期:7^/如日4!中国科学技术大学学位论文授权使用声明一作为申请学位的条件之,学位论文著作权拥有者授权中国科学技术大学I拥有学位论文的部分使用权,即;学校有权按有关规定向国家有关部口或机构i送交论文的复印件和电子版,允许论文被查阅和借阅,可W将
4、学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可^采用影印、缩印或扫[描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的一内容相致。保密的学位论文在解密后也遵守此规定。它f公开□保密年作者签名:Ak^导师签名 ̄-签字曰期.i1;签字曰期:I摘要摘要随着移动互联网时代的快速发展,语音识别应用变得越来越普及,语音交互由于其便捷性也逐渐被大众所接受。但是语音识别过程中环境噪声W及不同设备的信道多样性制约着自动语音识别系统的大规模应用。近年来,深度神经
5、网络(DeepNeuralNetwori<;,DNN)被成功应用到自动语音识别系统中,基于大数据训练,DNN相对于传统方法有着更好的鲁棒性,但是DNN在噪声环境下仍面临着识别率差的问题,,。而且由于深度神经网络模型的特点许多传统的抗噪方法很难被直接使用,:。为此本文主要做了如下工作一()本文在800小时的大规模训练数据下探索不同回归神经网络结构的-建模能力,包括输入输出结构,DNNAutoencoder结构,激活函数选择等,通过实验对比得到最优的神经网络结构。该方法通过DNN强大的非线性建模能力学习噪声语
6、音特征与干净语音特征的映射关系,然后将处理后的带躁语音输入至语音识别系统中进行语音识别从而提高语音识别率。本文的最优网络结构将噪声语音的词错误率从23.8%降低到18.2%,性能相对提升23.5%。(二)本文首次将混合密度网络(MixtureDensityNetwork,MDN)应用到抗噪语音识别,通过最大似然。混合密度网络将目标特征拟合为混合高斯分布函数优化神经网络,实验表明,MDN能够带来相对DNN有5.0%的词错误率下降,相对DNN有更强的拟合能力。(王)本文将回归神经网络应用到了远场语音识别W及
7、频谱扩宽中。远场语音主要为卷积噪声,本文实验表明回归神经网络对远程语音建模能够带来识别性能相对55.5%词错误率下降。同时若将回归神经网络与后端声学模型进行匹配性训练则又能够带来相对4.9%的性能提升。同时本文将回归神经网络应用16在频谱扩宽领域中,将8千赫兹语音特征通过回归神经网络映射成千赫兹语音特征,并对伪16千赫兹特征输入到16千赫兹语音识别系统中进行语音识别,实验表明,该方法可使得化识别率性能降低在5%W下的可容忍范围内,而训练资源可减少一半。关键词:回归神经网络,语音识别抗噪,混合神经网络,大
8、规模连续语音识I另J,频谱扩宽IABSTRACTABSTRACTWiththerapiddevelopme打tofmobUeI打1:ernetera,voicere
此文档下载收益归作者所有