短时语种识别若干问题研究

短时语种识别若干问题研究

ID:33836515

大小:8.90 MB

页数:85页

时间:2019-02-28

短时语种识别若干问题研究_第1页
短时语种识别若干问题研究_第2页
短时语种识别若干问题研究_第3页
短时语种识别若干问题研究_第4页
短时语种识别若干问题研究_第5页
资源描述:

《短时语种识别若干问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学硕士学位论文短时语种识别若干问题研究作者姓名:学科专业:导师姓名:完成时间:王梦鸽信号与信息处理戴礼荣教授宋彦讲师二。一四年五月十五日IIIIIIIIIIIIIlY2601443UniversityofScienceandTechnologyofChinaAdissertationformaster’SdegreeResearchonProblemsinSpokenLanguage—。1●一1●一IdentifiCatiOnwithShort--DurationSegmentsAuthor’SName:MengGe

2、WangSpeciality:SignalandInformationProcessingSupervisor:Prof.LiRongDaiDr.YanSongFinishedtime:May15m,2014中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:j挚签字日期:—丝坐±二星丝中国科学技术大学学位论文授权使用声明作为申

3、请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。彳公开口保密(——年)作者签名:筠姆导师签名:签字日期:艘l半:§:≥鱼签字日期:趔f丝』!;矿摘要随着语种识别技术的发展,在测试语句时长超过30s的前提下,

4、如今的自动语种识别系统已基本能够达到实用所需的性能指标。然而在很多实际情况中,长达30s的测试时长要求是无法被大多数使用者所接受的,可当测试语句的有效时长减小到lOs以下,现有语种识别系统的性能却又面临着较为严峻的挑战。本论文围绕语种识别系统在短时测试条件下识别性能不佳的问题展开研究,具体有以下几方面内容:针对短时语音段难以利用统计方法获得准确表示的问题,论文通过对短时特征易受噪声影响且在模型空间中表达不准的原因进行分析,提出了用样例的方法替代传统的统计方法以克服数据稀疏问题,将模版空间构造和特征编码引入语种识别系统,最终得到对由

5、时长减少引起的相关差异更加鲁棒的短时语音段新表示,从而提高短时语种识别的性能。实验表明,采用基于样例的方法获得更具时长差异鲁棒性的语音段表示后,系统的短时识别性能有比较明显的提升。关于如何从短时语音段表示中有效挖掘语种信息的问题,论文提出了将深层神经网络作为语种识别系统的后端分类器,利用网络模型的多层非线性映射得到短时样本更具语种区分性的高层表达,从而更有效地对其进行分类。同时论文还对深层神经网络分类器在训练过程中遇到的过拟合问题展开了研究,通过引入dropout策略对其加以抑制。实验表明,使用深层神经网络作为语种识别系统的后端分

6、类器对提高系统的短时识别性能有很大帮助。为了更进一步利用深层神经网络的高层表达能力,论文提出了将其应用于语种识别系统的特征提取,通过提取语种区分能力更强的短时语音段特征来提高系统的短时识别性能。最后论文对基于深层神经网络的语种识别特征进行了移位差分扩展以加入更多动态信息,并利用深层自动编码器对扩展特征进行降维。实验表明,深层神经网络作为特征提取器的使用非常有效地提升了语种识别系统在短时测试条件下的识别性能,所提取的特征经过差分扩展及非线性降维之后,系统的短时识别性能又得到进一步提升。关键词:语种识别短时性能特征编码深层神经网络bo

7、ttleneck特征深层自动编码器摘要IIAbstractWiththeevolutioninlanguagerecognitiontechnology,theperformancesofmostcurrentlanguagerecognitionsystemshavemettherequirementofpracticaldeploymentifthedurationoftestutterancesislongerthan30seconds.However,insomeurgentcircumstances,thedemando

8、fa30stestutteranceisnotacceptabletomanyusers.AndifthedurationoftestutterancesreducetolOsorless,eventhemoststate—ofthe—artsys

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。