语种识别中的语音段表示方法研究

语种识别中的语音段表示方法研究

ID:35097664

大小:6.25 MB

页数:71页

时间:2019-03-17

语种识别中的语音段表示方法研究_第1页
语种识别中的语音段表示方法研究_第2页
语种识别中的语音段表示方法研究_第3页
语种识别中的语音段表示方法研究_第4页
语种识别中的语音段表示方法研究_第5页
资源描述:

《语种识别中的语音段表示方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、'夺固种違據若大赛UniversitofScienceandTechnologyofChinay硕±学位论文諭捕‘.",v来*.-?'-?.论文题目语种巧别中始语者段臭示方法研免作者姓名在禱聋学科专业息与通信工程信札奈教投東方到教投导师姓名載二—六年五〇月完成时间木国#每若术大赛硕dr学位论文戀j吾种i/巧忡的语音段表示方法研究作者姓名:崔瑞莲学科专业:信息与通倍工程:-导师姓名:戴礼紫教授宋彦割教授二〇—完成曰寸间:六年五月Uni

2、versityofScienceandTechnologyofChinaAidissertationfo「mastersdegreeResearchonUtteranceReresentationinLanuaepggIdentificationAuthor:RuilianCuiSecialit:InformationandCommunicationEnineeringpygSuervisor:Prof.LironDaipgAssociateProf.YanSongFinishedT

3、ime:Ma2016y,中国科学技术大学学位论文原创性声明本人明所M义的学化论义1;,化本人礼巧帅巧巧K进行研究化所化待的成L来。除Li特别加:U小化和致谢的地A外,论义小不包含化何他人Li始发衣或撰i-过的研%化尖。j巧NI;作的1吨屯对本研究所做的巧献均。巧论文中化/明啸的说明C.lW也k.作巧篇名:葦施畫签,。期:中国科学技术大学学位论文授权使用声明-作为申诸学位的条件么,学位论文茗作权拥巧者授权中国科学技术人学目拥巧学位论文的部分使用权,P:学校巧权按巧关规化向聞《巧义部n或机构送'L么论文的把印化和电子版,允许论文被巧阅

4、和借阅,川乂将学位论文编入《中闲》等巧关数,可W采用影印学位论文伞文数据库据库进行检索、缩印或描巧复'制手段保巧、汇编学位论文=本人提交的电子文巧的内容和纸质论文的內巧相-致。保密的学位论文在解密后也遵守此规定。公开□保密年作者签名:输令导师签也方心雀羣弘.fc.ik:口期:?签字U期M签字如I摘要摘要L一语种识别anuaeIdentification,LID是对段语音自动识别出其所属语(gg)一,言的种类的过程。由此可知,语种识别是种针对语音段进行的模式识别因一个关键问题即是如何得到用W描述语音段的表示此语种识别中

5、的。语种识别一、技术中包含了特征提取和语音识别前端模型等系列语音信号处理领域的核屯,一一具有定的科学研巧价值,。同时作为语音领域的种前端处理技术语种识别在多语种语音识别、跨语种通信系统W及军事监听等领域有着广泛的应用。传统的语种识别方法主要有基于音素搭配与基于底层声学特征的两大系统。传统方法中虽然长时测试性能取得了很大的进展,但仍存在着短时与方言识則率低等问题。随着深度神经网络(DeepNeuralNetwork,DNN)的发展与成功应用,一个新的研巧领域,语种识别有了。在前端特征提取上提出基于深度瓶颈特征结DBott--合全差异空间模型(e

6、el畑eckFeatureTotalVariabilitDBFTV,py,)该方法将深度神经网络中间瓶颈隐层的信息成功运用到语种识别中。在后端建模方法上,DNN-V则根据DNN区分性建模的能力充分利用其输出层信息,如/iector方法,nveBackround即利用DNN输出层音素状态后验重新估计通用背景模型(UirsalgUBM一Model。个iU底层声学特征为输入、音素状态后验为输出训练,)然而对于得到的深度神经网络,我们认为该网络从输入层至输出层依次反映了语音从底层声学特征到窩层语义与音素相关的较为完备的信息,而且各层信息之间具有一N互

7、补性。因此本文就基于同DN不同层信息如何得到语音段的表示展开研巧,一具体而言即是同时利用同神经网络的中间瓶颈层和输出层信息。首先,对于从巧度神经网络输出层提取的音素状态倾级特征,可W认为其是在各侦上展开的音素状态序列,则每段语音可W通过计算其统计量作为语音段表示。得到的语音段表示是向量形式的,则可直接用区分性模型对其进行分类。具体则根据其特性。并根据神经网络,使用合适的核西数进行了支持向量机分类DBF-TV不同层信息的互补性进行融合,能够提升语种识别系统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。