基于语音样例查询的关键词识别方法研究

基于语音样例查询的关键词识别方法研究

ID:35070487

大小:5.95 MB

页数:70页

时间:2019-03-17

基于语音样例查询的关键词识别方法研究_第1页
基于语音样例查询的关键词识别方法研究_第2页
基于语音样例查询的关键词识别方法研究_第3页
基于语音样例查询的关键词识别方法研究_第4页
基于语音样例查询的关键词识别方法研究_第5页
资源描述:

《基于语音样例查询的关键词识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、'聲讚.寶夺国种遷篇若大赛UniversityofScienceandTechnoloofChinagy硕±学位论文'纖‘通..與敲海赛*'-?,V?'>-?:,I论文题目基于语音祥例杏询的矣键词巧别方法研堯?纠睾?作者姓名信息与通信工趕学科专业郭式到教援导师姓名完成时间二〇—六?年五月二牛逸种#我术夫#硕±学位论文參基于语音样例查询的关键词识别芳法研究作者姓名:刘学

2、学科专业:信息与通信工程导师姓名:郭武副教授完成时间二〇—六年五月八日:UniversitofScienceandTechnoloofChygyinaA’dissertationformastersdegree戀ResearchonKeywordReconitiongBasedonQuerbExamleyypA山’horsName;XueLiuSpeciality:InformationandCommu

3、nicationEnineeringgSuervisor:A.P.WuGuop化Finishedtime:Ma82016y,中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果,。除已特别加W标注和致谢的地方外论文中不包含任何他人己经发表或撰写过的研究成果一。与我同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。作者签名如(>、:签字円期:中国科学技术大学学位论文授权使用声明作为申请

4、学位的条件么一,学位论文著作权拥有者授权中国科学技术大学拥,有学位论文的部分使用权即:学校有权按有关规定向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可W将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可W采用影印、缩印或扫描等复制手段保存一、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相致。保密的学位论文在解密后也遵守此规定。因公开□保密(年)_、<^::1侵八作者签名导师签名:种.签字円期:签字巧期:^/仁

5、J3/摘要摘要基于语音样例登询的关键词识别是关键词识别的一个重要分支,该类关键词识别不需要考虑关键词对应的文本信息就能够从音频数据中快速地巧索并返回与査询关键词相关语音段。因此,该方法主要应用于缺乏语音资源和语音学知识的小语种。近年来,随着国际化进程的不断加快,针对小语种的语音处理特别是关键词识别迅速进入人们的视野一,成为现阶段语音处理的个热点问趣。本论文一主要针对该领域的两个问题进行研究:第,相对于传统声学特征,具有更窩可区分性特征的研巧;第H1,针对采

6、用隐马尔可夫模型(HiddenMarkovModel,HMM)的关键词建模识别,研巧样本巧缺情况下关键词模型的训练方法。近年来,随着学习方法的不断改进eetwo,深度神经网络(DpNeuralNerk,DNN)在模式识别中得到了诸多成功的应用,引起了学术界广泛的关注。在语音识别中-,基于DNN状态输出的DNNHMM相比髙斯混爸摸型(GaussianM-ixtureModelGMM)HMM基线系统大大降低了语音识别词错误率。,而由具有狭窄中间层,也称为瓶颈层(

7、BotleNeckBN)的DNN提取出的BN特征在,-GMMHMM基线系统中也取得了接近DNN-HMM模型的语音识别词错误率。本文在相同的关键词识别框架下比较两种不同的特征;感知线性预巧(PerceptualLinearPrediction,PLP)和BN特征,找出具有更商区分性的特征W提商识别系统性能。在基于语音样例査询的关键词识别中,采用统计建模的方法可W提升模型的稳键性。然而,在该类关键词识别中,关键词训练样本的数量极度缺乏,仅有十到二十个左右甚至更少。在这

8、种情况下,如何更化充分的利用关键词样本中的包含的有效信息非常至要?本文在HMM识别框架中,使用最大后验巧率(MaximumaPosterior)方法建立关巧词模型,提髙了识别系统在资巧巧缺情况下的识别性能。另外,还验证了H种後型训练方法在关巧词变化的情况下的有效性。本文提出的算法在标准的TIM打及藏语巧巧库上进行了实验,从实验结果上证明了这些算法的有巧性。关键巧S关键词识别深度神经网络BN特征晚马尔科夫模型最大后验概率IAbstractABSTRACT

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。