汉语连续语音识别及其在移动机器人导航中的应用

汉语连续语音识别及其在移动机器人导航中的应用

ID:33361987

大小:1.88 MB

页数:65页

时间:2019-02-25

汉语连续语音识别及其在移动机器人导航中的应用_第1页
汉语连续语音识别及其在移动机器人导航中的应用_第2页
汉语连续语音识别及其在移动机器人导航中的应用_第3页
汉语连续语音识别及其在移动机器人导航中的应用_第4页
汉语连续语音识别及其在移动机器人导航中的应用_第5页
资源描述:

《汉语连续语音识别及其在移动机器人导航中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要论文题目:汉语连续语音识别及其在移动机器人导航中的应用学科专业:机械电子工程研究生:马萧签名:指导教师:傅卫平教授签名:汉语连续语音识别的研究已经进行了十多年,取得了一定的成果,但仍然有许多重大的技术问题亟待解决。首先,声学模型的鲁棒性和准确性有待进一步提高,需要深入研究语境相关的声学建模,特别是汉语三音予模型;其次,当训练和识别的环境由于信道和背景噪声的不同或者说话人自身原因而导致系统识别率下降,需要我们深入研究自适应的方法;最后,我们还需要研究技术的可移植性,即如何将识别结果二次利用,以期加快新领域的研究速度。本文的主要研究工作围绕这

2、些关键技术问题展开。首先,研究了基于决策树的三音子建模技术。针对汉语语音识别,我们研究了决策树建模中必须解决的几个主要问题,包括汉语基本建模单元的选择、问题集的设计原则、决策树建模复杂度的优化。在建模单元的选择中,本文在比较以往汉语语音识别中用到的建模单元的基础上,提出了新的建模方法,该方法使用将六个零声母附加到标准声韵母序列的新的声韵母集合作为识别基元,并根据这种识别基元结合语音学和语言学的先验知识设计了问题集,利用基于决策树的状态共享策略建立上下文相关三元声韵母模型。在用基于HTKI具构建的识别系统上进行实验,结果表明,新的声韵母基元与标

3、准声韵母相比,识别性能有了很大提高。其次,在说话人自适应模块中比较了最大后验概率(MAP)算法和最大似然线性回归(MLLR)算法各自的优缺点,提出一种优化的自适应方法。这种方法综合了MAP的渐进性和MLLR的快速性,在语音识别系统运行过程中逐渐调整系统参数,不断使用新的数据来自适应。经实验论证表明,优化的自适应算法性能较之以往的自适应算法识别效果更好。最后,通过使用ATK工具,在MicrosoftVisualStudio.NET环境下编写应用程序,将识别的结果存储在一个变量中,继而用识别结果来导航一个移动机器人的行走。导航实验证明,本文的语音

4、识别系统应用是成功的,并且识别率可以达N85%以上。关键词:汉语连续语音识别;声学模型;HTK:说话人自适应;A1x;移动机器人导航AB汛ACTTitle:RESEACHONMADARINCONTINUOUSSPEECHRECOGNITIONANDAPPUCATIONlNMOBILEROBOTSWITHITMajor:MachineryElectronicEngineeringName:MaXiaoSupervisor:Prof.WeipingFuABSTRACTlSignature:丛丛幽Signature:臣噍肖Mandarinconti

5、nuousspeechrecognitionhasbeendoneformorethan10years.Althoughsomeachievementshavebeenobtained,manysignificantanddifficultproblemsarenotyetsolved.Firstly,thecontext—dependentacousticmodelingmustbepaidtomoreattentionandeffortstofurthgrimproveitsrobustnessandaccuracy,especially

6、toMandarintriphonemodeling.Secondly,becauseofthedifferentchannelandyawporspeaker’sreasons,systemrecognitionratewasdepressed.Thenitneedsustolucubrateontheresearchofadaptation.Finally,wealsoneedstIIdytheportabilityofthetechnologiestoshortenthecostoftimewiththeresearchinneware

7、as.Mythesisismainlytosolvetheaboveproblems.Firstly,westlldythecontexteffectsonMandarinspeechrecognitionandthedecisiontreebasedtriphoneacousticmodeling.Wediscussow"facedproblemsinthedecisiontreebasedMandarintriphonemodeling,includingtheselectionofMandarinbasephoneunits,thecr

8、iteriontodesignthecontext—relatedquestions,andthecomplexityoptimizationondecisiont

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。