欢迎来到天天文库
浏览记录
ID:34790171
大小:1.57 MB
页数:63页
时间:2019-03-10
《浅议基于听觉模型的语音特征提取和有限命令的连续语音识别的算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、南京理工大学硕士学位论文基于听觉模型的语音特征提取和有限命令的连续语音识别的算法研究姓名:王海军申请学位级别:硕士专业:控制理论与控制工程指导教师:黄志同2001.1.1中:Jr.!lllr-I[-中文摘要Y398170本文主要工作包括四个部分:①在对人耳听觉进行深入研究的基础上,提取基于听觉模型的语音特征,设计了以下几个环节:带通滤波、高频提升、全波整流、积分、归一化,分帧。②首先介绍了广义模型,然后根据动态规划原理建立模板,为了检验所建立的模板,对十个数字O—9进行了识别。识别率达到了100%。⑨介绍了传统的Viterbi
2、算法,指出了它的不足,提出了动态句序字位规则,对传统的Viterbi算法改进后,并用其对有限的命令进行识别,取得了很好的效果。最后对于五本军事著作进行全匦统计,建立相应的数据库。关键词一语音识别,听觉模型,广义模型,动态时间规正,隐马尔可夫模型,viterbi算法南京理工大学硕士论文ABSTRACTThemainWOrkofthedissertationconsistsoffourparts.First.onthebasisofthoroughresearchonhumanears.extractthephoneticfeat
3、urefoundedonacousticalmodel.severaltachesaredesigned:bandpassfilter.hilghfrequencyrising、wholewaverectification、unifyingandseparatingframe.Second,TheGeneralModeliSintroducedandtemplatewasconstructedbydynamicprogram.Totestthetemplate,tennumbersfromlto9wasrecognized.T
4、hecorrectrecognitionoftheexperimentreach100%.ThirdthetraditionalViterbialgorithmiSintroducedandshortcomingiSpointedout.Tomendit.orderofsentenceandpositionofWOrdruleiSbroughtforward.LimitedcommandsarerecognizedbythemendedViterbialgorithm,asatisfyingresultisobtained.L
5、ast,databaseWaSsetuponthebasisofthecomprehensivestatisticofthefivemilitaryWOrks.Keywords:Speechrecognition,Acousticalmodel,GeneralModel,Dynamictimewarping,HiddenMarkovModel,ViterbiAlgorithm1II-论1.I前言i绪论自动语音识别(AutomaticSpeechRecognition,ASR)一直是人类追求的理想,也是近50年来科研人员孜孜以求
6、的方向。其终极目标就是研制出能听懂任何人、任何讲话内容的机器。显然,目前的技术水平距离这一目标相去尚远,人机之间的语言交流还远不如人与人之间的对话那样自然、方便。然而应该看到,50年来,不懈的努力使语音识别技术有了迅猛的发展,时至今日,日益深入的研究已经将语音识别发展成为--f3广泛交叉的综合学科。它与声学、语言学、语音学、心理学、信号处理、人工智能、模式识别、信息论和计算机等诸多学科领域紧密相连。语音识别经过四十多年的发展,已经显示出巨大的应用前景。高性能的语音识别系统相继问世。1.2语音识别的意义语音识别技术的最终实现,可
7、以通过自然语言的方式进行人机交互,其深远的意义、广泛的应用前景和应用领域不得不令人神往:首先,基于识别技术的智能化语音输入法,将给办公自动化(OfficeAutomatic,简称0A)带来革命性的影响。如:听写机。其次,语音识别技术在服务行业(如电信、金融部门)的成功应用,将大大减少诸如号码确认等频繁而单调的工作,节省大量的人力,工作效率亦相应提高。如:声控电话交换系统、语音拨号系统、信息查询系统等。再次,语音识别在光线不足、危险环境以及其它难以手工操作的场合,则显得尤为重要。如工业控制。总而言之,种种应用,让语音识别因此而起
8、,因此向前。南京理工大学硕士论文1■静1.3语音识别简史语音识别的研究起始于50年代。60年代和70年代初最重要的发展是语音信号线性预测编码(LPC)技术和动态时间规正(DTW)技术的发展。它有效的解决了语音的特征提取和不等长匹配问题,对特定人的语音识别十分有效。研究特点以孤
此文档下载收益归作者所有