欢迎来到天天文库
浏览记录
ID:35057105
大小:5.71 MB
页数:81页
时间:2019-03-17
《基于hmm-ann模型的语音识别技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:10406分类号:TP391学号:130085208010南昌航空大学硕士学位论文(专业学位研究生)基于HMM-ANN模型的语音识别技术研究硕士研究生:胡宝花导师:宋高俊申请学位级别:硕士学科、专业:电子与通信工程所在单位:信息工程学院答辩日期:2016年6月授予学位单位:南昌航空大学ResearchofSpeechRecognitionTechnologiesbasedonHMM-ANNModelADissertationSubmittedfortheDegreeofMasterOnElectronicandCommunicationEngineeri
2、ngByBaohuaHuUndertheSupervisionofProf.GaojunSongSchoolofInformationEngineeringNanchangHangkongUniversity,Nanchang,ChinaJune,2016摘要在语音识别(ASR,AutomaticSpeechRecognition)领域中运用最广的隐马尔可夫模型(HMM,HiddenMarkovModel)和人工神经网络(ANN,ArtificialNeuralNetwork)这两种模型各自均有优缺点。HMM有极强的动态建模能力,在处理具有动态性能的语音信号时有着
3、很好的优势,却在分类功能上不足。ANN强大的输入输出映射能力使得它在处理模式分类与判决的问题上得天独厚,然而它对动态信号处理能力的不足也是不可忽视的。本文提出使用HMM-ANN混合模型来提高信号的处理能力,从而提高ASR系统的识别率。其中,ANN采用了概率神经网络学习算法。论文主要完成了以下工作:(1)总结ASR的研究现状和基本原理,比较HMM和ANN两种模型的优点和不足,提出HMM-ANN混合模型,并利用MATLAB软件分别仿真实现了HMM、ANN以及HMM-ANN这三种模型下的小词汇量、孤立汉语的语音识别功能。(2)比较了三种模型下语音识别的识别率,实验结果表
4、明,混合模型的识别率最高。(3)对语音识别的鲁棒性进行了研究。一方面,端点检测时提出了改进后的检测算法。在用传统的双门限检测算法前,先用小波阈值去噪原理提高语音信号的信噪比,再进行检测。实验结果证明,在噪声环境下,改进后的算法表现出更好的抗噪性,即语音识别的鲁棒性更好,识别率更高。另一方面,特征提取时提出了改进后的提取算法。与传统的Mel频率倒谱系数(MFCC)相比,本文提出的基于近似估计非零项法原理的谱减法的SS-MFCC参数更能代表纯净语音的特征,且对应的语音识别率更高,即鲁棒性更好。关键词:语音识别,HMM-ANN混合模型,端点检测,特征提取IAbstrac
5、tAlthoughHiddenMarkovModel(HMM)andArtificialNeuralNetwork(ANN)areregardedasthemostwidelyusedandthemostpopularalgorithmsintheareaofautomaticspeechrecognition(ASR),bothofthemhaveshortcomings.HMMhasstrongcapabilitiesindynamicmodelingandprocessingthedynamicspeechsignals,butitsperformanceo
6、fclassificationsshouldbeimproved.ANNhasextremelystrongabilitiesinclassificationandinput/outputmappingamongsignals,however,itsperformanceofprocessingdynamicsignalisstillunsatisfactory.Therefore,inordertofosterstrengthsandcircumventweaknesses,itisnecessarytocombinethetwomodelsintoahybri
7、dmodel.Inthispaper,ahybridspeechrecognitionmodelisproposedbasedonbothHMMandANN(HMM-ANN)models,andProbabilisticNeuralNetwork(PNN)isintroducedasthenetworklearningalgorithmsinthesectionofANN.Thishybridmodelshowsgoodabilitiesinprocessingsignalsandimprovementofspeechrecognitionrate.Inthisp
8、aper,
此文档下载收益归作者所有