欢迎来到天天文库
浏览记录
ID:28790645
大小:1.11 MB
页数:71页
时间:2018-12-14
《连续语音识别中半连续hmm的研究及实现硕士学位》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、密级:内部连续语音识别中半连续HMM的研究及实现ResearchandImplementofSCHMMinCSR(申请清华大学工学硕士学位论文)独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得清华大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:日期:关于论文使用授权的说明本人完全了解清华大学有关
2、保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。签名:导师签名:日期:摘要SCHMM作为一种有效的语音识别技术,它充分地吸收了离散HMM和连续HMM的优点,具有识别精度高搜索速度快等特点。特别是它的码本绑定策略,由于从全局的角度来共享和调整码本,所生成的码本性能更好,能够有效地反映语音空间的特征,因此只要少量的码本就能使系统达到较好的性能,大大减轻了码本计算的复杂性,提高了系统识别的速度。研究内容包括如下几
3、个方面:1.在初始码本生成中引入了随机松弛算法,SCHMM的初始码本生成是一个矢量量化的问题,量化的困难是量化结果通常会陷入局部最优,采用随机松弛算法能够比较好地克服这个缺点。2.在连续语音训练中,通过减去句子单元信息,克服了Baum-Welch算法训练不同类型句子时发生数据奇异的缺陷。3.改进了SCHMM的搜索算法,通过对码本进行剪枝,Beam剪枝等措施,在保证一定识别率的前提下,大大减少了搜索在时间和空间上的消耗,加快了搜索的速度。4.实现了一个基于SCHMM的连续语音训练和识别系统。关键词:语音识别,半连续H
4、MM,码本,随机松弛,搜索AbstractAsanefficienttechnologyofspeechrecognition,SemiContinuousHMM(SCHMM)integratestheadvantagesofdiscreteHMMandcontinuousHMM,andprovidesahighrecognitionaccuracyandsatisfactoryspeed.Inparticular,sincethesharingandmodificationofcodebooksinglobals
5、cope,thecode-bindingstrategymakesitpossibletogeneratemuchbettercodebooksthatcoulddescribethefeatureofacousticspacemoreaccurately.Insuchacase,smallcodebookscanprovidesatisfactoryperformancesothatthecomputationalcomplexityisreducedandtherecognitionspeedisincreas
6、ed.Thekeyresearchcontainsthefollows1.Thealgorithmofstochasticrelaxationisintroducedintocodebookinitialization.CodebookinitializationofSCHMMisaproblemofvectorquantification,whosetroubleisthatthequantificationresultoftenreachesthelocalminimalpoint.Theintroductio
7、nofstochasticrelaxationovercomesthisprobleminourexperiments.2.Incontinuousspeechtraining,thedisadvantagethatBaum-Welchalgorithmcouldbethrownintodataodditybecauseofdifferentsentencesgivesvariousweightstotheestimationisresolvedbysubtractingsentenceinformation.3.
8、Throughcodebookselection,beampruning,thesearchalgorithmofSCHMMismodifiedsothatthecostofsearchisreducedintermsofbothtimeandspace,incaseofnoaccuracylostevidently.4.Acontinuousspeechr
此文档下载收益归作者所有