基于HTK的连续蒙古语语音识别系统的研究

基于HTK的连续蒙古语语音识别系统的研究

ID:37375380

大小:2.65 MB

页数:58页

时间:2019-05-22

基于HTK的连续蒙古语语音识别系统的研究_第1页
基于HTK的连续蒙古语语音识别系统的研究_第2页
基于HTK的连续蒙古语语音识别系统的研究_第3页
基于HTK的连续蒙古语语音识别系统的研究_第4页
基于HTK的连续蒙古语语音识别系统的研究_第5页
资源描述:

《基于HTK的连续蒙古语语音识别系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于HTK的连续蒙古语语音识别系统的研究基于HTK的连续蒙古语语音识别系统的研究摘要语音是人类进行相互通信和交流的最便捷的手段。在当今数字化的信息时代,用数字化的技术进行语音的增强、传送、识别、合成、存储己成为语音信号处理技术的学科前沿。蒙古语是世界范围内有影响的语言,因此蒙古语语音技术是这前沿中重要的部分且用途很广,蒙古语语音识别的研究也日益受到重视。本文就是在这种情况下对蒙古语语音识别技术做了一些研究。本文基于语音产主的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述

2、语音识别的基本理论。HTK是剑桥大学语音组开发的一个极方便的、使用连续密度函数隐Markov模型来创建语音识别系统的软件工具包。因此,本文以HTK为框架,创建了国内第一个蒙古语语音识别系统。本系统运用了5个状态的混和高斯密度的隐Markov模型,分别用Baum-Welch重估算法和基于TokenPassing的N-Best算法作为模型的训练和识别算法。本系统分别采用音素、三音子和音节作为识别单元,训练出了三套不同的HMM模型,并在基于特定人、非特定人、环境噪音较大等情况下分别测试识别系统的性能。在每种条件下

3、,用相同的测试数据对三套模型进行识别测试,记录并比较三种识别单元选取方法所训练得到的模型的识别率。关挂词:语音识别,隐Markov模型,蒙古语,HTK,Mel倒谱系数内蒙古大学硕士论文THERESEARCHOFHTKBASEDCONTINUOUSMONGOLIANSPEECHRECOGNITIONSYSTEMABSTRACTincontemporarydigitaltimes,theresearchaboutdigitSpeechrecognitionismoreandmorenoticed,sinceso

4、measpects妙digitaltechnique,suchasspeechintensification,Speechtransmission,speechrecognition,speechsynthesisandspeechdeposit,arethefrontpartsofspeechsignalprocessing,ofwhichMongoliananimportantpart,andinmanyareasbecauseMongolianisatheauthorhasdonesomeresear

5、ches.Onthebasisofthemodelofspeechgeneration,thespeechsignalisanalyzesinthetimedomain,inthedomain,andespeciallyinthecepstrum.Andthen,withthetheoryofpatternrecognition,thefundamentaltheoryofspeechrecognitionisdiscussedinthethesis.HTKisaportablesoftwaretoolki

6、tforbuildingspeechrecognitionsystemsusingcontinuousdensityhiddenMarkovmodelsdevelopedbytheCambridgeUniversitySpeechGroup.Oneparticularlysuccessfultypeofsystemusesmixturedensityfive-stateHMMS.inthisthesis,wehaveusedthistechniqueforthe57syllables,30phonemesa

7、nd132triphonesMongoliaspeechrecognitiontask.Weusedtheapproachthatusingsyllables,phonemeandtriphonemodels.SystemsofHMMandBaum-WelchreestimationalgorithmsisbasedonN-BestalgorithmsisusedtoRecognize.Ourutilizedtopassingcurrentsystemscanrunforrealtimecontinuous

8、Mongoliaspeechrecognition,andcorrectrateisgoodinnonoise,MFCCKEYWORD:speechhiddenmodel,recognize,V内蒙古大学硕士论文其中较为典型的是美国Sensory公司的语音识别芯片RSC-X64系列;各种电子产品上也加入了语音识别的功能,如Philip和三星的手机即加入了特定人人名识别的功能。我国语音识别研究工作一直紧跟国际水平,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。