基于隐马尔可夫模型的语音识别技术研究 (1)

基于隐马尔可夫模型的语音识别技术研究 (1)

ID:32548103

大小:5.93 MB

页数:65页

时间:2019-02-11

基于隐马尔可夫模型的语音识别技术研究 (1)_第1页
基于隐马尔可夫模型的语音识别技术研究 (1)_第2页
基于隐马尔可夫模型的语音识别技术研究 (1)_第3页
基于隐马尔可夫模型的语音识别技术研究 (1)_第4页
基于隐马尔可夫模型的语音识别技术研究 (1)_第5页
资源描述:

《基于隐马尔可夫模型的语音识别技术研究 (1)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。学位论文作者:靳强乒日期:>13年-J月/J日学位论文使用授权声明本人在导师指导下完成的论文及相关的职务作品,知识产权归属郑州大学。根据郑州大学有关保留、使用学位论文的规定,同意学校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权郑州大学可以将本学位论文的全部或部分编入有关

2、数据库进行检索,可以采用影印、缩印或者其他复制手段保存论文和汇编本学位论文。本人离校后发表、使用学位论文或与该学位论文直接相关的学术论文或成果时,第一署名单位仍然为郑州大学。保密论文在解密后应遵守此规定。学位论文作者:斩l屯笏日期:聊年r月压日摘要摘要语音识别技术是机器学习的重要内容之一,涉及信息处理、人工智能和模式识别等多个学科内容,已经在社会生活中得到广泛的应用。语音识别是让机器听懂人的语言,理解人的意图,并对其做出相应的反应,实现人与机器的交互通信。本文基于隐马尔可夫模型(HiddenMarkovModel),建立了一套语音识别仿真系统。本文首先分析语音信号的预处

3、理过程,提出采用双门限法,即将短时能量和短时过零率相结合,对语音信号进行端点检测。相对于单一方法的端点检测方法能得到更精确的语音段,为语音信号的后续处理奠定了基础。接着详细阐述了两种特征参数提取方法,包括线性预测倒谱系数(LPCC)和Mel倒谱系数(MFCC),并分析了MFCC的一阶差分系数,得出结合一阶差分后的倒谱参数,可将语音识别率提高4%左右。最后,本文着重研究了基于HMM的语音识别算法,在Mmlab平台上实现了一个较为完整的语音识别仿真过程,包含语音库的建立、预处理、特征参数提取、训练(即参数选择)、识别等过程。本论文建立了一个由10个人的录音组成的语音数据库,

4、由汉语数字0~9、“郑”、“州”、“大”、“学”共14个样本组成,总共700个发音,为论文提供仿真实验数据。对HMM在实际中的应用做了优化处理,包括初始模型选取、Viterbi算法的对数处理以及参数重估问题。通过分析实验结果,得出CHMM状态数为4,训练次数为20次,特征参数选取48维LPCC和MFCC的混合参数,可使语音识别系统对于汉语孤立词的识别率达到90%。在试验过程中本文还分析了由于汉语发音的复杂性和特殊性而引起的有些样本元素的误识问题,并提出了待解决方案。关键词:隐马尔可夫模型;端点检测;语音特征参数提取;语音识别AbstractSpeechrecogniti

5、ontechnologyisanimportantpartofmachinelearning,whichinvolvesmultipledisciplinescontentoftheinformationprocessing,artificialintelligenceandpattemrecognitionandSOon.Ithasbeenwidelyusedinthesociallife.Speechrecognitionallowsmachinestounderstandhumanlanguageandtheintentofthepersonandreactacc

6、ordingly,ultimatelyrealizestheinteractivecommunicationbetweenmanandmachine.ThispapersetsupaspeechrecognitionsimulationsystembasedonHiddenMarkovModels.Thispaperfirstanalyzestheprocessofspeechsignalpretreatment,proposesdual-thresholdmethod,whichisthecombinationofshort-timeenergyandshort-ti

7、mezero—crossingrate,tomakespeechsignalendpointdetection.Comparedtothesinglemethodendpointdetection,itCangetmoreaccuratespeechsegments,andestablishesthefoundationforthesubsequentprocessingofthespeechsignal.Thentwofeatureextractionmethodarediscussedindetailsinthisdissertati

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。