经验模态分解及深度信念网络在语音识别中的应用研究

经验模态分解及深度信念网络在语音识别中的应用研究

ID:9313822

大小:849.92 KB

页数:55页

时间:2018-04-27

经验模态分解及深度信念网络在语音识别中的应用研究_第1页
经验模态分解及深度信念网络在语音识别中的应用研究_第2页
经验模态分解及深度信念网络在语音识别中的应用研究_第3页
经验模态分解及深度信念网络在语音识别中的应用研究_第4页
经验模态分解及深度信念网络在语音识别中的应用研究_第5页
资源描述:

《经验模态分解及深度信念网络在语音识别中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着智能化应用和互联网技术的快速发展,语音识别作为一种便捷有效的人机交互方式,其重要性显得愈发突出。但由于语音发声环境的复杂多变和人类语言的巨大口音差异,语音识别的准确率面临较大的困难,难以使相应的语音产品达到用户预期的体验效果。若要使语音识别技术取得突破,必须在语音识别的基础理论上进行不断的完善和创新。由于语音信号是典型的非线性和非平稳信号,而传统的语音处理方法如傅立叶变换,小波变换等都是假设信号为短时平稳,故得到的诸多结论也势必破坏有用信息的分析和提取。本文以此为背景,在阐述了语音识别基础知识的前提下,着

2、重研究了不同信噪比环境下的语音端点检测算法和基于深度信念网络的孤立词语音识别系统。本文的主要研究内容和创新成果如下:(1)在深入探讨了传统语音处理方法的局限性基础上,本文着重研究了经验模态分解这一新型信号处理方法,并对其适用于非线性非平稳信号的特点进行了算法验证。(2)针对传统语音端点检测算法存在对含噪语音信号检测准确率不高的问题,本文提出了一种基于经验模态分解和复合能量的语音端点检测新算法。该算法首先利用经验模态分解将语音信号分解成一组固有模态函数和一个剩余量,并滤除含有较多噪声的低阶固有模态函数,将剩余的固有

3、模态函数重构成语音信号。然后利用Teager能量对噪声幅度的压缩作用,计算每帧重构语音信号的Teager能量,与短时能量加权,得到每帧信号的复合能量。最后将每帧信号的复合能量与自适应阈值进行比较,得到信号的起止点。通过仿真实验验证了算法的有效性,与传统的基于短时能量和短时过零率的双门限法相比,该算法体现了在低信噪比环境下的优越性。(3)针对传统神经网络在语音识别中存在训练速度慢,易陷入局部极小值的缺点,本文设计一种基于深度信念网络的孤立词语音识别系统。该系统首先对限制玻尔兹曼机模型(RBM)进行单独训练,并将第一

4、个训练好的RBM模型的输出作为第二个RBM模型的输入,继而单独训练,直至训练完最高层的RBM。然后将所有训练好的RBM堆叠成深度信念网络,并利用反向传播算法对其进行优化,得到训练好的深度信念网络识别模型。最后将提取好的语音Mel倒谱特征参数输入到深度信念网络中进行孤立词的语音识别。通过仿真实验,与改进的BP神经网络相比,该算法取得了更高的识别率。关键词:语音端点检测;经验模态分解;复合能量;语音识别;深度信念网络IEmpiricalmodedecompositionandthedeepbeliefnetworki

5、ntheapplicationofspeechrecognitionresearchABSTRACTWiththerapiddevelopmentofintelligentapplicationsandnetworkingtechnology,thespeechrecognitionasaconvenientandeffectivehuman-computerinteractionwhoseimportancebecomesincreasinglyprominent.However,duetothecomplic

6、atedenvironmentofthespeechproductionandhugedifferenceinhumanlanguageaccent,thespeechrecognitionaccuracyfacesgreaterdifficulties.Soitisdifficulttoachievetheexpectedexperienceresultsaboutthecorrespondingspeechproducts.Tomakethespeechrecognitiontechnologybreakth

7、rough,itmustmakeanimprovementandinnovationinspeechrecognitiononthebasisoftheory.Asthespeechsignalsaretypicallynonlinearandnon-stationary,thetraditionalspeechprocessingmethodssuchasFouriertransform,Wavelettransformareassumedthatthesignalissmoothshort.Therefore

8、,theconclusionsareboundtodisrupttheanalysisandextractionoftheusefulinformation.Asthebackground,thispaperdescribesthebasicsofspeechrecognitionasthepremise,thenitfocusesonthespeechendpointd

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。