欢迎来到天天文库
浏览记录
ID:35178780
大小:6.20 MB
页数:90页
时间:2019-03-20
《基于深度神经网络的语音增强算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中文图书分类号:TN912.3密级:公开UDC:38学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:基于深度神经网络的语音增强算法研究论文作者:时勇强学科:信息与通信工程指导教师:李如玮论文提交日期:2016年5月UDC:38学校代码:10005中文图书分类号:TN912.3学号:S201302080密级:公开北京工业大学工学硕士学位论文题目:基于深度神经网络的语音增强算法研究英文题目:STUDYONSPEECHENHANCEMENTALGORITHMBASEDDEEPNEURALNETWORK论文作者:时勇强学科专业:信息与通信工程研究方向:语
2、音与音频信号处理申请学位:工学硕士指导教师:李如玮副教授所在单位:电子信息与控制工程学院答辩日期:2016年6月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:时勇强日期:2016.6.2关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留
3、送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:时勇强日期:2016年6月2日导师签名:李如玮日期:2016年6月2日本论文的研究工作得到了2015年北京市教委科技计划面上项目(No.KM201510005007)、国家自然科技基金(No.61471014)的资助。摘要摘要种类繁多的噪声存在于现实生活中的每一个角落,严重污染了人类赖以交流的语音信号。虽然现有的语音增强方法很多,但在低信噪比复杂噪声环境下,往往达不到实际应用的需求。针对低信噪比复杂噪声环境下语音增强算法的局限
4、性,本文重点围绕基于BP神经网络和多特征的语音端点检测算法、基于深度神经网络(DeepNeuralNetwork,DNN)的噪声分类方法以及基于DNN和噪声分类的改进最小均方误差自适应滤波(ImprovedLeastMeanSquareAdaptiveFiltering,ILMSAF)语音增强算法等三方面展开研究工作。本文的研究工作主要由以下三部分组成:(1)为了提高语音端点检测算法在低信噪比复杂噪声环境下的性能,本文提出了一种基于BP神经网络和多特征的语音端点检测算法。首先,结合语音信号的时频域特征,对含噪语音提取短时自相关函数最大值和频带方差。其次,将这两种特征组成一个二维矢
5、量输入到BP神经网络并进行训练和建模,然后利用遗传算法优化BP神经网络的参数。最后选取一个自适应阈值,利用训练好的BP神经网络判断当前帧信号的类别。实验结果表明,相较于单一特征和线性模型,本文所提算法在低信噪比复杂噪声环境下,具有更好的适应性和鲁棒性,并进一步提高了噪声环境下语音端点检测的正确率。(2)针对不同类型的噪声对语音信号的影响不同,为了使语音增强算法适用于不同的噪声环境,本文提出了一种基于DNN的噪声分类算法。该方法首先对(1)中的非语音段信号提取梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)和一阶梅尔频率倒谱系数(firs
6、t-orderMFCC,∆MFCC)。其次,将MFCC和∆MFCC组成一个24维矢量输入到DNN中进行训练和建模。最后利用训练好的DNN判断出当前帧信号的噪声类型。实验结果表明,相较于基于高斯混合模型(GaussianMixtureModel,GMM)的噪声分类方法,本文所提算法的分类准确率被提高了。(3)针对现有的语音增强算法在低信噪比环境下性能不理想、在多种类型噪声环境下适应性差以及难以处理非平稳噪声信号的缺点,本文提出了一种ILMSAF语音增强模型。该模型通过在传统的最小均方误差自适应滤波(LeastMeanSquareAdaptiveFiltering,LMSAF)语音增
7、强中引入自适应系数来调整滤波器参数,使得滤波器能更有效地消除当前噪声环境中的噪声。在此基础上,本文I北京工业大学工学硕士学位论文提出了一种基于DNN和噪声分类的ILMSAF语音增强算法。所提方法首先利用深度置信网络(DeepBeliefNetwork,DBN)估计出滤波器参数的自适应系数。然后利用ILMSAF对含噪语音进行增强,得到增强后的语音。另外,根据(2)中的噪声分类结果,训练出相应的ILMSAF模型,使得语音增强算法适用于不同的噪声环境。ITU-TG.160标准下的性能测
此文档下载收益归作者所有