基于NMF的语音增强算法研究

基于NMF的语音增强算法研究

ID:17361876

大小:2.36 MB

页数:60页

时间:2018-08-30

基于NMF的语音增强算法研究_第1页
基于NMF的语音增强算法研究_第2页
基于NMF的语音增强算法研究_第3页
基于NMF的语音增强算法研究_第4页
基于NMF的语音增强算法研究_第5页
资源描述:

《基于NMF的语音增强算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、级分类号密U单位代码10154DC辽宁工业大学硕士学位论文-基子NMF的语音增强算法研究:乂V:令X太,、'专业:通信与信息系统?,生:研究:蒋茂松?*v卜■?-:^指导教师卜王冬霞教授,、;^■--'-i、二?一八年三月*■..'>h广*辽宁工业大学硕士学位论文基于NMF的语音增强算法研究专业:通信与信息系统研究生:蒋茂松指导教师:王冬霞教授辽宁工业大学电子与信息工程学院二〇一八年三月MasterThesisS

2、tudyonSpeechEnhancementBasedonNMFAlgorithmSpeciality:CommunicationandInformationSystemsCandidate:JIANGMao-songSupervisor:ProfessorWANGDong-xiaLiaoningUniversityofTechnologyJinzhou,121001,ChinaMarch2018独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研宄:r作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,

3、论文中,不包含其他人己经发表或撰写过的研究成果,也不包含为获得辽宁工业大学或其他教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所作的任何贡献均己在论文中作了明确的说明并表示了谢意。研宄生签名:以吆年3?月S曰关于论文使用授权的说明本人完全了解辽宁工业大学有关保留、使用学位论文的规定,即:学校冇权保留送交的复印权,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)研宄生签名:导师签名:2收

4、年;5月日摘要辽宁工业大学硕士学位论文摘要语音增强作为语音数字信号处理的一个重要分支,旨在提高被各种各样噪声干扰的语音质量和可懂度,它主要应用于语音通信、语音识别和语音压缩编码等数字处理系统的前期预处理中。由于传统语音增强算法的局限性和对非平稳背景噪声的处理能力有限,因此近年来相继提出了一些新的算法,其中基于非负矩阵分解的语音增强算法最为突出,借助机器学习从大量的语音数据中解析出所需的数据是当前语音信号处理的研究一个热门方向。论文主要工作是对单通道系统和多通道系统下的语音增强算法进行了研究,提出有监督学习的非负矩阵分解语音增强算法

5、及其算法的改进。首先,对传统语音增强算法及其局限性进行了分析和研究,阐述了非负矩阵分解算法的基本原理及其特点,并对算法收敛性和初始化等问题进行了研究。其次,针对有监督学习算法中存在训练和测试数据特征间不匹配的问题,论文改进了非负矩阵分解算法,在其目标函数中加入确切的正则化约束项,如时间连续性或幅度谱的统计先验以及稀疏性等,促使不同字典的区分和判别力,从而提高收集语音数据的准确性。此外,传统语音增强算法系统都是基于短时傅里叶分析-修正-合成结构,而在大多数情况下认为幅度谱估计在听觉感知方面比相位谱更加的重要,因此忽略了相位谱失真的影响。

6、针对相位失真问题,论文提出了基于相位谱修正的非负矩阵分解语音增强的基补偿算法。从数理统计学的角度出发,对非负矩阵分解算法进行分析和研究的同时,并利用语音存在概率和相位谱修正方法提高增强语音质量。最后,针对传统多通道非负矩阵分解算法容易陷入局部最优和计算复杂度较高等问题,本论文提出了一种新的多通道非负矩阵分解模型。该模型主要是利用观测数据的空间协方差进行建模,结合矩阵迹的性质巧妙地推出目标函数,接着利用有监督学习算法原理对麦克风拾取的混合信号进行分析和研究,从而实现混合信号增强或分离效果。实验结果表明在非平稳背景噪声下,该算法不仅更好的

7、降低或抑制了背景噪声干扰,而且提高了收敛速度,使得该算法更具有实用价值。关键词:语音增强;非负矩阵分解;有监督学习;相位谱;多通道非负矩阵分解IAbstract辽宁工业大学硕士学位论文AbstractSpeechenhancementisanimportantbranchofspeechsignalprocessing,toimproveallkindsofnoisespeechqualityandintelligibility.Itisalsoanimportantpre-pretreatmenttechnologyofspeech

8、communication,speechrecognition,andspeechcompressioncodinganddigitalprocessingsystem.Withthelimitationofconven

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。