基于计算听觉场景分析和深度神经网络的混响语音分离

基于计算听觉场景分析和深度神经网络的混响语音分离

ID:35070317

大小:3.87 MB

页数:70页

时间:2019-03-17

基于计算听觉场景分析和深度神经网络的混响语音分离_第1页
基于计算听觉场景分析和深度神经网络的混响语音分离_第2页
基于计算听觉场景分析和深度神经网络的混响语音分离_第3页
基于计算听觉场景分析和深度神经网络的混响语音分离_第4页
基于计算听觉场景分析和深度神经网络的混响语音分离_第5页
资源描述:

《基于计算听觉场景分析和深度神经网络的混响语音分离》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、贫类号密级—振太原理工大学I議硕±学位论文.........八.\题目某于计鞋听觉场景分祈新漲階神择网络的混响语亩分齋.',.、'ft..、,户Se化ationofreverberantseechbasedonComputationalggpAuditorySceneAnalysisandDeeNeuralNetwork英文并列题目p,.若_^^___^te研究生姓名:據2011510291学号:信息与通信工程

2、.专业:.巧究方向:语音信号些g鸣餐‘項乎逆遊i导师姓名:聖兴V:.副教敕婦职棘__^^S'謂■T学位捏予单化.;太原理大学-论文提交.曰期一^^地址■"於:一.曹.羣.苗太^理王户卿.昨#'霉編.'担:.;>—鍵兰:d教声明本人郑重声明,:所呈交的学位论文,是本人在指导教师的指导下独立进行研究所取得的成果。隘义中已经注明引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果。对本文的研究。做出重要贡

3、献的个人和集体,均已在文中W明确方式标明本声明的法律责任由本人承担。论文作者签名:日期:6关于学位论文使用权的说明本人完全了解太原理工大学有关保管、使用学位论文的规定,其中包括:①学校有权保管、并向有关部口送交学位论文的原件与复印件;感逗)学校可采用影印、缩印或其它复制手段复制并保存学位论文;学校可允许学位论文被查阅或借阅;@学校可学术否流为目的,复制赠送巧交换学位论文;感学校可a公布学位论文的全部或部分内容(保密学位论文在解密后遵守此规定)。签名:心日期:

4、-£嘗y导.师签名:—日期:知/(’1/^太原理工大学硕士研究生学位论文基于计算听觉场景分析和深度神经网络的混响语音分离摘要在自然听觉环境中,语音信号被噪声源和混响所污染,人类拥有强大的听觉感知能力,在各种不利的条件下,也能够分辨出自己感兴趣的声音。利用计算机模拟这一感知能力是语音信号处理领域的热点课题。解决真实环境中语音分离的问题对很多应用必不可少,比如自动语音识别,音频信息检索和听觉恢复技术。封闭空间中,声音信号在各墙面或障碍物发生反射和衍射形成混响。到达麦克风的信号不仅有直达

5、声还有前期反射和后期反射。混响相当于直达声和房间脉冲响应的卷积,在时域和频域扭曲了语音的声谱。启发于人类听觉场景分析,基于感知原则的计算听觉场景分析可用来处理语音分离问题。本文对混响环境下的语音分离问题进行研究,针对混响环境下语音信号谐波结构被破坏,传统的语音分离算法不稳定的问题,提出了两种混响语音分离的系统模型。本文的创新点主要有:1.计算听觉场景分析模拟人类听觉感知能力,根据理想二值模原理,可以提取出目标语音信号。混响条件下,基音的检测准确率降低,导致系统的性能变差。针对这一问题,本文提出基于隐马

6、尔可夫模型的多基音检测算法,并在时频单元标记环节采用似然比检验选择正确的训练模型,提高单元标记的准确性。I太原理工大学硕士研究生学位论文2.深度神经网络在语音识别和人工智能上展现出强大的学习能力,本文提出通过训练DNN模型学习“污染”语音和纯净语音之间的频谱映射进行反混响和去噪。通过提取一连串的频谱特征,融合相邻帧时间动态信息,利用DNN进行编码频谱转换,恢复纯净语音量级频谱图,最后重构时域信号。此外,本文还提出使用DNN的特征分类能力完成双声道混响语音分离。双声道特征ITD和ILD与单声道特征GFC

7、C融合组成长特征向量,通过RBM对DNN预训练,以完成分类任务。实验结果表明,本文提出的模型提高了分离语音的质量和可懂度,增强了系统的稳定性。关键词:混响,计算听觉场景分析,语音分离,隐马尔可夫模型,深度神经网络II太原理工大学硕士研究生学位论文SEGREGATIONOFREVERBERANTSPEECHBASEDONCOMPUTATIONALAUDITORYSCENEANALYSISANDDEEPNEURALNETWORKABSTRACTInanaturalauditoryenvironment,s

8、peechsignalsaredegradedbybothconcurrentnoisesourcesandreverberation.Whilehumanlistenersareverygoodatfocusingtheirattentiononthespeechofaparticularsignaleveninsuchadversecircumstance,simulatingthisperceptualabilityisahottopicinthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。