信号子空间语音增强和它的应用对噪声语音识别研究文章

信号子空间语音增强和它的应用对噪声语音识别研究文章

ID:12631183

大小:5.28 MB

页数:33页

时间:2018-07-18

信号子空间语音增强和它的应用对噪声语音识别研究文章_第1页
信号子空间语音增强和它的应用对噪声语音识别研究文章_第2页
信号子空间语音增强和它的应用对噪声语音识别研究文章_第3页
信号子空间语音增强和它的应用对噪声语音识别研究文章_第4页
信号子空间语音增强和它的应用对噪声语音识别研究文章_第5页
资源描述:

《信号子空间语音增强和它的应用对噪声语音识别研究文章》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、研究文章回顾信号子空间语音增强和它的应用对噪声语音识别克里斯赫墨思,帕特里克,和雨果·范·哈默电机工程学系,天主教鲁汶大学,比利时鲁汶赫维2005年10月收到24份修订于2006年3月2006年4月30日由三颗针科斯塔斯卡推荐本文的目的有三个方面:(1)提供了广泛的审查,(2)派生的信号子空间语音增强这些技术的性能的上限,(3)提出了全面的研究子空间的潜力过滤,以增加对固定加性噪声失真自动语音识别器的特性。子空间滤波方法是基于嘈杂的讲话观测空间的正交分解成信号子空间和噪声子空间。这种分解可以用于语音模型的低秩的假设下,对是否有可用的估计的噪声相关矩阵。我们提出了一个广泛的概述可用的

2、估计,并从中获得了理论估计实验评估的上限的性能,可以实现由任何基于子空间的方法。与噪声数据的自动语音识别(ASR)的实验表明,基于子空间的语音增强显着提高这些系统的特性添加剂有色噪声环境。获得最佳性能如果没有明确的嘈杂的Hankel矩阵降秩进行。虽然此策略可能增加的电平残留噪声,它减少了识别器的后端取出必要的信号信息的风险。最后,它也示出子空间滤波相比,毫不逊色知名谱减法技术。版权所有©2007KrisHermus等。这是一个开放的文章,分布在CreativeCommonsAttribution许可下,允许无限制地使用,分配,任何媒体,提供了原来的工作是正确的引用。1.简介一类特殊

3、的语音增强技术,已经获得了很多关注的是信号子空间过滤。在这种方法,非参数的线性估计联合国干净的已知语音信号获得基于在减压位置观察到的噪声信号相互orthog的onal信号和噪声子空间。这种分解是pos-低等级的线性模型的假设下可与浇口语音和一个不相关的添加剂(白)噪声干扰高效。在这些条件下,能量的相关性不噪声遍及整个观察空间,而连接相关的语音分量的能量集中在其子空间。此外,在信号子空间可以回收一贯从喧闹的数据。一般来说,噪声减少归零噪声子空间,并通过重新获得在信号子空间移动的噪声贡献。执行基于子空间的信号估计的想法最初提出由塔夫茨等。[1]。在工作中,实际上是基于修改后的奇异值分解

4、的信号估计数据矩阵。后来,Cadzow[2]提出了一个大体上框架恢复从嘈杂的观测信号。它假定原始信号具有某种明确定义的属性或遵循一定的模式。信号增强然后通过以下方式获得所观察到的信号映射到空间干净的信号具有相同的结构的信号。这一理论形成的基础,所有的子空间为基础的噪声重新生产的算法。第一和不可缺少的一步降噪获得归零噪声子空间(最小二乘(LS)估计)[3]。然而,改进降噪,的噪声贡献(信号+噪声)的子空间应该被抑制或控制,这是通过其他估计在后续章节解释。特别令人感兴趣的是最小方差(MV)上课了,它给出了最佳线性估计的干净数据,官拜p的干净信号和方差白噪声[4,5]。后来,子空间的语音

5、连接[6]中,提出了与噪声整形hancement。基于观察的信号失真和剩余噪声能不能最小化的同时,两个新的线性估计设计时域限制(贸发局)和频谱域约束(SDC)保持水平的渣油UAL噪声低于选定的阈值,同时最大限度地减少信号失真。参数的算法控制的权衡残余噪声和信号失真。在子空间基于语音增强真正的感性噪声十八根据估计,残余噪声的形状干净信号的掩蔽阈值,所讨论的更多的重要文献[7-9]。虽然基本的基于子空间的语音增强白噪声失真处理开发的,它可以方便ILY延伸到去除一般有色噪声噪声协方差矩阵是已知的(或可估计交配)[10,11]。了详细的理论分析的未其潜在的子空间滤波原理,例如,可以是发现[

6、4,6,12]。出色的降噪能力,子空间滤波器散射技术的一些研究证实,都与基本LS估计[3],并与更高级的优化后SATION标准[6,10,13]。特别是MV和SDCES的timators,改善语音质量优于谱减法的方法揭示了听力测试。 噪声抑制促进了解,社区nication,对语音信号的处理。因此,它也起着重要的作用,在自动语音识别(ASR),以提高在嘈杂环境下的鲁棒性。后者是通过加强观察嘈杂的讲话信号识别器的预处理前的信号和解码运算erations。在ASR应用的有效性的任何讲话其潜在的量化增强算法关闭嘈杂和干净的语音识别准确之间的差距活泼在语音通信发生了什么对面AP-褶皱的语音可

7、懂度的改善和聆听者的疲劳的减少是不关心的。然而,可以预期的相关性之间的改善目一方面在感知的语音质量,并且改善另一方面的识别准确率。空间的方法,以强大的语音识别。在[14]中的能源受限的信号子空间法(ECSS)是亲构成的MV估计的基础上。为承认大词汇量连续语音(LV-CS)损坏加性白噪声,WER相对减少70%报道。在[15]中,涂敷在MV子空间滤波识别LV-CS(LV-CSR)白色和扭曲的任务有色噪声。跑赢显著降低WER谱减法的报告。报告大纲在本文中,我们阐述前文[16

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。